0%

关系抽取论文 End-to-End Relation Extraction using LSTMs on Sequences and Tree Structures

发表于 2022-10-18 更新于 2023-12-15 分类于关系抽取论文

论文

End-to-End Relation Extraction using LSTMs on Sequences and Tree

发布年份：2016

会议：ACL

作者：Mokoto Miwa, Mohit Bansal

机构：Toyota Technological Institute

贡献：

这是深度学习联合（Joint）模型的开篇之作。

在训练种加入两个功能，这些功能缓解了训练早期阶段实体检测性能低的问题，并允许实体信息进一步帮助下游关系分类任务。

实体预训练 entity pretraining：预训练实体检测模型。

预定抽样 scheduled sampling：在一定概率的情况下用 gold labels 来代替预测的实体标签。

数据集：ACE05 和 ACE04 用于关系提取；SemEval-2010 Task 8 用于关系分类。用 ACE05 和 ACE04 去训练整个模型，用 SemEval-2010 Task 8 去评估关系分类模块。

传统的关系抽取将该任务看作是有两个子任务的 pipeline，两个子任务依次是命名实体识别（NER）和关系分类。

pipeline 型的关系抽取的两个子模块非常灵活，并且是可以替换的。
但是其缺点在于忽略了 NER 与关系分类之间的依赖关系，研究表明 NER 的效果极大程度上的影响了关系分类的效果。除此之外，还会受到错误传播的影响。

端到端的模型（End-to-End，Joint）不同于 pipeline 任务，将两个子任务合并，同时输出实体和其关系。

joint 的优点在于它通常比 pipeline 的表现更好，因为实体和关系之间存在依赖关系。

模型结构

模型主要分为以下几个部分：

Sequence Layer：作为 Entity Detection 的低层结构，与 Entity Detection 共享 BiLSTM 的参数。
Entity Detection：实体检测，产生 entity embedding。
Dependency Layer：树型 BiLSTM 结构，用于产生 Relation Classification 的输入。
Relation Classification：关系分类。

阅读全文 »

关系抽取论文 Attention-Based Bidirectional Long Short-Term Memory Networks for Relation Classification

发表于 2022-10-18 更新于 2023-12-15 分类于关系抽取论文

论文

Attention-Based Bidirectional Long Short-Term Memory Networks for Relation Classification

发布年份：2016

会议：ACL

作者：Peng Zhou, Wei Shi, Jun Tian, Zhenyu Qi, Bingchen Li, Hongwei Hao, Bo Xu

机构：Institute of Automation, Chinese Academy of Sciences

motivation：

CNN 结构不适用于捕捉到长距离的特征。

其他的关系分类方法依赖于 NLP 工具（NER 等）或者 WordNet。

数据集：SemEval 2010 task 8 dataset，8000 个训练用例和 2717 个测试用例，随机挑选了 800 个句子作为验证集。

模型结构

模型的结构如下所示，包括几个部分：

Embedding Layer：将 token 转为 embedding。
LSTM Layer：使用 BiLSTM 用于提取到 high level features。
Attention Layer：产生一个权重向量，这个权重乘以 BiLSTM 的输出（这就是 sentence-level feature）得到 Output Layer 的输入。
Output Layer：进行关系分类。

阅读全文 »

关系抽取论文 Classifying Relations by Ranking with Convolutional Neural Networks

发表于 2022-10-17 更新于 2023-12-15 分类于关系抽取论文

论文

Classifying Relations by Ranking with Convolutional Neural Networks

发布年份：2014

会议：ACL

作者：Cicero Nogueira dos Santos, Bing Xiang, Bowen Zhou

机构：IBM

贡献：提出了一种新的 CNN 结构，Classification by Ranking CNN（CR-CNN）用于解决关系分类问题。经实验表明，CR-CNN比CNN加上简单的softmax分类的效果要好。

数据集：SemEva 2010 task 8 dataset，这个数据集包括 10717 个examples，有 9 个不同的类别和 1 个人工关系 Other。8000 个训练用例和 2717 个测试用例。

创新点：

提出了新的 loss function，pairwise ranking loss function。

忽略了 SemEval 2010 task 8 中的 Other 类。

模型结构

模型结构示意图如下，模型的输入是一个句子（带有两个目标词），CR-CNN为每一个关系类型计算出一个分数。

阅读全文 »

关系抽取论文 Relation Classification via Convolution Deep Neural Network

发表于 2022-10-13 更新于 2023-12-15 分类于关系抽取论文

论文

Relation Classification via Convolutional Deep Neural Network

发布年份：2014

会议：COLING

作者：Daojian Zeng，Kang Liu，Siwei Lai，Guangyou Zhou and Jun Zhao

机构：National Laboratory of Pattern Recognition，Institute of Automation

贡献：第一次在 relation classification 领域运用 convolutional DNN

数据集： SemEval-2010 Task 8 dataset, http://docs.google.com/View?id=dfvxd49s。该数据集包含 10717 条被标注的数据（包括 8000 条训练用例和 2717 条测试用例。

模型结构

整个模型得架构如下：

Input：带有两个被标记单词的一句话。
Word Representation：将每个单词转为词嵌入。
Feature Extraction：分别提取单词级别的特征和句子级别的特征，然后将两个特征向量连接起来。
Output：简单的线性层+softmax 分类。

阅读全文 »

GO语言杂谈 (13) DTM

发表于 2022-10-12 更新于 2023-12-15 分类于 Go语言杂谈

分布式事务

分布式事务，分为两类：

内部分布式事务：分布式数据库（Spanner、TiDB）跨节点的内部事务。
异构分布式事务：跨服务、跨数据库的事务。

DTM 用于解决异构分布式事务的一致性问题。在下文中，分布式事务特指异构分布式事务。以下是异构分布式事务（跨数据库、跨服务、混合）的示意图。

事务的一致性：

本地事务使用 MVCC 技术，支持高并发（隔离级别为 Repeatable Read）下的一致性。

内部分布式事务也可以通过 MVCC 技术，保证严格的一致性。

异构分布式事务，因为没有统一的版本号，无法做 MVCC。目前没用支持跨数据库的严格一致性方案。

阅读全文 »

事件抽取模型复现之DMCNN (3) DMCNN模型

发表于 2022-10-05 更新于 2023-12-15 分类于事件抽取模型复现

DMCNN 简介

DMCNN 由以下组成：

Embedding Learning：采用 Skip-gram 预训练模型。
Lexical Feature Representation：触发词和论元的上下文 token，并将这些拼接起来形成词汇级特征表示向量L。
DMCNN 结构：
- 输入包括三个部分 CWF（Context-Word Feature）、PF（Position Feature）、EF（Event-type feature，在本模型复现中没用用到）。
- 多个 filter 进行卷积，每一个 filter 生成一个feature map，把每一个 feature map 分为三个部分，对这三个部分分别进行 max-pool 操作就是动态池化操作，得到向量 P。
分类输出：将P和L连接起来，送入一个分类器中。

阅读全文 »

事件抽取模型复现之DMCNN (2) 制作模型所需要的各项输入/输出矩阵

发表于 2022-10-05 更新于 2023-12-15 分类于事件抽取模型复现

import json
import numpy as np
import joblib

with open('./preprocess/dataset.json', 'r') as f:
    dataset = json.load(f)

len(dataset)
# 1665

MAX_SEQUENCE_LENGTH = 85	# 句子最大长度
EVENT_TYPE = 7		# 事件类型数量

Word2Vec

生成 embedding_index

这里用的预训练Word2Vec语料为 sgns.weibo.bigram-char，建立一个字典 embedding_index，用来记录 word 与 vec 的映射。

from keras.preprocessing.text import Tokenizer
from keras.preprocessing.sequence import pad_sequences

embeddings_index = {}
with open('path-to/sgns.weibo.bigram-char', encoding='utf-8') as f:
    lines = f.readlines()
    lines = [l.strip() for l in lines]
    print(lines[0])	# 195197 300，共有195197个词，embedding-dim为300
    
    for line in lines[1:]:
        word, coefs = line.split(maxsplit=1)
        coefs = np.fromstring(coefs, 'f', sep=' ')	# 转为vec
        embeddings_index[word] = coefs
       
print('Found %s word vectors.' % len(embeddings_index))
# Found 195197 word vectors.

阅读全文 »

事件抽取模型复现之DMCNN (1) 数据预处理

发表于 2022-10-05 更新于 2023-12-15 分类于事件抽取模型复现

代码来源：https://github.com/RMSnow/KG-Course，代码目录结构如下：

- EventExtraction/
	- data/
		- preprocess/（数据预处理）
			- CEC/（原数据文件）
			- dataset.json(实验数据集)
			- preprocess.ipynb(预处理、数据分析的代码)
		- data_load.ipynb(制作模型所需要的各项输入、输出矩阵)
		- *.npy(模型的输入与输出)
	- model/
		- img/(由keras自动生成的模型架构图)
		- model/（训练好的模型参数文件）
		- predict/（模型预测输出的矩阵）
		- dataset_split.py（训练集/测试集划分）
		- DMCNN.py（DMCNN模型与CNN模型）
		- TextCNN.py（TextCNN模型）
		- train.py（训练、预测所需的各项函数）
		- *.ipynb（训练过程、模型预测、性能结果等）
	- readme.md

数据格式为 XML 格式，如下。其中 Event 记录了每一个标签，在 Event 标签下 Denoter 标签为触发词

<?xml version="1.0" encoding="UTF-8"?>

<Body> 
	<Title>澳大利亚2014年火灾:高温致一夜间发生几百起火灾</Title>  
	<ReportTime type="absTime">2014年1月15日</ReportTime>  
	<Content> 
		<Paragraph> 
			<Sentence> 
				<Event eid="e1" type="thoughtevent"> 
					<Time tid="t1" type="relTime">1月15日，</Time> 据外媒 
					<Participant sid="s1">《俄罗斯报》</Participant> 报道 
					<Denoter type="statement" did="d1">称</Denoter>，
				</Event>  
				<Event eid="e2">位于 
					<Location lid="l2">北半球</Location>的 
					<Participant sid="s2">澳大利亚</Participant> 现在正 
					<Denoter did="d2" type="movement">处于</Denoter>  
					<Object oid="o2">炎热的夏季</Object>，
				</Event>  
				<Event eid="e3">而近日也到了高温酷暑的时候，当地时间 
					<Time tid="t3" type="relTime">1月14日晚</Time>， 
					<Location lid="l3">澳大利亚南部</Location> 一夜间发生至少250起 
					<Denoter type="emergency" did="d3">火灾</Denoter>。
				</Event> 
			</Sentence>  
			<Sentence>受炎热天气及雷雨天气影响， 
				<Event eid="e4"> 
					<Location lid="l4">澳大利亚南部</Location>一夜间发生至少250起 
					<Denoter did="d4" type="emergency">火灾</Denoter>，灾情多集中在维多利亚州。
				</Event> 
			</Sentence>  
			<Sentence> 
				<Event eid="e5">火灾发生后， 
					<Participant sid="s5">救援人员</Participant> 立即 
					<Denoter did="d5" type="operation">展开</Denoter>  
					<Object oid="o5">救灾行动</Object>。
				</Event> 
			</Sentence>  
			<Sentence>目前，大部分起火点火势已被控制。</Sentence> 
		</Paragraph> 
	</Content>  
	<eRelation relType="Thoughtcontent" thoughtevent_eid="e1" thoughtcontent_eids="e2-e5"/>  
	<eRelation relType="Follow" bevent_eid="e4" aevent_eid="e5"/> 
</Body>

阅读全文 »

go-micro基础 (2) go-micro基本介绍

发表于 2022-09-19 更新于 2023-12-15 分类于 go-micro基础

Micro

Micro 是用来构建和管理分布式程序的系统，组成如下：

Runtime（运行时）：用来管理配置、认证、网络等。
Framework（程序开发框架）：用来编写微服务。
Clients（多语言客户端）支持多语音访问服务端。

Runtime

Runtime（运行时）是工具集，组成：

api：api 网关，把微服务组合起来，形成单一的入口方便调用。
broker：允许处理异步消息的代理。
network：通过微网络服务构建多云网络。
new：服务模板生成器。
proxy：建立在 Go Micro 上的透明服务代理。
registry：一个服务资源管理器，通过注册的方式提供服务发现以及查找服务。
store：简单的状态存储。
web：Web 仪表盘，通过 Web 仪表盘的方式浏览服务。

Framework（go-micro）

go-micro 是 Micro 的一种 Framework，是对分布式系统的高度抽象、提供分布式系统开发的核心库、可插拔的架构，按需使用。组件如下：

注册（Registry）：提供了服务发现机制。
选择器（Selector）：能够实现负载均衡。
传输（Transport）：服务和服务之间的通信。
Broker：提供异步消息的消息发布/订阅接口。
编码（Codec）：消息传输的编码与解码。
Server、Client：服务的提供者和使用者。

go-micro 的通信如下：

Server 通过 Registry 将服务注册到服务注册中心，Client 通过 Selector 从服务注册中心进行服务发现。
Client 通过 Broker 发布消息到消息中间件中，Server 通过 Broker 从消息中间件中读取订阅消息。

阅读全文 »

go-micro基础 (1) gRPC和ProtoBuf

发表于 2022-09-18 更新于 2023-12-15 分类于 go-micro基础

gRPC

介绍

gRPC 是一个高性能、开源、通用的RPC框架。
基于 HTTP 2.0 开发，支持双向流、消息头压缩、单 TCP 的多路复用等特性。
支持多语言，默认采用 Protocol Buffers 数据序列化协议。
gRPC 开发的核心在于编写 *.proto 文件，它定义了 gRPC 的服务和消息，根据这个文件可以生成多语言的标准代码（所以只需要传送 *.proto 文件，就可以生成多语言支持的代码）。

调用流程

gRPC的整体流程如下：

客户端通过 Protocol Buffers 协议序列化发送请求到服务端。
服务器收到请求后将请求内容反序列化，本地调用函数并返回结果。
服务端将结果通过 Protocol Buffers 协议序列化后，回送响应。
客户端反序列化请求内容，得到远程调用结果。

阅读全文 »