Dawn's Blogs

分享技术 记录成长

0%

关系抽取论文 SEPC: Improving Joint Extraction of Entities and Relations by Strengthening Entity Pairs Connection

SEPC: Improving Joint Extraction of Entities and Relations by Strengthening Entity Pairs Connection

来源:KDD 2021

作者:Jiapeng Zhao, Panpan Zhang, Tingwen Liu

机构:Institute of Information Engineering Chinese Academy of Sciences, Beijing

motivation:而现有的方法通常只通过共享 encoder 来建模实体对,这不足以利用实体对的内在联系,而且无法纠正 subject 识别错误的情况。为了解决这一问题,论文提出利用实体对的对偶性来加强实体对连接(strengthen entity pairs connection,SEPC),将关系抽取任务转化为不仅从 subject 到 object 的映射、而且从 object 到 subject 的映射

GitHub: https://github.com/zjp9574/SEPC

方法

Entity Tagger

利用四个二分类器来标注 subject 和 object 的 start 和 end 位置

Entity Pair Recognizer:Strengthening Entity Pairs Connection

Entity Pair Recognizer 旨在加强 subject 和 object 之间的内在联系,也就是说它最大化如下 3 式的可能性(最大化 3 式可能性就是同时最大化 4(subject 到 object)和 5(object 到 subject)的可能性):

image-20230228171624761

在此部分中,SEPC 包括四个映射:subject to object start position,subject to the object end position,object to subject start position,object to subject end position。

这四个映射为相同的网络结构,以 subject to object start position 为例进行解释。整个网络结构包含三个部分:

  • generation network
  • similarity network
  • backward network

image-20230228171937061

generation network

生成网络的输入 v 由实体的 start end position representation 平均计算而成。网络实际上就是一个线性层,输出可以看作是已知 subject 的情况下,object start 位置的表示

image-20230228172339586

similarity network

相似度网络用于计算 o(或者 s) 和 BERT 输出的相似度。

back network

反向网络的输出可以看作是已知 object的情况下,subject start 位置的表示

image-20230228173002435

Relation Tagger

论文应用了两种 relation tagger:

  • relation-specific tagger:当某些关系类型的实例很少时它的效果更好。
  • relation classifier:在每一种关系类型的实例都很充足是,这种方式更加适合。

relation-specific tagger

(SEPC-SL)实际上是 subject 到 object 的映射:

image-20230228174450117

relation classifier

(SEPC-ETC)关系分类模块是一个非常简单但有效的网络,特别是对于每一个有足够实例的关系类型。

image-20230228174440797

实验

image-20230228174838503