SEPC: Improving Joint Extraction of Entities and Relations by Strengthening Entity Pairs Connection
来源:KDD 2021
作者:Jiapeng Zhao, Panpan Zhang, Tingwen Liu
机构:Institute of Information Engineering Chinese Academy of Sciences, Beijing
motivation:而现有的方法通常只通过共享 encoder 来建模实体对,这不足以利用实体对的内在联系,而且无法纠正 subject 识别错误的情况。为了解决这一问题,论文提出利用实体对的对偶性来加强实体对连接(strengthen entity pairs connection,SEPC),将关系抽取任务转化为不仅从 subject 到 object 的映射、而且从 object 到 subject 的映射。
GitHub: https://github.com/zjp9574/SEPC
方法
Entity Tagger
利用四个二分类器来标注 subject 和 object 的 start 和 end 位置。
Entity Pair Recognizer:Strengthening Entity Pairs Connection
Entity Pair Recognizer 旨在加强 subject 和 object 之间的内在联系,也就是说它最大化如下 3 式的可能性(最大化 3 式可能性就是同时最大化 4(subject 到 object)和 5(object 到 subject)的可能性):
在此部分中,SEPC 包括四个映射:subject to object start position,subject to the object end position,object to subject start position,object to subject end position。
这四个映射为相同的网络结构,以 subject to object start position 为例进行解释。整个网络结构包含三个部分:
- generation network
- similarity network
- backward network
generation network
生成网络的输入 v 由实体的 start end position representation 平均计算而成。网络实际上就是一个线性层,输出可以看作是已知 subject 的情况下,object start 位置的表示:
similarity network
相似度网络用于计算 o(或者 s) 和 BERT 输出的相似度。
back network
反向网络的输出可以看作是已知 object的情况下,subject start 位置的表示:
Relation Tagger
论文应用了两种 relation tagger:
- relation-specific tagger:当某些关系类型的实例很少时它的效果更好。
- relation classifier:在每一种关系类型的实例都很充足是,这种方式更加适合。
relation-specific tagger
(SEPC-SL)实际上是 subject 到 object 的映射:
relation classifier
(SEPC-ETC)关系分类模块是一个非常简单但有效的网络,特别是对于每一个有足够实例的关系类型。