SEPC: Improving Joint Extraction of Entities and Relations by Strengthening Entity Pairs Connection

来源：KDD 2021

作者：Jiapeng Zhao, Panpan Zhang, Tingwen Liu

机构：Institute of Information Engineering Chinese Academy of Sciences, Beijing

motivation：而现有的方法通常只通过共享 encoder 来建模实体对，这不足以利用实体对的内在联系，而且无法纠正 subject 识别错误的情况。为了解决这一问题，论文提出利用实体对的对偶性来加强实体对连接（strengthen entity pairs connection，SEPC），将关系抽取任务转化为不仅从 subject 到 object 的映射、而且从 object 到 subject 的映射。

GitHub： https://github.com/zjp9574/SEPC

方法

Entity Tagger

利用四个二分类器来标注 subject 和 object 的 start 和 end 位置。

Entity Pair Recognizer：Strengthening Entity Pairs Connection

Entity Pair Recognizer 旨在加强 subject 和 object 之间的内在联系，也就是说它最大化如下 3 式的可能性（最大化 3 式可能性就是同时最大化 4（subject 到 object）和 5（object 到 subject）的可能性）：

在此部分中，SEPC 包括四个映射：subject to object start position，subject to the object end position，object to subject start position，object to subject end position。

这四个映射为相同的网络结构，以 subject to object start position 为例进行解释。整个网络结构包含三个部分：

generation network
similarity network
backward network

generation network

生成网络的输入 v 由实体的 start end position representation 平均计算而成。网络实际上就是一个线性层，输出可以看作是已知 subject 的情况下，object start 位置的表示：

similarity network

相似度网络用于计算 o（或者 s）和 BERT 输出的相似度。

back network

反向网络的输出可以看作是已知 object的情况下，subject start 位置的表示：

Relation Tagger

论文应用了两种 relation tagger：

relation-specific tagger：当某些关系类型的实例很少时它的效果更好。
relation classifier：在每一种关系类型的实例都很充足是，这种方式更加适合。

relation-specific tagger

（SEPC-SL）实际上是 subject 到 object 的映射：

relation classifier

（SEPC-ETC）关系分类模块是一个非常简单但有效的网络，特别是对于每一个有足够实例的关系类型。

Dawn's Blogs

关系抽取论文 SEPC: Improving Joint Extraction of Entities and Relations by Strengthening Entity Pairs Connection

方法