论文
Relation Classification via Convolutional Deep Neural Network
- 发布年份:2014
- 会议:COLING
- 作者:Daojian Zeng,Kang Liu,Siwei Lai,Guangyou Zhou and Jun Zhao
- 机构:National Laboratory of Pattern Recognition,Institute of Automation
- 贡献:第一次在 relation classification 领域运用 convolutional DNN
- 数据集: SemEval-2010 Task 8 dataset, http://docs.google.com/View?id=dfvxd49s。该数据集包含 10717 条被标注的数据(包括 8000 条训练用例和 2717 条测试用例。
模型结构
整个模型得架构如下:
- Input:带有两个被标记单词的一句话。
- Word Representation:将每个单词转为词嵌入。
- Feature Extraction:分别提取单词级别的特征和句子级别的特征,然后将两个特征向量连接起来。
- Output:简单的线性层+softmax 分类。
Lexical Level Feature
选取被标记的两个词嵌入、被标记词上下文单词的词嵌入、WordNet 中的上位词,将这些向量拼接起来作为单词级别的特征。
Sentence Level Feature
提出了 max-pooled CNN 用于提取句子级别的特征。下图是 Sentence Level Feature 的架构图:
- Window Processing:每一个 token 被表示为 Word Features(WF)和 Position Features(PF)。
- 在本文中,PF 被定义为与当前两个词的相对距离,根据这两个距离分别得到两个距离向量 d
1和 d2,这两个向量拼接起来得到完整的 PF。
- 在本文中,PF 被定义为与当前两个词的相对距离,根据这两个距离分别得到两个距离向量 d
- 将 WF 和 PF 送入 CNN 中。
- 最后输入一个非线性变换(线性层 + tanh)中得到句子级别的特征。
测试结果
Feature 对结果的影响: