NLP 任务分类
NLP 任务总的来说分为两类:
- 输入文字,输出类别。
- 输入文字,输出另一段文字。
那么进一步的,可以根据输入和输出的不同,进行划分。
输出的不同
- 输出类别:
- 为一段话,只输出一个类别。
- 为每一个 token 都输出一个类别。
- 输出另一段文字:
- 使用 seq2seq 模型。
输入的不同
- 一段文字。
- 多段文字:
- 将多段文字拼接起来,中间用
<SEP>
连接。 - 分别放入 Model 中,再对输出进行整合。
- 将多段文字拼接起来,中间用
NLP 任务
知识图谱
知识图谱中,最重要的就是实体(Entity)和关系(Relation)。
提取实体 - NER
NER,Name Entity Recognition,命名实体识别。用于提取一段文字中给定的实体信息。
提取关系
提取关系,可以看成是一种分类问题。