- 来源:IJCAI 20
- 机构:北航
- 任务:joint RE
- 动机:基于 MRC 的 joint RE 有两个缺点,1⃣️在ACE数据集上,一个关系其实包含很多种关系,只用一个问题去问,会比较不明确2⃣️需要枚举所有的关系构建问题,负样本太多
- 方法:
- 总体架构还是用 mrc 先抽 head,再找句子里有的关系,再 mrc 抽 tail。
- mrc 框架是序列标注找 start end
- 1的多个问题,就是相当于找更细粒度的一些意思,手动写更多的(比如 ACE 里面 ORG-AFF这个关系,作者就给他分解成 employed, found by, belongs 等好几个问题)
- 由于有多个问题,因此就可能会有答案的冲突。这里基于 dev 上每个问题的 f1,设计每个问题的权重,在预测时加权所有问题的答案,得到最终头实体抽取结果
- 2的关系分类,就用句子的cls + head entity 的 start token 表示,linear 分类
- 其他没啥变化。。。
- 实验:
- SOTA @ ACE05 CoNLL04
- 实验都没啥可看的