StereoRel: Relational Triple Extraction from a Stereoscopic Perspective

  • 来源:ACL 2021
  • 机构:北交大
  • 任务:joint re
  • 动机:joint re 三大问题:
    • Information loss:实体识别补全、实体重叠
    • Error propagation:pipeline 或者 generative 都是分顺序的
    • Ignoring the interaction between entity and relation:说的比较具体,这里他指实体在不同关系里应该有不同的表示。这种 relation-specific 的思想似乎很常见,但是真的有道理吗?从认识论上说,可能相当与从实体的多个意义里选了一个最有可能产生 relation 的作为 contextulized 意思。感觉是痒点,不是痛点 / defect
  • triple 的三维表示:
    • 其中 |L| 是句子长度,|T| 是 bio 标注的个数,|R| 是关系类别个数,整个立方体都是用 01 构成,表达所有标注结果的可能性
    • 作者还定义了几个操作:
      • 切片:确定了一个实体 / 关系,就相当于给立方体切片(z 轴没有厚度,xy 有实体长度作为厚度)
      • 投影:相当于只关注子任务
      • 缩小:token pair 用 |L|x|L|x|R| 表示,就相当于“预测 token 关系”的操作
    • 以前的工作:
      • 切片就导致 error propagation
      • 投影就导致 SPO EPO 和忽略子任务的交互
      • 列举了很多工作,总体上就是,这些工作都将这么大一个三维空间简化成一部分了,所以导致了很多问题
  • 方法:感觉这也是在前面写了一个宏大的故事,方法一看非常简单(但表达式整得还挺像回事)
    • bert 得到 token 表示,reshape 到 64 维
    • 每个 token 表示送给 3x|R| 个 linear,分别对应每个关系下的 subject object relation 抽取
    • subject object 抽取就直接 + crf 得结果(subject object decoder),relation 使用两个拼接打分(shrinkage decoder)
    • 通过上述三个 decoder 就得到在一个关系下可能的 subject object 以及所有 token pair 之间的分,如果 subject object 之间分数高于阈值,就得到这个三元组
  • 实验:
    • 非常不 solid,2021 年了害 partial match 呢?比 SOTA 就高了 0.2 个点。我看他还引用了 SPN4RE 但是没比,唉。而且代码为啥不开源呢
    • 除了大实验,其他实验啥都没做(可能也是方法太简单了)

发表评论