Unsupervised relation extraction using sentence encoding

  • 来源:ISWC 2021 open review https://openreview.net/forum?id=AE-o5eV502t
  • 任务:unsupervised RE
  • 第一次听说无监督关系抽取任务,那么这个任务是其实就是一种聚类 + 匹配,这篇文章的做法就是用 sentence bert 得到句子的表示进行聚类,那么每一堆就是一个关系类别(但是这样真的能做到准确吗?句子分类和关系分类差得多吧?)然后拿来实体对关系的三元组,把他们组成一个自然语言的 query,比如 A birthplace B 就是 “A born in B”,计算 query 和每个簇里面 high confidence 样本的距离,小于阈值则认为这个三元组成立。
  • 这样一看,聚类就只是为了获得 relation 的表示?
    • 得到句子的表示的时候,输入的句子里不要 entity pair,也就是说,作者认为“上下文”这种 pattern 就完全可以表示两个实体的关系。这也不无道理
  • 在后面匹配的时候只用三元组,上下文就全都不要了?这里是我非常迷惑的地方
  • 最后 f1 有 40 左右,作者说 SOTA,不知道别人是怎么做的
  • TODO:了解 sentence bert

发表评论