BiLSTM + CRF 这个模型用于 NER、序列标注等非常流行。因为流行,所以有非常多非常好的博客讲它。我就不再写了,下面是我看了一大堆之后,认为非常好的文章。按照我列出的顺序读,就可以比较好的了解 BiLSTM + CRF。
- BiLSTM模型中CRF层的运行原理(1) 介绍了整个模型结构
- BiLSTM模型中CRF层的运行原理(2) 介绍了 CRF 的损失函数
- BiLSTM模型中CRF层的运行原理(3) 介绍了预测标签序列的计算过程
- BiLSTM-CRF模型中CRF层的运行原理(4) 用 Keras 手写,代码在这里
- 论文原文 Bidirectional LSTM-CRF Models for Sequence Tagging 其实没写什么有用的,不看也行
- 手撕 BiLSTM-CRF 最后再看这个版本的手撕代码就可以了(我还没太看懂)