图 3-2 BILSTM 结构
.........................
结论
命名实体识别作为自然语言处理的一项重要下游任务,在文本实体识别中起着重要作用。命名实体识别旨在从文本中识别出如人、位置、组织等实体。命名实体识别不仅是信息抽取的重要工具,而且在各种自然语言处理应用中发挥着重要作用,如文本理解、信息检索、自动文本摘要、机器问答、机器翻译和知识库构建等上游任务。作为底层任务,中学数学知识命名实体识别的精确度将直接影响到后续的机器理解、机器做题效率。
针对中学数学知识命名实体中存在的语义交叉嵌套、逻辑关系复杂以及短时间内的高识别精度要求等问题,本文主要进行的工作以及结论如下:
(1)提出基于 BERT-BILSTM-CRF 的中学数学知识命名实体识别模型。该模型结合了 BERT 预训练词向量嵌入模型和 BILSTM-CRF 模型的优点,提高了对中学数学知识命名实体识别的精确度。利用各种中学数学知识相关文献资料标定实体及关系的数据集合对该模型进行实验验证,再与其单一模型的实验结果进行对比,F1 值比 CRF 高出 26.25 个百分点,比 BILSTM 高出 16.1 个百分点,比混合模型 BILSTM-CRF 的 F1 值高出 7.56 个百分点,比 BERT-CRF 的 F1 值高出0.91 个百分点。
(2) 为弥补 BERT-BILSTM-CRF 在训练速率上的局限性,提出一种基于BERT-BIGRU-CRF 的中学数学知识命名实体识别模型,本模型首先通过 BERT预训练语言模型获得词向量,使用 BIGRU 网络获取文本中较长距离的上下文特征,最后通过 CRF 模型解码得到最优标注序列。此模型虽在长时间训练任务中精确度略低于 BERT-BILSTM-CRF 模型,却能在限定较短时间内获得比 BERT-BILSTM-CRF 模型更好的精确度,在学习速率为 0.001-0.01 区间内,BERT-BIGRU-CRF 的 F1 值均大于等于 BERT-BILSTM-CRF。
参考文献(略)