融合多层次特征的中文语义角色标注
作者:王一成 万福成 马宁
关键词:
自然语言处理; 语义角色标注; 深度学习; Bi-LSTM; 语言学特征; 后处理层; Max pooling;
摘要:
随着人工智能和中文信息处理技术的迅猛发展,自然语言处理相关研究已逐步深入到语义理解层次上,而中文语义角色标注则是语义理解领域的核心技术。在统计机器学习仍占主流的中文信息处理领域,传统的标注方法对句子的句法及语义的解析程度依赖较大,因而标注准确率受限较大,已无法满足当前需求。针对上述问题,对基于Bi-LSTM的中文语义角色标注基础模型进行了改进研究,在模型后处理阶段结合了Max pooling技术,训练时融入了词法和句式等多层次的语言学特征,以实现对原有标注模型的深入改进。通过多组实验论证,结合语言学辅助分析,提出针对性的改进方法从而使模型标注准确率得到了显著提升,证明了结合Max pooling技术的Bi-LSTM语义角色标注模型中融入相关语言学特征能够改进模型标注效果。
上一篇:基于数据增广和复制的中文语法错误纠正方法
下一篇:人工智能中的封闭性和强封闭性——现有成果的能力边界、应用条件和伦理风险