针对目前的篇章级行文一致性度量模型只考虑了待测作文的全文行文一致性,无法捕捉文本语义块的隐含语义特征及其之间的一致性问题,提出了一种通用的作文行文一致性测评模型. 该模型借鉴孪生神经网络的思想,创新性地同时提取作文中核心人物的性格、形象特征以及故事情节特征并进行相似度度量,从而获取文本的中心思想以及行文一致性的匹配分数;使用无监督主题模型Biterm-LDA(Latent Dirichlet Allocation)对作文进行主题特征提取,解决了对手工标注的依赖。实验结果表明提出的模型评分与人工标注结果多数一致,且优于普通神经网络模型.
PDF全文下载地址:http://journal.bit.edu.cn/zr/article/exportPdf?id=d543b840-5796-44b6-b32e-75910cf01277
删除或更新信息,请邮件至freekaoyan#163.com(#换成@)