基于本体的俄文新闻话题检测设计与实现
原伟1,2,唐亮2,易绵竹2*1.上海外国语大学博士后流动站, 上海 200083;2.信息工程大学洛阳校区, 河南 洛阳 471003
收稿日期:
2017-12-22出版日期:
2018-09-20发布日期:
2018-09-10作者简介:
原伟(1981— ),男,博士,副教授,研究方向为计算语言学、语料库语言学. E-mail:yw5811827@126.com*通信作者简介:易绵竹(1964— ),男,博士,教授,研究方向为计算语言学、俄语语言文学. E-mail:13373781261@126.com基金资助:
国家社会科学基金资助项目(14CYY051,18BYY235);中国博士后科学基金面上资助项目(2017M610268,2018T110403)Design and implementation of topic detection in Russian news based on ontology
1. Post-Doctoral Research Station of Shanghai International Studies University, Shanghai 200083, China;
2. Information Engineering University, Luoyang 471003, Henan, China
Received:
2017-12-22Online:
2018-09-20Published:
2018-09-10摘要/Abstract
摘要: 针对俄文新闻文本的话题检测问题,以俄文文本的自动形态分析、命名实体识别作为辅助手段,设计了一种基于本体描述俄文新闻文本和话题信息并进行相似度计算的方法,随后使用Single-pass算法进行俄文文本的话题检测实验。通过对比基于向量空间模型和基于本体模型的俄文话题检测结果,证明了后者具有相对较高的准确性和有效性。
PDF全文下载地址:
http://lxbwk.njournal.sdu.edu.cn/CN/article/downloadArticleFile.do?attachType=PDF&id=2837