删除或更新信息,请邮件至freekaoyan#163.com(#换成@)

基于TFIDF的社区问答系统问句相似度改进算法

本站小编 Free考研考试/2021-12-21

本文二维码信息
二维码(扫一下试试看!)
基于TFIDF的社区问答系统问句相似度改进算法
Improved TFIDF-Based Question Similarity Algorithm for the Community Interlocution Systems
投稿时间:2015-11-02
DOI:10.15918/j.tbit1001-0645.2017.09.018
中文关键词:向量空间模型TFIDF算法社区问答系统问句相似度
English Keywords:vector space modelTFIDF algorithmcommunity interlocution systemquestion similarity
基金项目:
作者单位
赵胜辉北京理工大学 信息与电子学院, 北京 100081
李吉月北京理工大学 信息与电子学院, 北京 100081
徐碧瑢北京理工大学 信息与电子学院, 北京 100081
孙博研北京理工大学 信息与电子学院, 北京 100081
摘要点击次数:638
全文下载次数:1447
中文摘要:
针对社区问答系统问句相似度计算问题,提出了一种改进的TFIDF算法.按照用户的查询意图对问句进行分类,根据特征词在类别中的分布对权值进行调整;将问句的主题词归入特征项进行TFIDF计算.实验结果表明,本文改进的TFIDF算法的P@3比传统的TFIDF算法提高了7.66%,比TFIDF-IG算法提高了5.31%,而且P@5和P@10也有不同程度的提高,与传统TFIDF算法和参考改进算法相比,该算法明显提高了检索性能.
English Summary:
To calculate the question similarity in the community interlocution systems, an improved TFIDF algorithm was proposed in this paper. Firstly, the questions were divided into different categories according to the users' retrieval intention, and the weight of every feature word was adjusted based on the distribution in the categories. And then, the topic words were adopted in the feature words for TFIDF algorithm. The experimental results show that, compared with the traditional TFIDF, the P@3 increases 7.66%. Compared with TFIDF-IG, the P@3 increases 5.31%. And different improvements can be obtained in P@5 and P@10. The new algorithm shows better search performance.
查看全文查看/发表评论下载PDF阅读器
相关话题/信息 北京 北京理工大学 电子 社区