删除或更新信息,请邮件至freekaoyan#163.com(#换成@)

一种基于海量文本数据的相似度衡量方法

中国人民大学 辅仁网/2017-07-04

文献详情
一种基于海量文本数据的相似度衡量方法
文献类型:专利
发明人:陆嘉恒[1]
机构:中国人民大学

申请人:中国人民大学
专利类型:发明专利
年度:2013
专利申请日期:2013-08-02
专利公开日期:2015-02-11
专利公开号:CN104346394A
专利申请号:CN201310335123.6
国家或地区:北京
摘要:本发明公开了一种基于海量文本数据的相似度衡量方法,该方法基于语义规则的扩展来衡量文本信息的相似度,具体分为两种扩展方法:全扩展和选择扩展。前者将全部可用语义规则用于扩展字符串,后者结合了全扩展和贪心扩展,给出了一种更加有效的扩展方法。通过实验对比表明,两种扩展方法都取得了非常好的性能,从而验证了本发明的可行性与可靠性。
作者其他论文



高效的XML关键字查询改写和结果生成技术.黄静;陆嘉恒;孟小峰.计算机研究与发展.2010,47(5),841-848.
高效的XML关键字查询改写和结果生成技术.黄静;陆嘉恒;孟小峰.NDBC2009第26届中国数据库学术会议.2009,1-7.
高效的XML关键字查询改写和结果生成技术.黄静;陆嘉恒;孟小峰.NDBC2009第26届中国数据库学术会议论文集中国计算机学会.2009,1-7.
Hadoop实战.陆嘉恒.国内:机械工业出版社.
分布式系统及云计算概论.陆嘉恒.国内:清华大学出版社.

相关话题/技术 数据库 中国人民大学 数据 文献