删除或更新信息,请邮件至freekaoyan#163.com(#换成@)

高性能文本索引系统的设计与实现

中国人民大学 辅仁网/2017-07-05

文献详情
高性能文本索引系统的设计与实现
文献类型:期刊
作者:路炜[1]张宇[2]周美孜[3]刘燕兵[4]王春露[5]
机构:中国科学院信息工程研究所,北京100093; 河北师范大学附属民族学院,石家庄050091; 北京邮电大学计算机学院,北京100876;中国科学院信息工程研究所,北京,100093;中国人民大学信息学院,北京,100872;北京邮电大学计算机学院,北京,100876

年:2014
期刊名称:中国科技论文
期:1
页码范围:92-95,107
增刊:增刊
所属部门:信息学院
语言:中文
ISSN:2095-2783
链接地址:http://d.g.wanfangdata.com.cn/Periodical_zgkjlwzx201401018.aspx
DOI:10.3969/j.issn.2095-2783.2014.01.018
基金:国家高技术研究发展计划(863计划)资助项目(2011AA010703);国家自然科学基金资助项目(61202477);中国科学院战略性先导科技专项资助项目(XD06030602);河北省教育厅资助科研项目
关键词:计算机应用 文本索引 全文索引 自索引 通配符搜索 computer application text index full-text index self-index wildcard search
摘要:针对传统文本索引技术空间消耗大、分词不准确等问题,设计并实现了高性能文本索引系统。该系统采用压缩的全文自索引算法,节省了空间开销,避免了自然语言分词方法的影响,配合通配符搜索算法扩展了模糊搜索的功能,在众核CPU高性能处理器上可实现多线程并行处理,提高了处理速度,整个系统的实现是基于Web方式的,可以跨平台运行。实验结果表明,该系统将文本索引的空间消耗降为原文本的50%左右,具有较高的实用价值。
作者其他论文



Co-OLAP:CPU&GPU混合平台上面向星形模型基准的协同OLAP.张宇;张延松;张兵,等.华东师范大学学报(自然科学版).2014,240-251.
位图连接索引服务机制研究.张延松;苏明川;张宇,等.计算机工程与应用.2015,107-115.
市场有效,党政有为,根基牢固--正确认识社会主义市场经济中政府和市场的关系.张宇.红旗文稿.2014,4-8.
中国不能出现颠覆性错误--正确认识社会主义初级阶段的基本经济制度.张宇.红旗文稿.2014,4-7.
为什么西方经济学不能解释中国经济.张宇.决策探索.2015,21-21.

相关话题/系统 北京 计算机 中国科学院 空间