一种针对海量数据中查询词的搜索维度挖掘方法

删除或更新信息，请邮件至freekaoyan#163.com(#换成@)

中国人民大学辅仁网/2017-07-05

文献详情
一种针对海量数据中查询词的搜索维度挖掘方法
文献类型：专利
发明人：窦志成^[1]文继荣^[2]李谨秀^[3]
机构：中国人民大学

申请人：中国人民大学
专利类型：发明专利
年度：2015
专利申请日期：2015-12-07
专利公开日期：2016-04-27
专利公开号：CN105528421A
专利申请号：CN201510890422.5
国家或地区：北京
摘要：本发明公开了一种针对海量数据中查询词的搜索维度挖掘方法，其该方法包括如下步骤：1)基于文本、HTML标签和重复区域等模式，从抓取到的数据集中的每一个网页中抽取Lists；2)增加抽取机制，以实现对步骤1)中抽取到的Lists进行有效性扩充；3)评估抽取出来的每一个List的重要性；4)词项列表聚类：将相似的词项列表进行合并形成一个查询维度；5)查询维度及词项列表的排序：计算不同的查询分面、词项的重要性。本发明可以获得更多有效的词项列表，在得到补充后的词项列表之后，对新的词项列表进行打分，将相似的词项列表进行合并分类，计算不同的查询分面、词项列表的重要性，最终使得挖掘出的查询维度更加完善，使得用户可以获得更为完整的信息。
作者其他论文

Shared-nothing并行数据库系统查询优化技术.文继荣;陈红;王珊.计算机学报.2000,23(1),28-38.
并行数据库系统PBASE/2的查询优化机制.陈红;文继荣;王珊.计算机工程.2000,26(7),11-12,187.
高适应性并行数据库系统PBASE的总体结构与关键技术.王珊;陈红;文继荣,等.863计划智能计算机主题学术会议.2001,226-241.
嵌套查询在并行数据库中的实现.周胜;文继荣;王珊.第十五届全国数据库学术会议.1998,274-277.
大数据时代的互联网分析引擎.窦志成;文继荣.大数据.2015,36-47.

相关话题/数据 计算机 计算 中国人民大学 文献

领限时大额优惠券,享本站正版考研考试资料!
优惠券领取后72小时内有效，10万种最新考研考试考证类电子打印资料任你选。涵盖全国500余所院校考研专业课、200多种职业资格考试、1100多种经典教材，产品类型包含电子书、题库、全套资料以及视频，无论您是考研复习、考证刷题，还是考前冲刺等，不同类型的产品可满足您学习上的不同需求。 ...
考试优惠券本站小编 Free壹佰分学习网 2022-09-19
quot;半熟人社会quot;中的宗教信仰与人际信任--基于2010年CGSS数据的实证分析
文献详情quot;半熟人社会quot;中的宗教信仰与人际信任--基于2010年CGSS数据的实证分析文献类型：会议作者：徐立成[1]机构：[1]中国人民大学农业与农村发展学院年：2015会议名称：北京农业经济学会2015学术年会会议论文集：北京农业经济学会2015学术年会论文集会议地点：北京会议开始 ...
中国人民大学科研学术中国人民大学辅仁网 2017-07-05
"半熟人社会"中的宗教信仰与人际信任--基于2010年CGSS数据的实证分析
文献详情"半熟人社会"中的宗教信仰与人际信任--基于2010年CGSS数据的实证分析文献类型：会议作者：徐立成[1]机构：[1]中国人民大学农业与农村发展学院年：2015会议名称：北京农业经济学会2015学术年会论文集北京农业经济学会;中国人民大学农业与农村发展学院页码范围：161-174会议地点： ...
中国人民大学科研学术中国人民大学辅仁网 2017-07-05
高职院校管理类专业的计算机课程设置探索
文献详情高职院校管理类专业的计算机课程设置探索文献类型：期刊作者：李刚[1]机构：[1]中国人民大学继续教育学院年：2015期刊名称：品牌期：03页码范围：196-197增刊：正刊所属部门：继续教育学院语言：中文ISSN：1671-1009关键词：高职教育;课程设置;信息技术;教学方法;微课程摘要： ...
中国人民大学科研学术中国人民大学辅仁网 2017-07-05
基于大数据的项目管理创新建议研究论述
文献详情基于大数据的项目管理创新建议研究论述文献类型：期刊作者：陈洪霞[1]机构：[1]中国人民大学年：2015期刊名称：商业故事期：29页码范围：24-25增刊：正刊语言：中文ISSN：1673-8160关键词：大数据;项目管理;创新;数据采集摘要：在信息技术不断普及与发展的今天,我国各领域都开始 ...
中国人民大学科研学术中国人民大学辅仁网 2017-07-05
“出土文献与中国古代文明”学术研讨会综述
文献详情“出土文献与中国古代文明”学术研讨会综述文献类型：期刊作者：田家溧[1]刘自稳[2]机构：[1]郑州大学历史学院[2]中国人民大学历史学院年：2015期刊名称：陕西历史博物馆馆刊期：00页码范围：368-372增刊：正刊所属部门：历史学院语言：中文关键词：出土文献;中国古代文明;中国人民大学 ...
中国人民大学科研学术中国人民大学辅仁网 2017-07-05
一级市场新股发行询价制度研究——基于多层次资本市场的数据
文献详情一级市场新股发行询价制度研究——基于多层次资本市场的数据文献类型：期刊作者：高少臣[1]姜顺其[2]机构：[1]中国人民大学信息学院[2]中央财经大学统计与数学学院年：2015期刊名称：公司金融研究期：03页码范围：71-87增刊：正刊所属部门：信息学院语言：中文关键词：询价制度;IPO;合 ...
中国人民大学科研学术中国人民大学辅仁网 2017-07-05
最优债务条件与经济增长——基于中国省级经验数据
文献详情最优债务条件与经济增长——基于中国省级经验数据文献类型：期刊作者：任芃兴[1]机构：[1]中国人民大学财政金融学院年：2015期刊名称：财经论丛期：11页码范围：25-33增刊：正刊收录情况：中文核心期刊要目总览所属部门：财政金融学院语言：中文ISSN：1004-4892关键词：债务规模;债 ...
中国人民大学科研学术中国人民大学辅仁网 2017-07-05
开拓创新构建实践能力培养体系——中国人民大学MPAcc项目研究生培养实践和体会
文献详情开拓创新构建实践能力培养体系——中国人民大学MPAcc项目研究生培养实践和体会文献类型：期刊作者：应梅[1]机构：[1]中国人民大学年：2015期刊名称：中国研究生期：06页码范围：62-63增刊：正刊语言：中文ISSN：1671-9042关键词：中国人民大学;MPAcc;教学改革发展;能力 ...
中国人民大学科研学术中国人民大学辅仁网 2017-07-05
大数据环境下网络信息归档研究
文献详情大数据环境下网络信息归档研究文献类型：期刊作者：邢变变[1]孙大东[2]机构：[1]中国人民大学信息资源管理学院[2]郑州大学信息管理学院年：2015期刊名称：上海档案期：07页码范围：33-36增刊：正刊所属部门：信息资源管理学院语言：中文关键词：研究成果;数据环境;归档保存;保管期限;归 ...
中国人民大学科研学术中国人民大学辅仁网 2017-07-05
医疗费用持续增长机制——基于历史数据和田野资料的分析
文献详情医疗费用持续增长机制——基于历史数据和田野资料的分析文献类型：期刊作者：刘军强[1]刘凯[2]曾益[3]机构：[1]中山大学中国公共管理研究中心、政治与公共事务管理学院[2]中国人民大学劳动人事学院社会保障系[3]中南财经政法大学公共管理学院年：2015期刊名称：中国社会科学期：08页码范围 ...
中国人民大学科研学术中国人民大学辅仁网 2017-07-05