删除或更新信息,请邮件至freekaoyan#163.com(#换成@)

基于复杂网络局部社团发现的主题爬行研究

中国人民大学 辅仁网/2017-07-05

文献详情
基于复杂网络局部社团发现的主题爬行研究
文献类型:期刊
作者:沈桂兰[1]孙洁[2]杨小平[3]
机构:中国人民大学信息学院;北京联合大学商务学院

年:2014
期刊名称:河南师范大学学报(自然科学版)
期:04
页码范围:134-138
增刊:正刊
所属部门:信息学院
语言:中文
ISSN:1000-2367
关键词:局部社区发现;主题爬行;主题网站群;相似度分析
摘要:从全局上限定采集范围可以有效地提高主题爬虫的查准率.结合Web链接分析和页面内容特征分析,提出了一种基于复杂网络局部社区发现的主题爬行方法,将主题爬行分为两个阶段,第一阶段采用复杂网络的局部社区发现算法进行Web链接分析,构建主题网站群,缩小爬行范围.在第二阶段,在限定的范围内,对爬取到的页面进行主题相似度判定,并对下一步的链接目标进行预测.实验证明,该方法显著提高了主题爬虫的查准率.
作者其他论文



近邻传播聚类算法研究.桂斌;杨小平;张中夏,等.山西大学学报(自然科学版).2014,37(1),7-11.
基于Struts2技术的社交网络服务平台.陈默;杨小平;李瑶,等.计算机系统应用.2014,19-27.
基于主题词表和 FCA的网页语义概念树构建研究.孙亚琳;赵林林;杨小平.计算机应用研究.2014,3308-3315.
基于语言网络和语义信息的文本相似度计算.詹志建;杨小平.计算机工程与应用.2014,33-38.
经济二元结构与我国货币政策利率传导机制.徐琳;杨小平.安庆师范学院学报(社会科学版).2014,115-118.

相关话题/网络 信息学院 语言 文献 论文