信息网络中一个有效的基于链接的结点相似度度量?
外文标题:Effective Link-Based Measure of Node Similarity on Information Networks
文献类型:期刊
作者:张应龙[1]
机构:数据工程与知识工程教育部重点实验室 中国人民大学,北京 100872; 华东交通大学软件学院,江西南昌 330045;数据工程与知识工程教育部重点实验室 中国人民大学,北京,100872
通讯作者:Li, Cui-Ping
年:2014
期刊名称:软件学报
卷:25
期:11
页码范围:2602-2615
增刊:增刊
收录情况:EI(20144900301295)
所属部门:数据工程与知识工程教育部重点实验室
语言:中文
ISSN:1000-9825
链接地址:http://d.g.wanfangdata.com.cn/Periodical_rjxb201411011.aspx
DOI:10.13328/j.cnki.jos.004578
基金:国家重点基础研究发展计划(973); 国家自然科学基金; 国家社会科学基金; 国家高技术研究发展计划(863); 国家高等学校学科创新引智计划
关键词:随机游走;相似度度量;SimRank;Personalized PageRank
摘要:信息网络无处不在.通过把网络中的对象抽象为点,把对象之间的关系刻画为边,相应的信息网络就可以用图来表示.图中结点相似度计算是图数据管理中的基本问题,在很多领域都有运用,比如社会网络分析、信息检索和推荐系统等.其中,著名的相似度度量是以Personalized PageRank和SimRank为代表.这两种度量本质都是以图中的路径来定义,然而它们侧重的路径截然不同.为此,提出了一个度量 SuperSimRank.它不仅涵盖了这些路径,而且考虑了Personalized PageRank和SimRank两者都没有考虑的路径,从而能够更加体现出这种链接关系的本质.在此基础上对SuperSimRank进行了理论分析,从而提出了相应的优化算法,使得计算性能从最坏情况O(kn4)提高到O(knl).这里,k 是迭代次数,n 是结点数,l 是边数.最后,通过实验验证了 SuperSimRank 优于 SimRank 和 Personalized PageRank,同时验证了优化算法在各种情况下都是有效的.
作者其他论文
内存OLAP多核并行查询优化技术研究.焦敏;张延松;王珊,等.计算机学报.2014,1895-1910.
无线传感器网络中隐私保护通用近似查询协议.范永健;陈红;张晓莹,等.计算机学报.2014,915-926.
Co-OLAP:CPU&GPU混合平台上面向星形模型基准的协同OLAP.张宇;张延松;张兵,等.华东师范大学学报(自然科学版).2014,240-251.
大数据下基于异步累积更新的高效P-Rank计算方法.王旭丛;李翠平;陈红.软件学报.2014,2136-2148.
符号社会网络中正负关系预测算法研究综述.蓝梦微;李翠平;王绍卿,等.计算机研究与发展.2015,52(2),410-422.