大数据下基于异步累积更新的高效P-Rank计算方法
外文标题:High-Efficiency P-Rank Computation Through Asynchronous Accumulative Updates in Big Data Environment
文献类型:期刊
作者:王旭丛[1]
机构:中国人民大学 信息学院 计算机系,北京,100872;中国人民大学 信息学院 数据仓库与商务智能实验室,北京,100872
通讯作者:Wang, Xu-Cong
年:2014
期刊名称:软件学报
卷:25
期:9
页码范围:2136-2148
增刊:增刊
收录情况:EI(20144100094914)
所属部门:信息学院
语言:中文
ISSN:1000-9825
链接地址:http://d.g.wanfangdata.com.cn/Periodical_rjxb201409018.aspx
DOI:10.13328/j.cnki.jos.004637
人气指数:182
浏览次数:182
基金:国家自然科学基金; 国家高技术研究发展计划(863); 国家基础研究发展计划(973); 国家社会科学基金; 中国人民大学科学研究基金(中央高校基本科研业务费专项资金资助)
关键词:异步累积更新;大数据;相似度;P-Rank;大规模计算
摘要:P-Rank是SimRank的扩展形式,也是一种相似度度量方法,被用来计算网络中任意两个结点的相似性。不同于SimRank只考虑结点的入度信息,P-Rank还加入了结点的出度信息,从而更加客观准确地评价结点间的相似程度。随着大数据时代的到来,P-Rank需要处理的数据日益增大。使用MapReduce等分布式模型实现大规模P-Rank迭代计算的方法,本质上是一种同步迭代方法,不可避免地具有同步迭代方法的缺点:迭代时间(尤其是迭代过程中处理器等待的时间)长,计算速度慢,因此效率低下。为了解决这一问题,采用了一种迭代计算方法--异步累积更新算法。这个算法实现了异步计算,减少了计算过程处理器结点的等待时间,提高了计算速度,节省了时间开销。从异步的角度实现了P-Rank算法,将异步累积更新算法应用在了P-Rank上,并进行了对比实验。实验结果表明该算法有效地提高了计算收敛速度。
作者其他论文
内存OLAP多核并行查询优化技术研究.焦敏;张延松;王珊,等.计算机学报.2014,1895-1910.
无线传感器网络中隐私保护通用近似查询协议.范永健;陈红;张晓莹,等.计算机学报.2014,915-926.
Co-OLAP:CPU&GPU混合平台上面向星形模型基准的协同OLAP.张宇;张延松;张兵,等.华东师范大学学报(自然科学版).2014,240-251.
符号社会网络中正负关系预测算法研究综述.蓝梦微;李翠平;王绍卿,等.计算机研究与发展.2015,52(2),410-422.
k-近邻模糊粗糙集的快速约简算法研究??.张照星;范星奇;赵素云,等.计算机科学与探索.2015,14-23.