1(软件开发环境国家重点实验室(北京航空航天大学) 北京 100191); 2(北京大数据科学与脑机智能高精尖创新中心(北京航空航天大学) 北京 100191); 3(国家计算机网络应急技术处理协调中心 北京 100029) (liyy@act.buaa.edu.cn)
出版日期:
2018-09-01基金资助:
国家自然科学基金项目(U1636210&61421003);国家自然科学基金优秀青年科学基金项目(61322207) This work was supported by the National Natural Science Foundation of China (U1636210&61421003) and the National Natural Science Foundation of China for Excellent Young Scientists (61322207).An Approach for Storytelling by Correlating Events from Social Networks
Li Yingying1,2, Ma Shuai1,2, Jiang Haoyi1,2, Liu Zhe2, Hu Chunming1,2, Li Xiong31(State Key Laboratory of Software Development Environment (Beihang University), Beijing 100191); 2(Beijing Advanced Innovation Center for Big Data and Brain Computing (Beihang University), Beijing 100191); 3(National Computer Network Emergency Response Technical TeamCoordination Center of China, Beijing 100029)
Online:
2018-09-01摘要/Abstract
摘要: 推特和新浪微博等社交网络已成为报道公共事件的重要平台,它们为监控事件及其演化提供了宝贵的数据.然而,这些数据包含的非正式词语和碎片化文本使得从中提取描述性的信息具有一定的挑战.另外,从快速生成的大量微博监控事件演化也有一定难度.提出在社交网络中监控事件并对具有相同主题的事件演化进行分析.这既可以在粗粒度水平获得事件的概述,又可以在细粒度水平获得事件的详细信息.通过3个连续的组件实现该任务.1)用结构化的方法从微博检测事件;2)基于事件的隐式语义信息对事件聚类并将聚类获得的簇定义为故事;3)用基于图的方法为每个故事生成故事脉络,故事脉络用包含摘要的有向无环图表示故事内事件的演化.用户体验评估实验表明:提出的方法比现有方法具有更高的准确性和可理解性,并能够帮助用户监控事件及其演化.
参考文献
相关文章 15
[1] | 夏冬雪, 杨燕, 王浩, 阳树洪. 基于邻域多核学习的后融合多视图聚类算法[J]. 计算机研究与发展, 2020, 57(8): 1627-1638. |
[2] | 陈亦琦, 钱铁云, 李万理, 梁贻乐. 基于复合关系图卷积的属性网络嵌入方法[J]. 计算机研究与发展, 2020, 57(8): 1674-1682. |
[3] | 朱颖雯, 陈松灿. 基于随机投影的高维数据流聚类[J]. 计算机研究与发展, 2020, 57(8): 1683-1696. |
[4] | 郑值, 徐童, 秦川, 廖祥文, 郑毅, 刘同柱, 童贵显. 基于多源情境协同感知的药品推荐[J]. 计算机研究与发展, 2020, 57(8): 1741-1754. |
[5] | 于亚新, 刘梦, 张宏宇. Twitter社交网络用户行为理解及个性化服务推荐算法研究[J]. 计算机研究与发展, 2020, 57(7): 1369-1380. |
[6] | 刘子图, 全紫薇, 毛如柏, 刘勇, 朱敬华. NT-EP:一种无拓扑结构的社交消息传播范围预测方法[J]. 计算机研究与发展, 2020, 57(6): 1312-1322. |
[7] | 罗浩, 闫光辉, 张萌, 包峻波, 李俊成, 刘婷, 杨波, 魏军. 融合多元信息的多关系社交网络节点重要性研究[J]. 计算机研究与发展, 2020, 57(5): 954-970. |
[8] | 王婷, 王娜, 崔运鹏, 李欢. 基于半监督学习的无线网络攻击行为检测优化方法[J]. 计算机研究与发展, 2020, 57(4): 791-802. |
[9] | 赵慧慧, 赵凡, 陈仁海, 冯志勇. 基于地理空间大数据的高效索引与检索算法[J]. 计算机研究与发展, 2020, 57(2): 333-345. |
[10] | 黄海平, 张东军, 王凯, 朱毅凯, 王汝传. 带权值的大规模社交网络数据隐私保护方法[J]. 计算机研究与发展, 2020, 57(2): 363-377. |
[11] | 陈叶旺, 申莲莲, 钟才明, 王田, 陈谊, 杜吉祥. 密度峰值聚类算法综述[J]. 计算机研究与发展, 2020, 57(2): 378-394. |
[12] | 秦红, 王皓, 魏晓超, 郑志华. 安全的常数轮多用户k-均值聚类计算协议[J]. 计算机研究与发展, 2020, 57(10): 2188-2200. |
[13] | 刘逸凡, 徐昆. 多光源绘制方法综述[J]. 计算机研究与发展, 2020, 57(1): 17-31. |
[14] | 张佳影,王祺,张知行,阮彤,张欢欢,何萍. 区域医疗健康平台中检验检查指标的标准化算法[J]. 计算机研究与发展, 2019, 56(9): 1897-1906. |
[15] | 涂盼鹏,王兴伟,李婕,黄敏. BIRI:支持信息中心范型的BBO启发式MSN路由算法[J]. 计算机研究与发展, 2019, 56(9): 1918-1926. |
PDF全文下载地址:
https://crad.ict.ac.cn/CN/article/downloadArticleFile.do?attachType=PDF&id=3770