一种增量抓取微博信息的方法
文献类型:专利
发明人:倪志豪[1]
机构:中国人民大学
申请人:中国人民大学
专利类型:发明专利
年度:2012
专利申请日期:2012-05-11
专利公开日期:2013-11-13
专利公开号:CN103389999A
专利申请号:CN201210145247.3
国家或地区:北京
摘要:本发明涉及一种增量抓取微博信息的方法,包括初次微博数据抓取和增量抓取截止到上次抓取时间的新增的微博数据,属于智能信息处理技术。现有技术中,对于海量微博信息的采集工作不能做到增量式抓取,常出现微博信息被重复多次抓取的情况。本发明所述的方法针对抓取微博信息的实际应用,通过合理的接入微博平台API,从而实现了一个实用的增量抓取微博算法。采用本发明所述的方法,能够明显提高微博信息的抓取的准确性与全面性,大大增强其实用性。本方法可广泛地应用于舆情分析与监控。
作者其他论文
基于R-C模型的微博用户社区发现?.周小平;梁循;张海燕.软件学报.2014,2808-2823.
马氏距离多核支持向量机学习模型.张凯军;梁循.计算机工程.2014,40(6),219-224.
基于移动互联网日志的搜索引擎用户行为研究.万飞;赵溪;梁循,等.中文信息学报.2014,28(2),144-150.
一种改进的显性多核支持向量机.张凯军;梁循.自动化学报.2014,2288-2294.
绿色照明工程信息管理系统研究.李亚平.照明工程学报.2015,75-79.