基于数据挖掘的短消息业务相关性分析
文献类型 | 学位 |
作者 | 高源[1] |
机构 | 北京航空航天大学 ↓ |
授予学位 | 硕士 |
年度 | 2004 |
学位授予单位 | 北京航空航天大学 |
语言 | 中文 |
关键词 | 短消息相关性;数据挖掘;关联规则;Apriori;FP-树;增量算法 |
摘要 | 该论文对基于短消息业务的数据挖掘系统的子系统短消息业务相关性分析系统进行了研究与实现.该论文首先分析设计了基于短消息业务的数据挖掘系统;然后对短消息业务相关性分析问题进行了设计与实现;最后在增量数据挖掘的基础上进行了进一步的研究.该文完成如下的工作成果:分析设计了基于短消息业务的数据挖掘系统.对该系统建设进行了分析,给出了该系统的特点,设计要求和目标;提出了其所包含的统计分析主题;确定了基于短消息业务的数据挖掘系统的系统结构.对国内外进行相关性分析的数据挖掘方法进行了分析与研究.分析了国内外当前进行相关性分析的数据挖掘方法与应用实例,对利用数据挖掘方法进行相关性分析的过程和当前所使用的数据挖掘方法给予描述和总结,并进行了比较.对于短消息业务中的关联规则问题进行分析.针对短消息数据业务这一领域,对问题进行了分析.基于用户的历史行为,选择合适的用户描述数据并对数据进行了预处理,应用Apriori算法和FP-树算法进行了短消息业务中的关联规则的挖掘,取得了较好的预测效果,并在主观和客观两个方面作出了评价.增量数据挖掘的研究.短消息数据是在不停地增加,如果每次都对全部数据进行重新挖掘,计算的代价非常大,所以要充分利用上一次的挖掘结果.该文应用了一种改进的最大频繁项目集的增量式更新算法(IUMFI).什么时候做增量挖掘是非常重要的问题.该文应用了一个称为TPD(Tradeoff between Performance and Difference)的方法,来确定何时更新原有的规则模式. |
影响因子:
dc:title:基于数据挖掘的短消息业务相关性分析
dc:creator:高源
dc:date: publishDate:1753-01-01
dc:type:学位
dc:format: Media:北京航空航天大学
dc:identifier: LnterrelatedLiterature:北京航空航天大学.2004.
dc:identifier:DOI:
dc: identifier:ISBN: