数据挖掘技术研究与应用
文献类型 | 学位 |
作者 | 徐燕[1] |
机构 | 北京航空航天大学 ↓ |
授予学位 | 博士 |
年度 | 2004 |
学位授予单位 | 北京航空航天大学 |
语言 | 中文 |
关键词 | 数据挖掘;聚类算法;粗糙集;约简;手势;虚拟现实 |
摘要 | 数据挖掘从产生时起,就是面向应用的.但是在实际生活中,存在许多模糊现象不能简单地用传统理论精确地刻画,如何表示和处理这些现象是数据挖掘研究中的重要问题.本文从实际应用中存在缺值、不完全和噪音数据等问题为出发点,结合人机交互技术中数据挖掘的应用,研究分析了数据挖掘中的一些理论与方法,取得了以下主要研究成果:1.建立了一种基于聚类的粗糙集模型.粗糙集理论是处理模糊和不确定知识的一种重要的工具,但经典粗糙集理论对原始数据本身的模糊性缺乏相应的处理能力,特别是数据中存在缺值时,经典粗糙集理论中的等价类无法刻画.本文基于聚类方法,对聚类中距离的概念加以扩展,使得能处理数据中存在缺值和非数值性数据,基于这种聚类方法得到的粗糙集模型,能处理不完全数据和模糊性数据.2.提出了可变精度聚类算法.聚类算法是数据挖掘中的常用方法,本文针对实际应用中聚类算法对初值依赖性较大,容易收敛于局部最优点、不能很好地处理缺值等问题,提出了可变精度聚类算法,降低了对初值的依赖性,有效地避免了算法收敛于某些局部极值点.3.提出了基于区分能力大小的启发式约简算法.约简的应用主要存在两方面的问题:约简的有效计算问题和处理数据中噪音和缺省值问题.近年来,对于这两个方面的问题有很多研究,但尚无二者兼顾的好方案.本文提出了一种能处理噪音的有效约简算法,该算法基于粗糙集理论认为知识是区分事物的能力的观点,对知识进行量化,证明了量化的合理性,并以量化后的区分能力作为启发式信息,指导约简,提高了约简效率.4.挖掘出了一组手势类.手势在人机交互中起着重要的作用,手关节自由度多给手势的识别与合成带来了困难,基于可变精度聚类算法得到了238个手势类,任何一个手势相似于其中一个类.在中国手语合成系统中,这些手势类不仅满足了手语词库的建立、中国聋人手语合成的要求,而且为进一步探索手的运动控制方法,寻求新的手语运动编码打下了基础.5.发现了手关节之间的约束.手运动是灵活与复杂的,但手运动也存在一定约束,使用基于区分能力大小的启发式约简算法,发现了手关节之间的约束,可将手的关节自由度降到15个,可在一定的误差范围内,将手的自由度降为7个,即手势的特征主要集中在手的7个关节自由度上,这将大大简化手势识别与合成中的工作,为寻找手势最小识别基元提出了一种新的思路. |
影响因子:
dc:title:数据挖掘技术研究与应用
dc:creator:徐燕
dc:date: publishDate:1753-01-01
dc:type:学位
dc:format: Media:北京航空航天大学
dc:identifier: LnterrelatedLiterature:北京航空航天大学.2004.
dc:identifier:DOI:
dc: identifier:ISBN: