(东北石油大学计算机与信息技术学院 黑龙江大庆 163318) (xiaoran9217@163.com)
出版日期:
2018-06-01基金资助:
黑龙江省教育厅科技项目(12531059)General Data Quality Assessment Model and Ontological Implementation
Zhang Xiaoran, Yuan Man(School of Computer and Information Technology, Northeast Petroleum University, Daqing, Heilongjiang 163318)
Online:
2018-06-01摘要/Abstract
摘要: 随着数据科学技术在各个领域的深度应用,作为企业重要资产的数据越发表现出它的价值性与重要性.绝大多数企业结合行业特点开发了数据质量检测系统来解决自身数据质量问题.这些系统的评估模型各有特点,对于数据质量维度的定义也是各有千秋.试图将这些模型与数据质量维度以一种通用的形式来定义,旨在成为企业研发数据质量评估系统的标准.通过分析国内外****在该研究领域取得的成果并结合常年研发数据质量检测与评估系统的经验,首先,提出了一个通用的数据质量检测与评估的数学模型;接着,以此模型为基础,采用本体技术定义了从该通用的数据质量评估数学模型到本体模型映射的转换规则;随后,考虑到多数数据存储在关系数据库中,因此以关系数据模型为例,依据所提出的数学模型和转换规则实现了对数据质量评估本体的抽取与构建,该模型实现了复杂质量规则的定义,具有规范性,实现了对不同来源、不同格式的数据质量进行检测与评估;最后,结合中国石油的油田开发数据质量评估项目进行了系统的实现,验证所提出模型的正确性、科学性、合理性以及可扩充性等.由于所提出的数据质量检测与评估模型与领域无关,所以它具有通用性.
参考文献
相关文章 8
[1] | 何云华,李梦茹,李红,孙利民,肖珂,杨超. 群智感知应用中基于区块链的激励机制[J]. 计算机研究与发展, 2019, 56(3): 544-554. |
[2] | 周宁南,盛万兴,刘科研,张孝,王珊. 大数据集成中确定数据准确属性值的WR方法[J]. 计算机研究与发展, 2016, 53(2): 449-458. |
[3] | 李默涵,李建中. 数据时效性修复问题的求解算法[J]. 计算机研究与发展, 2015, 52(9): 1992-2001. |
[4] | 余伟,李石君,杨莎,胡亚慧,刘晶,丁永刚,王骞. Web大数据环境下的不一致跨源数据发现[J]. 计算机研究与发展, 2015, 52(2): 295-308. |
[5] | 苗东菁,刘显敏,李建中. 概率数据库中近似函数依赖挖掘算法[J]. 计算机研究与发展, 2015, 52(12): 2857-2865. |
[6] | 贾存鑫 胡 伟 柏文阳 瞿裕忠. SMap:基于语义的关系数据库模式与OWL本体间映射方法[J]. , 2012, 49(10): 2241-2250. |
[7] | 瞿裕忠 胡 伟 郑东栋 仲新宇. 关系数据库模式和本体间映射的研究综述[J]. , 2008, 45(2): 300-309. |
[8] | 叶小平. 基于时态变量对象关系模型及代数运算[J]. , 2007, 44(11): 1971-1979. |
PDF全文下载地址:
https://crad.ict.ac.cn/CN/article/downloadArticleFile.do?attachType=PDF&id=3716