删除或更新信息,请邮件至freekaoyan#163.com(#换成@)

通用数据质量评估模型及本体实现

本站小编 Free考研考试/2022-01-01

张晓冉,袁满
(东北石油大学计算机与信息技术学院 黑龙江大庆 163318) (xiaoran9217@163.com)
出版日期: 2018-06-01


基金资助:黑龙江省教育厅科技项目(12531059)

General Data Quality Assessment Model and Ontological Implementation

Zhang Xiaoran, Yuan Man
(School of Computer and Information Technology, Northeast Petroleum University, Daqing, Heilongjiang 163318)
Online: 2018-06-01







摘要/Abstract


摘要: 随着数据科学技术在各个领域的深度应用,作为企业重要资产的数据越发表现出它的价值性与重要性.绝大多数企业结合行业特点开发了数据质量检测系统来解决自身数据质量问题.这些系统的评估模型各有特点,对于数据质量维度的定义也是各有千秋.试图将这些模型与数据质量维度以一种通用的形式来定义,旨在成为企业研发数据质量评估系统的标准.通过分析国内外****在该研究领域取得的成果并结合常年研发数据质量检测与评估系统的经验,首先,提出了一个通用的数据质量检测与评估的数学模型;接着,以此模型为基础,采用本体技术定义了从该通用的数据质量评估数学模型到本体模型映射的转换规则;随后,考虑到多数数据存储在关系数据库中,因此以关系数据模型为例,依据所提出的数学模型和转换规则实现了对数据质量评估本体的抽取与构建,该模型实现了复杂质量规则的定义,具有规范性,实现了对不同来源、不同格式的数据质量进行检测与评估;最后,结合中国石油的油田开发数据质量评估项目进行了系统的实现,验证所提出模型的正确性、科学性、合理性以及可扩充性等.由于所提出的数据质量检测与评估模型与领域无关,所以它具有通用性.






[1]何云华,李梦茹,李红,孙利民,肖珂,杨超. 群智感知应用中基于区块链的激励机制[J]. 计算机研究与发展, 2019, 56(3): 544-554.
[2]周宁南,盛万兴,刘科研,张孝,王珊. 大数据集成中确定数据准确属性值的WR方法[J]. 计算机研究与发展, 2016, 53(2): 449-458.
[3]李默涵,李建中. 数据时效性修复问题的求解算法[J]. 计算机研究与发展, 2015, 52(9): 1992-2001.
[4]余伟,李石君,杨莎,胡亚慧,刘晶,丁永刚,王骞. Web大数据环境下的不一致跨源数据发现[J]. 计算机研究与发展, 2015, 52(2): 295-308.
[5]苗东菁,刘显敏,李建中. 概率数据库中近似函数依赖挖掘算法[J]. 计算机研究与发展, 2015, 52(12): 2857-2865.
[6]贾存鑫 胡 伟 柏文阳 瞿裕忠. SMap:基于语义的关系数据库模式与OWL本体间映射方法[J]. , 2012, 49(10): 2241-2250.
[7]瞿裕忠 胡 伟 郑东栋 仲新宇. 关系数据库模式和本体间映射的研究综述[J]. , 2008, 45(2): 300-309.
[8]叶小平. 基于时态变量对象关系模型及代数运算[J]. , 2007, 44(11): 1971-1979.





PDF全文下载地址:

https://crad.ict.ac.cn/CN/article/downloadArticleFile.do?attachType=PDF&id=3716
相关话题/数据 质量 计算机 系统 数据库

  • 领限时大额优惠券,享本站正版考研考试资料!
    大额优惠券
    优惠券领取后72小时内有效,10万种最新考研考试考证类电子打印资料任你选。涵盖全国500余所院校考研专业课、200多种职业资格考试、1100多种经典教材,产品类型包含电子书、题库、全套资料以及视频,无论您是考研复习、考证刷题,还是考前冲刺等,不同类型的产品可满足您学习上的不同需求。 ...
    本站小编 Free壹佰分学习网 2022-09-19
  • 任务粒化的质量约束感知服务组合
    张以文1,2,崔光明2,严远亭2,赵姝1,2,张燕平1,21(计算智能与信号处理教育部重点实验室(安徽大学)合肥230031);2(安徽大学计算机科学与技术学院合肥230601)(zhangyiwen@ahu.edu.cn)出版日期:2018-06-01基金资助:国家科技支撑计划基金项目(2015B ...
    本站小编 Free考研考试 2022-01-01
  • 面向环境与需求不确定性的系统自适应决策
    杨卓群2,金芝1,31(高可信软件技术教育部重点实验室(北京大学)北京100871);2(中国科学院数学与系统科学研究院数学研究所北京100190);3(北京大学信息科学技术学院软件研究所北京100871)(zhuoqun.y@hotmail.com)出版日期:2018-05-01基金资助:国家“九 ...
    本站小编 Free考研考试 2022-01-01
  • 基于混合编码的FPGA系统配置文件压缩算法
    伍卫国1,2,王超辉1,2,王今雨1,聂世强1,胡壮11(西安交通大学电子与信息工程学院西安710049);2(国家数据广播工程技术研究中心(西安交通大学)西安710049)(wgwu@mail.xjtu.edu.cn)出版日期:2018-05-01基金资助:国家自然科学基金项目(61672423, ...
    本站小编 Free考研考试 2022-01-01
  • 一种支持数据去冗和扩容的多媒体文件云存储系统实现
    汪帅1,2,吕江花2,汪溁鹤2,吴继芳2,马世龙21(中国空间技术研究院北京100086);2(北京航空航天大学计算机学院北京100191)(buaashuai@buaa.edu.cn)出版日期:2018-05-01基金资助:国家自然科学基金项目(61300007)AMultimediaFileCl ...
    本站小编 Free考研考试 2022-01-01
  • 面向数据中心网络的链路故障实时检测即服务
    王军晓1,齐恒1,李克秋1,周晓波21(大连理工大学计算机科学与技术学院辽宁大连116024);2(天津大学计算机科学与技术学院天津300072)(wangjunxiao@mail.dlut.edu.cn)出版日期:2018-04-01基金资助:国家重点研发计划项目(2016YFB1000205); ...
    本站小编 Free考研考试 2022-01-01
  • 基于链路状态数据库的数据中心网络异常检测算法
    许刚1,2,王展1,臧大伟1,安学军11(中国科学院计算技术研究所高性能计算机研究中心北京100190);2(中国科学院大学北京100049)(xugang10@ict.ac.cn)出版日期:2018-04-01基金资助:国家重点研发计划项目(2016YFB0200300);国家自然科学基金项目(6 ...
    本站小编 Free考研考试 2022-01-01
  • 边缘计算应用:传感数据异常实时检测算法
    张琪,胡宇鹏,嵇存,展鹏,李学庆(山东大学计算机科学与技术学院济南250101)(d.steven@sdu.edu.cn)出版日期:2018-03-01基金资助:国家重点研发计划项目(2016YFB1001100);山东省重点研发计划项目(2015GGX101009)EdgeComputingApp ...
    本站小编 Free考研考试 2022-01-01
  • Web使能的物端计算系统
    彭晓晖1,张星洲1,2,王一帆1,2,朝鲁1,21(中国科学院计算技术研究所北京100190);2(中国科学院大学北京100190)(pengxiaohui@ict.ac.cn)出版日期:2018-03-01基金资助:中国科学院率先行动****(Y704061000)We ...
    本站小编 Free考研考试 2022-01-01
  • 2018面向新型硬件的数据管理专题前言
    孟小峰1,陈世敏2,罗琼31(中国人民大学);2(中国科学院计算技术研究所);3(香港科技大学)出版日期:2018-02-01Online:2018-02-01摘要/Abstract摘要:数据特性和硬件特征是高效数据管理的两个关键因素。一方面,随着大数据时代的到来,数据管理系统需要支持越来越海量、高 ...
    本站小编 Free考研考试 2022-01-01
  • 面向大数据处理的基于Spark的异质内存编程框架
    王晨曦1,2,吕方1,4,崔慧敏1,曹婷1,JohnZigman3,庄良吉1,2,冯晓兵1,21(计算机体系结构国家重点实验室(中国科学院计算技术研究所)北京100190);2(中国科学院大学北京100049);3(澳大利亚野外机器人中心(悉尼大学)澳大利亚悉尼2006);4(数学工程与先进计算国家 ...
    本站小编 Free考研考试 2022-01-01