一种优化关系型溯源信息存储的新方法
外文标题:An Approach for Optimizing Relational Provenance Storage
文献类型:期刊
作者:王黎维[1]
机构:武汉大学国际软件学院 武汉430072;新加坡国立大学计算机学院 新加坡117417;昆士兰大学信息技术与电子工程学院 澳大利亚4072;昆士兰大学信息技术与电子工程学院 澳大利亚4072;数据工程与知识工程教育部重点实验室(中国人民大学)北京100872
通讯作者:Zhou, X.-F.(zxf@uq.edu.au)
年:2011
期刊名称:计算机学报
卷:34
期:10
页码范围:1863-1875
增刊:增刊
收录情况:EI(20114614525071)
所属部门:数据工程与知识工程教育部重点实验室
语言:中文
ISSN:0254-4164
链接地址:http://d.g.wanfangdata.com.cn/Periodical_jsjxb201110012.aspx
DOI:10.3724/SP.J.1016.2011.01863
基金:教育部博士点新教师基金; 澳洲研究院(ARC)项目基金
关键词:溯源树;溯源表;存储优化;最优削剪;规则I&II削剪
摘要:现代数据管理必须处理来源不同、质量各异的数据,因此从系统层面支持数据溯源,让用户了解数据的来源及派生过程成为当前至关重要的一个研究课题.基于标注的方法是支持数据溯源的基本方法之一.这种方法的主要问题是存储空间开销,因为溯源信息可能会超过实际数据的大小.在该文中,作者提出了一个用与查询结构匹配的溯源树来表达和存储溯源信息从而避免数据派生过程中冗余存储的基本框架.基于这个框架,作者提出了一系列针对关系型查询的存储优化方法,选择查询树部分节点来存储溯源信息.这些优化算法对于查询大小是多项式时间,对于溯源信息大小是线性时间,在溯源信息的跟踪和优化方面均不会产生巨大的开销.这一框架是数据溯源研究的一个新思路,有着广泛的应用前景.
作者其他论文
一种优化关系型溯源信息存储的新方法.王黎维;鲍芝峰;KOEHLERHenning,等.第28届中国数据库学术会议.2011,1863-1875.
一种优化关系型溯源信息存储的新方法.王黎维;鲍芝峰;KOEHLERHenning,等.第28届中国数据库学术会议论文集中国计算机学会;复旦大学.2011,1863-1875.