基于属性相关度的Web数据库大小估算方法
外文标题:An Attributes Correlation Based Approach for Estimating Size of Web Databases
文献类型:期刊
作者:凌妍妍[1]
机构:[1]中国人民大学信息学院,中国人民大学信息学院,中国人民大学信息学院 北京100872,北京100872,北京100872
[2]中国人民大学信息学院,中国人民大学信息学院,中国人民大学信息学院 北京100872,北京100872,北京100872
[3]中国人民大学信息学院,中国人民大学信息学院,中国人民大学信息学院 北京100872,北京100872,北京100872
通讯作者:Ling, Y.-Y.
年:2008
期刊名称:软件学报
卷:19
期:2
页码范围:224-236
增刊:增刊
收录情况:EI(20081311170339)
所属部门:信息学院
语言:中文
ISSN:1000-9825
链接地址:http://d.g.wanfangdata.com.cn/Periodical_rjxb200802005.aspx
DOI:10.3724/SP.J.1001.2008.00224
人气指数:3
浏览次数:3
基金:国家自然科学基金; 国家高技术研究发展计划(863计划); 新世纪优秀人才支持计划; 北京市自然科学基金
关键词:词频;Web数据库大小估计;属性相关度
摘要:提出了一种基于词频统计的方法以估算Web数据库的规模.通过分析Web数据库查询接口中属性之间的相关度来获取某个属性上的一组随机样本;并对该属性分别提交由前k位高频词形成的试探查询以估算Web数据库中记录的总数.通过在几个真实的Web数据库上进行实验验证,说明该方法可以准确地估算出Web数据库的大小.
作者其他论文
差分隐私保护下一种精确挖掘top-k频繁模式方法.张啸剑;王淼;孟小峰.计算机研究与发展.2014,51(1),104-114.
大规模图数据可达性索引技术:现状与展望.富丽贞;孟小峰.计算机研究与发展.2015,52(1),116-129.
海量高维向量的并行Top-k连接查询.马友忠;慈祥;孟小峰.计算机学报.2015,38(1),86-98.
基于小数据的在线用户兴趣长程演化研究.李勇;孟小峰;刘继,等.计算机研究与发展.2015,779-788.
云数据管理索引技术研究.马友忠;孟小峰.软件学报.2015,26(1),145-166.