删除或更新信息,请邮件至freekaoyan#163.com(#换成@)

一种数据驱动的Wrapper自动生成与维护方法

中国人民大学 辅仁网/2017-06-30

文献详情
一种数据驱动的Wrapper自动生成与维护方法
文献类型:会议
作者:王仲远[1]艾静[2]孟小峰[3]
机构:[1]中国人民大学信息学院 北京 100872
[2]中国人民大学信息学院 北京 100872
[3]中国人民大学信息学院 北京 100872

年:2008
会议名称:第二十五届中国数据库学术会议(NDBC2008)
会议论文集:第二十五届中国数据库学术会议(NDBC2008)论文集
页码范围:276-281
会议地点:桂林
会议开始日期:2008-10-24
所属部门:信息学院
人气指数:3
浏览次数:3
语言:中文
关键词:Deep Web;数据集成;Wrapper自动生成;Wrapper维护;数据驱动;数据项匹配
摘要:Wrapper的生成与维护是Deep Web数据集成中一项非常重要的研究课题。传统的方法通常是通过对网页结构或特征的分析来推导Wrapper,这种方法严重依赖于网站模板,在处理某些网站时可能完全失效.同时,以往研究对于Wrapper的维护问题关注较少.这两个问题导致无法真正实现大规模Deep Web数据集成.提出了一种新颖的数据驱动的Wrapper自动生成与维护方法。这种方法利用同一领域不同网站之间,以及同一网站不同版本之间的语义关系,通过数据项的匹配,来生成和维护Wrapper.该方法没有模板依赖的问题,无需设置阈值.经过大量实验证明,此方法在准确性与适用性上与原有方法相比有较大提高.
作者其他论文



差分隐私保护下一种精确挖掘top-k频繁模式方法.张啸剑;王淼;孟小峰.计算机研究与发展.2014,51(1),104-114.
大规模图数据可达性索引技术:现状与展望.富丽贞;孟小峰.计算机研究与发展.2015,52(1),116-129.
海量高维向量的并行Top-k连接查询.马友忠;慈祥;孟小峰.计算机学报.2015,38(1),86-98.
基于小数据的在线用户兴趣长程演化研究.李勇;孟小峰;刘继,等.计算机研究与发展.2015,779-788.
云数据管理索引技术研究.马友忠;孟小峰.软件学报.2015,26(1),145-166.

相关话题/数据 信息学院 计算机 中国人民大学 北京

  • 领限时大额优惠券,享本站正版考研考试资料!
    大额优惠券
    优惠券领取后72小时内有效,10万种最新考研考试考证类电子打印资料任你选。涵盖全国500余所院校考研专业课、200多种职业资格考试、1100多种经典教材,产品类型包含电子书、题库、全套资料以及视频,无论您是考研复习、考证刷题,还是考前冲刺等,不同类型的产品可满足您学习上的不同需求。 ...
    本站小编 Free壹佰分学习网 2022-09-19
  • 数据流管理系统访问控制策略
    文献详情数据流管理系统访问控制策略文献类型:会议作者:吕宗健[1]陈红[2]杜小勇[3]机构:[1]中国人民大学信息学院数据工程与知识工程教育部重点实验室北京100872[2]中国人民大学信息学院数据工程与知识工程教育部重点实验室北京100872[3]中国人民大学信息学院数据工程与知识工程教育部重点 ...
    中国人民大学 辅仁网 2017-06-30
  • 一种分布式数据集上top-n异常点挖掘的高效算法
    文献详情一种分布式数据集上top-n异常点挖掘的高效算法文献类型:会议作者:张重生[1]冯海军[2]陈红[3]梁思维[4]李翠平[5]机构:[1]中国人民大学信息学院北京100872[2]数据工程与知识工程教育部重点实验室北京100872[3]中国人民大学信息学院北京100872[4]中国人民大学信 ...
    中国人民大学 辅仁网 2017-06-30
  • 北京市社区卫生服务现状研究
    文献详情北京市社区卫生服务现状研究文献类型:会议作者:杨珺[1]机构:[1]四川省攀枝花市劳动保障监察支队,中国人民大学劳动人事学院年:2008会议名称:第三届中国社会保障论坛会议论文集:第三届中国社会保障论坛论文集页码范围:915-923会议地点:北京会议开始日期:2008-11-01所属部门:劳 ...
    中国人民大学 辅仁网 2017-06-30
  • 北京部分社区残疾人社区康复状况调查报告
    文献详情北京部分社区残疾人社区康复状况调查报告文献类型:会议作者:刘亚娟[1]机构:[1]中国人民大学劳动人事学院年:2008会议名称:第三届中国社会保障论坛会议论文集:第三届中国社会保障论坛论文集页码范围:945-959会议地点:北京会议开始日期:2008-11-01所属部门:劳动人事学院人气指数 ...
    中国人民大学 辅仁网 2017-06-30
  • 网络数据库法律问题
    文献详情网络数据库法律问题文献类型:会议作者:朱国华[1]机构:[1]中国人民大学年:2008会议名称:全国科技法制高峰论坛暨中国科学技术法学会成立二十周年纪念大会会议论文集:全国科技法制高峰论坛暨中国科学技术法学会成立二十周年纪念大会论文集页码范围:581-589会议地点:北京会议开始日期:200 ...
    中国人民大学 辅仁网 2017-06-30
  • 北京市大学生择业中的保留工资问题研究--从提高就业概率的视角
    文献详情北京市大学生择业中的保留工资问题研究--从提高就业概率的视角文献类型:会议作者:姚裕群[1]陆义敏[2]机构:[1]中国人民大学劳动人事学院[2]中国人民大学劳动人事学院年:2008会议名称:首届经济增长与就业国际论坛会议论文集:首届经济增长与就业国际论坛论文集页码范围:281-288会议地 ...
    中国人民大学 辅仁网 2017-06-30
  • 中国人民大学商学院实验教学改革与创新
    文献详情中国人民大学商学院实验教学改革与创新文献类型:会议作者:张丽娟[1]机构:[1]中国人民大学商学院年:2008会议名称:北京高教学会实验室工作研究会2008年学术研讨会会议论文集:北京高教学会实验室工作研究会2008年学术研讨会论文集页码范围:157-164会议地点:北京会议开始日期:200 ...
    中国人民大学 辅仁网 2017-06-30
  • ScaMMDB:面向可扩展内存数据库系统的研究
    文献详情ScaMMDB:面向可扩展内存数据库系统的研究文献类型:会议作者:张延松[1]龚玮薇[2]王占伟[3]黄伟[4]胡伟[5]季晓东[6]黄云奎[7]王珊[8]机构:[1]中国人民大学数据工程与知识工程教育部重点实验室北京100872[2]中国人民大学信息学院北京100872[3]中国人民大学数 ...
    中国人民大学 辅仁网 2017-06-30
  • 基于what-if分析的内存数据库存储策略研究
    文献详情基于what-if分析的内存数据库存储策略研究文献类型:会议作者:张延松[1]肖艳芹[2]徐凡[3]周国亮[4]王珊[5]陈红[6]机构:[1]数据工程与知识工程教育部重点实验室(中国人民大学)北京10087中国人民大学信息学院北京10087哈尔滨金融高等专科学校计算机系哈尔滨150030[ ...
    中国人民大学 辅仁网 2017-06-30
  • 中国花生消费趋势研究--以北京和山东地区为例
    文献详情中国花生消费趋势研究--以北京和山东地区为例外文标题:StudyontheConsumptionTrendofPeanutinChina文献类型:期刊作者:张秀青[1]唐忠[2]机构:[1]中国人民大学农业与农村发展学院,中国人民大学农业与农村发展学院北京100872,北京100872[2] ...
    中国人民大学 辅仁网 2017-06-30