删除或更新信息,请邮件至freekaoyan#163.com(#换成@)

信息学院多位师生赴美国参加数据库领域顶会VLDB并作报告

本站小编 Free考研/2020-04-16

信息学院数据库与智能信息检索实验室(DBIIR)师生在数据库领域顶级会议VLDB上发表3篇论文,其中,实验室陈跃国教授、卢卫副教授、博士生赵展浩、硕士生韩雪冉受邀到美国加州洛杉矶进行学术报告。

VLDB 会议是国际公认的数据管理与数据库领域顶尖的三大学术会议(SIGMOD、VLDB、ICDE)之一,旨在展示和推广领域内最新的研究成果和核心科技。自1975年开办至今,VLDB会议已经成功举办了45届,每年的VLDB都能在全球范围内吸引到大量优秀的研究人员、企业代表以及行业精英到场参会。根据大会官方公布,今年VLDB共接收了128篇Research Paper、22篇Industry Paper和48个Demo。其中,杜小勇教授领导的数据库与智能信息检索实验室共发表了一篇Research paper、一篇Industry paper、和一篇Demo paper。
今年VLDB Research Paper投稿677篇,共收录了128篇,录用率18.9%,竞争十分激烈。今年中国人民大学投稿并被收录的Research Paper是关于大规模数据集标注方法的研究,为了提高机器学习和数据挖掘等技术对数据的处理能力,需要快速对海量数据进行高质量的标注。但是现有的大规模数据集标注方法要么成本高昂,要么标签质量不高。为解决这一问题,论文提出了一种具有成本效益的数据标注方法,并侧重于标注规则的生成问题,该问题旨在生成高质量的标注规则,从而在保持质量的同时大幅降低标注成本。
论文研究提出了一种具有成本效益的数据标注方法CrowdGame,不同于与以往的元组级标注方法,论文引入了标注规则来降低标注成本,同时保持很高的数据标注质量。论文设计了一种基于博弈思想的众包方法,将一组未标记的数据元组作为输入,并通过以下两个阶段对它们进行标注。第一阶段是规则生成阶段,首先生成候选规则,然后利用基于博弈的众包方法CrowdGame,来选择高覆盖率、高准确率的规则。CrowdGame雇佣了两组众包工人:一组回答规则验证任务,以发挥规则生成器的作用,而另一组则回答元组检查任务,以发挥规则检查器的作用。论文提出了一种minimax优化方法,用于在双人博弈中统一规则生成器和规则检查器。在第二阶段,论文用上一阶段生成的规则来标注元祖数据。论文利用四个真实数据集,在实体匹配和关系提取两个任务上进行了丰富的实验,实验结果显示论文方法的性能优势。

(陈跃国教授在VLDB大会做分组报告)
今年的Industrial track paper主要来自Google、Microsoft、IBM、Amazon、Facebook、SAP、eBay,以及国内的腾讯、阿里巴巴、蚂蚁金服、华为等企业。中国人民大学与腾讯于2017年起,依托于中国人民大学数据工程与知识工程教育部重点实验室的多年学术积累和腾讯TEG计费平台部丰富的实战经验,在数据库前沿研究领域开展了深入合作,研究成果已经连续两年入选国际顶级会议VLDB。继去年在VLDB2018上通过DEMO论文展示了合作成果MSQL+后(基于TDSQL的插件式近似查询工具。
今年中国人民大学与腾讯的最新联合研究成果“A Lightweight and Efficient Temporal Database Management System in TDSQL”成功被VLDB2019 Industry Track接收并将通过长文形式发表。该研究成果由中国人民大学数据工程与知识工程教育部重点实验室与腾讯TEG计费平台部TDSQL数据库团队深度合作完成。论文介绍了一款基于腾讯分布式数据库管理系统TDSQL扩展而来的全时态数据库系统,该系统在保证OLTP性能的前提下,提供了轻量级的全时态数据管理功能和全时态数据的事务处理能力、以及集当前态数据于生产系统集历史态数据于分析型系统的集群架构,构成了全时态数据的完备解决方案。
Q&A环节,现场观众对数据迁移、历史数据的清理策略和维护周期提出问题并展开讨论。会议期间,卢卫老师、赵展浩分别对项目研究成果进行了分组报告和poster展示。

(卢卫副教授在VLDB大会做分组报告)

(赵展浩同学在VLDB大会作Poster展示)
论文介绍了在知识图谱中面向实体的探索性搜索系统,它不仅可以返回用户的查询结果集,还可以通过呈现相似实体和其相关的语义特征(sematic feature)作为探索的指针,让用户通过对界面的操作来进一步对知识图谱进行探索。在检索过程中,我们使用了混合语言模型作为信息检索引擎,将返回查询的top-k个结果实体作为答案。在探索过程中,我们使用一种基于sematic feature的推荐引擎来推荐相关的实体和相关的语义信息以作为下一步探索的探索指针。此外用户可以通过对界面进行简单的操作来查看结果的详细信息或者进行实体领域的跳转,这样既可以让用户在检索过程中动态的重构查询也可以满足用户对不同领域实体的信息需求。

(韩雪冉同学在VLDB大会作Poster展示)
相关话题/数据 论文

  • 领限时大额优惠券,享本站正版考研考试资料!
    大额优惠券
    优惠券领取后72小时内有效,10万种最新考研考试考证类电子打印资料任你选。涵盖全国500余所院校考研专业课、200多种职业资格考试、1100多种经典教材,产品类型包含电子书、题库、全套资料以及视频,无论您是考研复习、考证刷题,还是考前冲刺等,不同类型的产品可满足您学习上的不同需求。 ...
    本站小编 Free壹佰分学习网 2022-09-19
  • 信息学院举办2019年度VLDB超大规模数据库暑期学校
    7月22日,由中国计算机学会(CCF)数据库专业委员会、超大规模数据库VeryLargeDataBases(以下简称VLDB)中国数据库学院主办,中国人民大学信息学院与数据工程与知识工程教育部重点实验室承办的2019年度VLDB暑期学校(VLDBSummerSchool2019)在中国人民大学信息楼 ...
    本站小编 Free考研 2020-04-16
  • 安小米团队出席国际电联电信标准化局物联网与智慧城市及社区数据处理和管理焦点组会议
    日内瓦当地时间7月15日-19日,第八次国际电联电信标准化局(ITU-T)物联网和智慧城市及社区(SC&C)数据处理与管理焦点组(FG-DPM)会议在瑞士日内瓦ITU总部召开。来自中国、韩国、瑞士、法国、英国、丹麦、意大利、日本、阿联酋、美国等12个国家的32位专家****出席了本次会议,探讨物联网 ...
    本站小编 Free考研 2020-04-16
  • 中国人民大学商学院-慧科集团数据科学思维训练营举办
    7月7日,由中国人民大学商学院联合慧科集团开发的学生个性化培养计划——“数据科学思维训练营”结营仪式举办。中国人民大学商学院院长毛基业,慧科集团共同创始人、CEO岳喜伟,中国人民大学商学院副院长刘晓梅,中国人民大学教务处副处长赵晓宇,慧科集团合伙人、副总裁、新商科产业学院院长杜海震,中国人民大学商学 ...
    本站小编 Free考研 2020-04-16
  • 劳动人事学院“顶级国际期刊论文发表”工作坊举办
    6月15-17日,中国人民大学劳动人事学院“一流学科共建”工作坊系列第三期举办,主题为“顶级国际期刊论文发表”。主讲嘉宾彼得·班伯格(PeterBamberger)为以色列特拉维夫大学Coller管理学院副院长兼美国康奈尔大学教授,现为美国管理学会(AOM)旗下期刊《美国管理学会探新》(Academ ...
    本站小编 Free考研 2020-04-16
  • 中国人民大学举行2019京港大学生大数据建模竞赛
    6月1-4日,2019京港大学生大数据建模竞赛在中国人民大学举行。本次竞赛由中国人民大学统计学院和香港城市大学管理科学系主办,共选拔了来自香港城市大学和中国人民大学的34名同学参加。本次建模竞赛旨在以问题为引导,以合作为基础,培养学生灵活应用所学知识进行大数据分析的能力。来自香港城市大学和中国人民大 ...
    本站小编 Free考研 2020-04-16
  • 安小米教授参加2019中国国际大数据产业博览会专业论坛并作主题发言
    5月26-29日,中国国际大数据产业博览会在贵州省贵阳市举办。本届数博会围绕年度主题“创新发展数说未来”,开展高端对话、专业论坛、成果发布、展览与大赛等系列活动,为国内外产业领袖和学界精英探讨大数据技术创新、数字经济发展、数据安全保障和数字生态体系建设等重要议题提供交流和共享新视野、新思维、新理论和 ...
    本站小编 Free考研 2020-04-16
  • 劳动人事学院主办管理学研究设计与国际论文发表工作坊
    5月25-27日,由中国人民大学劳动人事学院人力资源管理系开展的“一流学科共建”工作坊系列第二期工作坊在求是楼举办,主题是“管理学研究设计与国际论文发表工作坊”,主讲嘉宾是英国杜伦大学商学院教授管延军。劳动人事学院人力资源管理系教授徐世勇主持工作坊并介绍了管延军学术成就以及他曾在劳人院的工作经历。来 ...
    本站小编 Free考研 2020-04-16
  • 中国人民大学通识教育大讲堂——数据科学讲坛第六期举办
    5月22日下午,中国人民大学通识教育大讲堂——数据科学讲坛第六期举办。中国科学院生物物理研究所核酸生物学院重点实验室学术委员会主任、研究员、博士生导师陈润生院士受邀作题为“基因组、大数据、精准医学与人工智能”的主题报告。统计学院院长王晓军、医学与生物统计教研室主任许王莉,教授易丹辉,副教授王瑜与会。 ...
    本站小编 Free考研 2020-04-16
  • “数据库系统概论”MOOC建设与应用第五届研讨会举办
    5月11日,“数据库系统概论”MOOC建设与应用第五届研讨会在江西财经大学举办。来自中国人民大学、北京大学、北京理工大学、山东大学、西北工业大学、东北大学、厦门大学等国内80余所高校的120余位数据库教学一线的教师参加了本次会议。本次会议的主题是“混合式教学”,围绕大学本科计算机及相关专业数据库课程 ...
    本站小编 Free考研 2020-04-16
  • 外国语学院研究生宋子灵获北外第十三届首都高校研究生论坛优秀论文奖
    5月11日,北京外国语大学英语学院第十三届首都高校研究生学术研讨会在北京外国语大学召开。此次论坛由北京外国语大学英语学院主办,面向首都及周边高校文学、语言学、国别研究和翻译学方向在读硕士及博士研究生,最后通过各高校老师评委的匿名遴选,共计四十余篇论文入选。中国人民大学外国语学院德语系2018级研究生 ...
    本站小编 Free考研 2020-04-16