删除或更新信息,请邮件至freekaoyan#163.com(#换成@)

从两亿像素实例起步的可穿戴技术创新

本站小编 Free考研考试/2021-12-20

从两亿像素实例起步的可穿戴技术创新
——记全国“挑战杯”特等奖作品作者李诚的“挑战”之路
学通社记者 王泰华 徐迟馨 秦雅琛
  如今,在人工智能中,“可穿戴技术”综合运用于多媒体、传感器和无线通信等高新科技产品中,并将这些技术嵌入到人们可以直接穿在身上的衣着、配饰中,成为可穿戴设备,并由使用者利用手势、眼动等方式进行操作和交互。这类可穿戴设备往往都会配备一个用户佩戴在头顶向前下方进行拍摄的摄像头,称之为第一人称摄像头,通过摄像头进行手部的检测识别,从而实现人机交互。手部检测需通过算法判断不同环境下哪里是手,但由于皮肤所反射的颜色往往随着光照条件改变等环境的变化快速改变,因此手部检测成为可穿戴技术发展中亟待解决的一大难关。

图为李诚在全国“挑战杯”比赛现场介绍展示自己的作品。
  在不久前落幕的第十三届“挑战杯”全国大学生课外学术科技作品竞赛(以下简称“全国‘挑战杯’”)中,清华选送的作品《多光照环境下的第一人称手部检测》荣获特等奖,该作品利用模型推荐系统等手段研究富有挑战的图像识别问题,将利用第一人称摄像头进行手部检测的准确率提高了10%-15%,相关成果也被卡内基梅隆大学、佐治亚理工学院、谷歌公司、夏普美国研究所等高校或研究机构采用。而完成该项目的团队只有一个年轻成员——清华大学物理系2009级本科生李诚。
走错教室入对了行
  李诚的科研之路起步得较早。小学六年级的时候,当同龄人尚在为纸上的数学题烦恼,机缘巧合之下他已经开始在电脑上接触编程,“小学六年级报了一个奥数班,但第一次去上课的时候不小心走错了教室,教室里正好在讲编程课,里面都是些比我大几岁的学生。我听着听着觉得挺有意思,也就这样学下去了。”
  凭借对课外科技的浓厚兴趣和扎实的编程知识,李诚在信息技术上的钻研愈发深入。他初中便开始做机器人,并参加了“乐高”足球机器人比赛,他用乐高编程模块编写的程序控制由积木搭成的小车,在场上与另外三台车对一个球进行角逐。
  2009年,李诚凭借在科技竞赛中的优秀表现被保送进入清华大学,学校里丰富的科研资源让李诚有更多的平台和机会发展自己的兴趣特长。大三暑假,在校团委“本科生暑期海外研修计划”的支持下,李诚前往卡内基梅隆大学进行暑期研修。在那里,李诚认识了一位美籍日裔博士后,这位博士后正在进行可穿戴设备方面的第一人称物品识别研究。巧合的是,早在几年前,尚在读高中的李诚就通过TED网站上一位印度工程师的演讲了解了“可穿戴设备”这个概念并萌生了初步的兴趣,两人一拍即合,在他的建议和鼓励下,李诚开始了第一人称手部检测的探索与研究。
课外学术讨论激发出的创造性思维
  为了解决光照等情况下手部识别的问题,李诚查阅了前人在计算机视觉领域的研究后,仍然感到毫无头绪。“这时我想到了曾经在‘星火班’学术讨论时,听说过的‘模型推荐’的概念。”李诚介绍道,大二时他入选了“科技创新,星火燎原”清华大学学生创新人才培养计划(简称“星火班”),在“星火班”中他找到了许多和他一样对课外学术科技充满探索兴趣的伙伴们,并经常就不同领域的问题进行学术讨论和交流,“‘模型推荐’是数据挖掘领域****的研究热点,但还没有运用到计算机视觉领域。”抱着试一试的想法,李诚引入了模型推荐系统,并结合特征选择和时空马尔可夫场滤波的方法,最终有效解决了第一人称手部检测的准确率问题。这一创造性的想法,就连计算机视觉三大顶级国际会议中的国际计算机视觉大会(ICCV)的审稿人都啧啧称赞:“用模型推荐系统来解决手部检测问题是非常有趣,新颖而直观的。”

图为对比图。
  对于模型推荐系统的说明,李诚用准备GRE试题的例子类比道:“像准备GRE考试时会有人总结一些‘秘籍’,如在什么情况下最好选什么选项,这样考试就有一定准确率。手部检测也是有训练视频的,训练完之后就知道什么情况下出现的是手了,但是训练视频很长、很麻烦,模型推荐系统就是把视频切开来,每个房间用一个模型,像科目分开学一样,每个情况分开讨论,这样出现一个新的问题大致判断是什么情况下的,就用这个情况下的结果。”
勤奋而快乐的科技探索
  当然,仅仅有创意也是不够的,还需要大量基础性的数据采集工作,李诚首先建立了一个标定过的有两亿多个像素实例、覆盖了各种不同光照环境下的手部照片的室内/室外第一人称手部识别数据集。利用这个数据集以及其他研究者发布的数据集,李诚对较为常用的底层特征进行了测试。他提出了一个基于稀疏特征选择,以及依赖于全局特征的结构化判断方案。对于许多人来说这项工作是枯燥的,对李诚则不然,他具备将工作和快乐画上等号的能力和心态。
  “一张图片就好几万个像素,总共几百张图片的样子吧,我的工作就是一张图过来以后我把它上面的手给涂出来。这一过程看起来很辛苦,但是也可能没有想象中的那么枯燥。李诚笑谈道,“当时我是选了《爱情公寓》这部电视剧作为手部识别数据集的素材,我用三天时间就看完了这部其他人用一个月甚至几个月才看完的电视剧。当然与其他人还有点不同,我看这部电视剧是要把里面的许多场景的许多手都一点点给标记出来,用以收集数据,而不是关注其本身的剧情。”
  有的程序要运行很长时间甚至两三天,李诚也会“忙里偷闲”,上午整理代码,下午让程序在服务器上运行,他可以整个下午出去打球。“我在卡内基梅隆大学的暑假还是很开心的。科研,也可以轻松愉快。”
  由于有时摄像机的移动速度过快,考虑到时间与空间的连续性信息,在之后处理过程,李诚采用了时空马尔科夫场滤波的算法,有效解决了这一问题。这些核心技术的巧妙运用,使得李诚的模型准确率领先于包括乔治亚理工、加州大学欧文分校在内的美国其他大学提出的几种主流模型。
功夫不负有心人
  利用在卡内基梅隆大学的一个寒假和一个暑假,李诚完成了第一人称手部检测的研究工作,他的成果也很快得到了同行专家的认可。李诚以第一作者分别在两个计算机视觉领域的顶尖学术会议CVPR2013(IEEE Conference on Computer Vision and Pattern Recognition)和ICCV2013(IEEE International Conference on Computer Vision)上发表论文2篇。该项目相关代码、数据集也已加入到谷歌公司的手部检测项目中并且即将加入目前应用最广泛的机器视觉开源库OpenCV的最新版本OpenCV3.0中。中国科学院院士张钹对项目予以了充分肯定,并评价道:“具有很高的研究水平和很好的推广前景”。
  这样一个充满创意的作品,却差点与“挑战杯”擦肩而过。在清华校内“挑战杯”上,《多光照环境下的第一人称手部检测》项目仅仅获得了三等奖。“在选拔全国‘挑战杯’参赛作品时,系团委向校团委推荐说,这里还有一件很牛的作品,我就被报上去了。” 李诚笑言。这件作品很快得到了专家们的一致肯定,并代表清华大学参加全国“挑战杯”。最终作品获得“挑战杯”信息技术类特等奖,回忆捧杯的那一瞬间,李诚说:“我的感受就是,功夫不负有心人,辛苦得到了回报。”
  “我会在北京创业,”谈到未来,李诚信心满满,“我已经开始和人洽谈,仍然会从事计算机视觉领域的产品研发。”从科研到创业,对李诚来说,变的是身旁纷繁的世界,不变的是那颗始终渴望挑战、追求卓越的心。
  (清华新闻网11月22日电
  编辑:襄桦 范丽
2013年11月22日 09:00:52


相关话题/推荐 视觉 数据 计算机 系统

  • 领限时大额优惠券,享本站正版考研考试资料!
    大额优惠券
    优惠券领取后72小时内有效,10万种最新考研考试考证类电子打印资料任你选。涵盖全国500余所院校考研专业课、200多种职业资格考试、1100多种经典教材,产品类型包含电子书、题库、全套资料以及视频,无论您是考研复习、考证刷题,还是考前冲刺等,不同类型的产品可满足您学习上的不同需求。 ...
    本站小编 Free壹佰分学习网 2022-09-19
  • 清华教授研制的人脸识别技术与系统通过鉴定
    清华教授主持研制的TH-IDvs视频监控人脸识别技术与系统通过鉴定清华新闻网11月14日电11月12日,受教育部委托,清华大学在北京主持召开了由清华大学电子系教授丁晓青主持研制、清华大学和北京海鑫科金高技术股份有限公司共同完成的TH-IDvs视频监控人脸识别技术与系统项目 ...
    本站小编 Free考研考试 2021-12-20
  • 清华大学神经系统弥漫中线胶质瘤多学科团队启动仪式举行
    清华新闻网8月3日电7月27日下午,清华大学神经系统弥漫中线胶质瘤多学科团队启动仪式在生物医学馆举行。常务副校长王希勤出席并讲话。王希勤讲话王希勤表示,此次成立神经系统弥漫中线胶质瘤多学科团队,为清华大学基础医学和临床医学打通壁垒、深度交叉融合开辟了先例,具有深远意义。基础医学善于从特殊性出发探寻一 ...
    本站小编 Free考研考试 2021-12-20
  • 清华智能产业研究院刘云新斩获国际计算机学会移动系统、应用和服务国际会议(Mobisys)2021 最佳论文奖
    清华新闻网7月14日电7月7日,清华大学国强教授、智能产业研究院(AIR)首席研究员刘云新教授与微软亚洲研究院****合作完成的论文“nn-Meter:精准预测深度学习模型在边缘设备上的推理延迟”(nn-Meter:towardsaccuratelatencypredictionofdeep-lea ...
    本站小编 Free考研考试 2021-12-20
  • 清华大学联合研制的国际首套输电线路全景智能监测系统成功投运
    清华新闻网6月16日电6月10日,在云南香格里拉的500千伏建太甲线输电网上,技术人员完成了集成传感系统带电安装,并在云端平台上成功收集到导线电流、温度等监测数据。这标志着由清华大学电机系及清华四川能源互联网研究院与南方电网数字电网研究院联合研发的国际首套输电线路全景智能监测系统成功投运。中央电视台 ...
    本站小编 Free考研考试 2021-12-20
  • 王祥珩团队:交流电机系统分析理论和技术的新突破
    王祥珩教授等完成的交流电机系统的多回路分析技术及应用项目获2012年度国家技术发明奖二等奖交流电机系统分析理论和技术的新突破记者赵姝婧  在清华大学2012年度国家科技奖获奖成果中,有一个获奖项目跟其他相比颇有不同:项目的第一、第二完成人皆是清华大学的退休老教授,他们在退 ...
    本站小编 Free考研考试 2021-12-20
  • 软件学院学生在数据管理国际会议SIGMOD程序竞赛中喜获佳绩
    清华新闻网5月21日电5月17日,数据管理领域国际顶级学术会议ACMSIGMOD程序竞赛结果公布,清华大学软件学院3名研究生梅逸男、王浩宇、赵东明组成的参赛队伍(UKN)获得了第2名的好成绩,带队教师为宋韶旭副教授。本次大会程序竞赛由微软、华为与巨杉数据库赞助,共有27支队伍参加,分别来自清华大学、 ...
    本站小编 Free考研考试 2021-12-20
  • 彭凯平:大数据研究促进中国积极心理学发展
    大数据研究促进中国积极心理学发展清华心理学系主任彭凯平教授在第四届澳大利亚积极心理学与幸福科学大会上作主题报告  清华新闻网2月17日电2月8日至10日,清华大学心理系主任彭凯平教授应邀参加第四届澳大利亚积极心理学与幸福科学大会。作为特邀嘉宾,彭凯平教授作了题为《积极心理学在中国》的主题报告,重点介 ...
    本站小编 Free考研考试 2021-12-20
  • 电机系教授康重庆获IEEE PES罗伊·比林顿电力系统可靠性奖
    清华新闻网5月14日电近日,电气与电子工程师协会(InstituteofElectricalandElectronicsEngineers,IEEE)电力与能源学会(Power&EnergySociety,PES)揭晓了2021年度学会大奖(PESSociety-LevelAwards)。清华大学电 ...
    本站小编 Free考研考试 2021-12-20
  • 清华计算机系创办的《计算可视媒体》英文期刊被SCIE收录
    清华新闻网5月10日电4月29日,清华大学计算机系创办的《计算可视媒体》(ComputationalVisualMedia,CVMJ)期刊被WebofScience的SCIE(SCIExpanded)数据库收录。《计算可视媒体》《计算可视媒体》是清华大学计算机系于2015年创办的英文学术期刊,由清华 ...
    本站小编 Free考研考试 2021-12-20
  • 经管学院院庆系列论坛聚焦大数据时代商业模式创新
    经管学院思想引领院庆系列学术论坛聚焦大数据时代的商业模式创新  清华新闻网3月25日电(通讯员吴邦刚)3月23日,清华大学经济管理学院建院30周年思想引领系列学术论坛:大数据时代的商业模式创新在清华经管学院舜德楼举行。图 ...
    本站小编 Free考研考试 2021-12-20