近日,软件所智能软件研究中心在人工智能基础理论方面取得进展,在树形神经网络、风格迁移模型、小目标计数具体问题上提出了新的解决方案。相关研究成果发表在人工智能领域国际顶级会议CVPR 2020、ECCV 2020、ACM MM2020上,并受邀完成了线上学术报告,相关代码已经开源,供国内外研究人员参考。
以下是具体工作的简介:
(1)注意力卷积二叉神经树
细粒度分类目的是对粗粒度的大类别进行更加细致的子类划分,通常情况下,细粒度数据集中预先给定的标注往往依赖于专业人工标注,需要专业的领域知识,所以标注的数量很少并且很难获得。由于关键的判别力区域散布在细小区域,需要网络进行定位的工作,而现有大多数的网络将定位的工作与识别整合在一起,网络缺乏捕获判别力区域的能力。因此,亟待寻求能够学习有效特征和区分难易特征的方法。
针对这一问题,团队将卷积神经网络与软决策树策略相结合,提出一种二分类深度神经树的细粒度图像识别模型,该模型包括主干模型(backbone)、路由(router)、转换(transformer)、预测(predictor)四种模块构成。在特征提取的主干网络上,团队选取VGG-16作为团队的特征提取器,这一部分包括了VGG-16的conv1 - conv5的部分卷积层。在浅层利用路由进行二分类的预测输出,将图像预先做粗粒度分类,随着树的深度增加,类别的区分范围不断缩小,并在叶子节点处进行最终类别的输出。借助这种由粗分逐渐到细分的方法,团队在神经树的边上构造了由卷积算子构成的变换模块,在不同的分支上利用卷积网络进行特征学习,定位出具有判别力的区域特征,使每个叶子节点上的预测器测重关注图像不同的区域。为了加强不同分支对图像多尺度特征的提取,团队采取了非对称的策略,来安排转换模块在不同分支上的数量,而不同的分支之间起到了相互补充与促进特征学习的作用。在预测阶段,团队利用路由模块预测值的累积作为该路径被选择的概率,相应的叶子节点的输出则是该类别的预测概率分布。
实验结果显示在CUB-200-2011,Stanford Cars 和 Aircraft数据集上,基于深度神经树的细粒度识别模型显著优于当前其他的弱监督细粒度方法。
相关成果以Attention Convolutional Binary Neural Tree for Fine-Grained Visual Categorization为题被 CVPR 2020收录,团队已将代码开源公布:https://isrc.iscas.ac.cn/gitlab/research/acnet
卷积二叉神经树模型
(2)语义神经树
现有的人体解析方法往往忽略了人体结构中各部位之间固有的语义关系,把这种细粒度的分割任务看作常规的语义分割,这样的操作往往容易引起细小部位分割错误。另一方面,人体部位之间的尺度也存在着相当大的差异,如人的双脚或袜子等一般在图像中占有很小的比例甚至在图像中不出现。
为了解决这个问题,团队提出了一种基于深度神经树来学习语义特征,多叉深度神经解析树采用了一种层次关系,在浅层中团队先把图像中的前景与背景进行识别,利用产生的掩码信息作用在输入数据上,产生新的前景信息将输送到下一层模块处理,在不同的层级上团队会将相应的部位识别并分割出来。另外团队构造了融合模块用来收集在不同的层级产生的结果,并将结果进一步优化调整,产生最终的分割预测结果。
多叉神经语义解析树利用随机梯度下降(SGD)方法以端到端的方式进行训练整个模型,具有收敛速度快,性能稳定的特点。在四个具有挑战性的数据集上进行的单人和多人解析实验,即 LIP,PASCAL-Person-Part,CIHP和 MHPv2 ,均证明了该方法的有效性。
相关成果以Learning Semantic Neural Tree for Human Parsing为题被ECCV 2020收录,团队已将代码开源公布:https://isrc.iscas.ac.cn/gitlab/research/sematree
基于语义神经树的人体解析模型
(3)无监督域适应的空间注意金字塔网络
域适应是解决目标域和源域数据分部有显著差异的问题,巧妙地进行迁移转化能够显著改善在目标域的实际使用效果。
针对这些问题,团队提出了空间注意力金字塔机制,将域转换的注意力集中在与任务相关的特定区域。此方法将特征图用不同大小的窗口来提取均值特征,获得特征金字塔,然后用软注意力机制在不同金字塔特征之间的动态选择,来指导最终的域转换。
实验结果显示,提出的方法在多个任务(目标检测、实例分割、语义分割)中均取得领先的效果。
相关成果以Spatial Attention Pyramid Network for Unsupervised Domain Adaptation为题被ECCV 2020收录,团队已将代码开源公布:https://isrc.iscas.ac.cn/gitlab/research/domain-adaption
空间注意金字塔网络
(4)用于无人机目标检测和计数的引导注意力网络
一直以来,检测和计数都是人工智能的基础问题,在无人机场景中,由于目标小、背景杂乱等复杂因素影响,通过无人机采集视频进行目标检测和计数具有极大的挑战。
针对复杂场景的小目标检测和计数问题,团队设计了一种新的基于特征金字塔的注意力网络来处理目标检测和计数任务,与以往依赖于无监督注意模块的方法不同,团队充分利用了背景和目标之间的弱监督信息,融合不同尺度的特征图,获得更语义化的特征表示。同时,前景模块考虑了全局和局部外观的目标,以方便准确定位。
团队设计了新的数据增强策略,用于在各种复杂场景下训练鲁棒模型。在三个具有挑战性的数据集(UAVDT, CARPK和PUCPR+)上显示了算法先进的检测和计数性能。
相关成果以Guided Attention Network for Object Detection and Counting on Drones为题被ACM MM 2020收录,团队已将代码开源公布:https://isrc.iscas.ac.cn/gitlab/research/ganet
基于引导注意力机制的无人机检测和计数模型
以上成果论文的通讯作者为软件所副研究员张立波,研究工作得到中科院青年创新促进会、软件所优秀青年科技人才计划支持。
删除或更新信息,请邮件至freekaoyan#163.com(#换成@)
软件所在智能理论研究方面取得进展
本站小编 Free考研考试/2022-01-02
相关话题/神经 网络 图像 数据 代码
软件所自主研发安捷(Agilor)实时数据库系统
安捷(Agilor)实时数据库系统是由中国科学院软件研究所研发的具有完全自主知识产权的大型分布式实时数据库系统。安捷数据库系统能够通过毫秒级的数据采集、实时规则推理、复杂事件处理和人机智能融合,采集和存储来自各种控制系统和现场总线的设备状态与生产过程数据,实现海量实时数据的高效存储管理,为企业提供集 ...中科院软件研究所 本站小编 Free考研考试 2022-01-02软件所“澜湄次区域虫媒传染病联防联控平台”入选2021“携手构建网络空间命运共同体实践案例集”
2015年,习近平总书记在第二届世界互联网大会首次提出“构建网络空间命运共同体”理念,深入阐释互联网发展治理“四项原则”、“五点主张”,得到国际社会普遍认同。世界互联网大会将“携手构建网络空间命运共同体”确定为永久主题,并致力于促进各方开展实践探索与交流合作。2021年,世界互联网大会上举行了首次“ ...中科院软件研究所 本站小编 Free考研考试 2022-01-02软件所参与成果 “多模态神经系统疾病智能辅助诊断系统”亮相国家“十三五”科技创新成就展
国家“十三五”科技创新成就展于2021年10月21日至27日在北京展览馆举行。展览以“创新驱动发展迈向科技强国”为主题,体现“创新是引领发展的第一动力”,全面展示“十三五”以来,贯彻落实党中央和国务院关于科技工作的重大决策部署,深入实施创新驱动发展战略、建设创新型国家所取得的重大成就。 中国科学院 ...中科院软件研究所 本站小编 Free考研考试 2022-01-02可持续发展大数据国际研究中心成立 软件所参与研制的“可持续发展大数据平台系统”正式发布
9月6日,可持续发展大数据国际研究中心(International Research Center of Big Data for Sustainable Development Goals-CBAS)成立大会暨2021年可持续发展大数据国际论坛开幕式在北京举行,宣告全球首个以大数据服务联合国203 ...中科院软件研究所 本站小编 Free考研考试 2022-01-02基于多尺度特征融合网络的云和云阴影检测试验
摘要摘要:基于深度学习的高分辨率光学影像云检测过程中,云和云阴影及其边缘细节丢失较为严重,主要原因在于不同尺度空间语义信息特征融合存在不足。针对该问题,本文构建一种基于深度学习的多尺度特征融合网络(Multi-scaleFeatureFusionNetwork,MFFN)的云和云阴影检测方法,该算法 ...中科院大气物理研究所 本站小编 Free考研考试 2022-01-02基于遥感数据光流场的2021年郑州“7·20”特大暴雨动力条件和水凝物输送特征分析
摘要摘要:本文针对2021年7月20日河南省郑州市发生的“7·20”特大暴雨天气过程,主要基于FY-4A静止气象卫星成像仪和地基天气雷达遥感数据,利用光流法分别计算遥感数据图像的光流场(OpticalFlowField)。经与FNL数据水平风和地面风速观测对比表明,气象卫星和雷达光流场可以近似反映大 ...中科院大气物理研究所 本站小编 Free考研考试 2022-01-02基于多源陆面通量数据相融合的新资料及其在中国夏季风影响过渡区的应用
摘要摘要:夏季风影响过渡区是陆面能量交换与区域气候相互作用显著的热点区域。然而,目前缺乏适用于该区域的高精度长期通量数据集,这限制了陆面水热交换与气候相互作用的研究。如何融合目前已有的多源通量资料进行重构建以及应用显得十分必要。本研究综合包括中国北方协同观测试验和中国通量网的多种下垫面通量观测以及多 ...中科院大气物理研究所 本站小编 Free考研考试 2022-01-02基于京津冀高密度地面观测网络的大气污染物浓度地面观测代表性误差估计
摘要摘要:地面观测提供空间点的浓度信息,三维化学模式提供网格面的浓度信息,两者在进行对比验证或同化融合时会因为空间尺度不匹配引入误差,即观测代表性误差。本研究将大气污染地面国控监测站与区县监测站结合起来,获得了京津冀地区高密度地面观测数据,利用该数据首次对京津冀地区6项常规大气污染物(PM2.5、P ...中科院大气物理研究所 本站小编 Free考研考试 2022-01-02利用辐射数据构建云物理结构
摘要摘要:本文运用CloudSat卫星上搭载的雷达探测数据和AQUA卫星搭载的辐射光谱仪探测数据,选择2007年1月至2010年12月期间,地理位置位于(15°~45°N,145°~165°E)区域内(远海)发生的云场数据开展分析,研究云的物理结构特征与其光谱辐射特性的相互关系。不同光谱波段对云物理 ...中科院大气物理研究所 本站小编 Free考研考试 2022-01-02SD: 一套适用于未来气候变化动力降尺度预估的CMIP6多模式集合误差订正数据
基于区域气候模式的动力降尺度方法,是获取未来高分辨率天气气候信息的重要途径。然而,在传统的动力降尺度模拟过程中,全球模式的误差会传递到区域模式中,从而降低降尺度模拟的可信度。因此,在动力降尺度模拟之前,对全球模式系统误差进行订正,已逐渐成为国际上一个热点研究领域。 最近,中国科学院大气物理研究所的 ...中科院大气物理研究所 本站小编 Free考研考试 2022-01-02