包括深度学习在内的机器学习研究近年来发展迅速,掀起了人工智能领域新一轮热潮,并使人工智能成为大众广泛讨论的议题。机器学习程序,例如谷歌公司的 Alpha Go,在语音分析、围棋、图像识别等方面之所以取得巨大的成功,其中最重要的原因是用来进行模型训练的数据量在不断增大,而且计算性能的快速提高使得可以构建的模型尺寸也在快速增大。大数据的涌现为统计物理应用于这个快速发展领域提供了极好的契机。中国科学院理论物理研究所副研究员张潘博士以统计物理与机器学习这一新兴交叉学科研究前沿为主攻对象,将自旋玻璃理论与消息传递算法用于机器学习中的统计推断和神经网络等理论问题中,取得了可喜的阶段性成果,论文接连发表于物理学顶级刊物 PRX (Physical Review X) 及机器学习顶级国际会议 NIPS (Neural Information Processing Systems), 受到国际国内同行的关注。
在 NIPS 论文 [1] 中,张潘探讨复杂数据的全局结构问题,他的目标是通过谱方法寻找并表征高维数据的全局结构。虽然谱方法(包括谱聚类、主成分析、奇异值分解等等)因为其低复杂度和简洁性在机器学习中被广泛使用,但实际数据通常有很强的稀疏性且包含各种噪声,导致传统的谱方法出现本征向量或者奇异向量的局域化现象而不能很好的描述数据的全局结构。张潘发现可以用刻画波函数局域化的方法来描述谱方法局域化现象,并在此基础上提出了一种基于微扰分析的快速谱算法用于提取稀疏高维数据的重要结构信息,从而克服了谱方法的一个严重瓶颈问题。新的谱方法在测试数据集上非常成功,将扩展谱方法的应用范围,推动大数据挖掘研究。
在 PRX 论文 [2] 中,张潘和合作者基于统计物理自旋玻璃方法和相变理论研究随时间演化的大规模网络的社区结构探测问题。他们能够精确计算出基准模型网络的可探测相变点,而且提出并验证了可以工作到理论极限的消息传递算法和谱算法。这项工作预期将推动网络科学的模式识别研究的进一步发展。
张潘副研究员的工作得到中国科学院理论物理重点实验室的资助。
[1] "Robust Spectral Detection of Global Structures in the Data by Learning a Regularization", P. Zhang,Advances in Neural Information Processing Systems (2016) , arXiv: 1609.02906 (2016).
[2] "Detectability Thresholds and Optimal Algorithms for Community Structure in Dynamic Networks", A. Ghasemian, P. Zhang, A. Clauset, C. Moore, and L. Peel, ?Physical Review X 6, 031005 (2016).
删除或更新信息,请邮件至freekaoyan#163.com(#换成@)
统计物理方法处理机器学习问题取得重要进展
本站小编 Free考研/2020-05-27
相关话题/数据 结构
被动时空对称声学结构中非对称衍射的实验研究
非对称传输在声学通信和噪声控制中有重要的应用价值,其理论研究和实验验证一直是科研人员关注的重点。在先前的研究工作中,声学非对称传输通常依靠声学非线性效应和模式转换来实现。近年来,研究人员将量子力学中时空对称的概念引入声学领域,通过在声学体系中引入损耗和增益的调控,实现一维体系的单向隐身、无插入误差传 ...中科院声学研究所 本站小编 Free考研 2020-05-27研究人员提出一种利用声场大数据和深度学习的宽带水下声源定位
在有实际观测数据的场景下,机器学习在海洋声源定位方面已经显示出应用潜力。然而,采集海上实测数据往往成本较高,在某些场景下甚至难以实现。如何在不确知环境下准确定位水下声源是水声应用领域最具挑战性的问题之一。 近期,中科院声学所的牛海强等人与美国Scripps海洋研究所的研究人员联合提出一种适用于不确 ...中科院声学研究所 本站小编 Free考研 2020-05-27基于变体GRU预处理网络数据包的入侵检测优化算法
在网络空间中,用入侵检测(Intrusion Detection System,IDS)判断网络数据包是否包含攻击对于防范网络攻击和保护信息安全具有重要意义。现有的IDS算法存在两个问题,一是利用人工经验大量提取的特征无法准确描述网络数据包;二是神经网络结构复杂、内存占用大、功耗大。 中科院声学所 ...中科院声学研究所 本站小编 Free考研 2020-05-27数据科学的理论与应用—记分子系统中心第十四期“未来科学沙龙”
2019年8月7日下午,由中国科学院遗传与发育生物学研究所分子系统生物学研究中心主办的“未来科学沙龙”第十四期于研究所职工之家顺利举行。本场沙龙以“数据科学”为主题,介绍了企业界数据分析的重要步骤、何为数据科学家以及数据科学家的必备技能。分子系统生物学研究中心王秀杰研究员、钱文峰研究员和屠强研究员出 ...中科院遗传与发育生物学研究所 本站小编 Free考研 2020-05-26张永清研究组发现突触稳态调控的结构基础
突触后谷氨酸受体减少会产生逆向信号诱导突触前神经递质释放的增加以维持突触传递功能,这个调控过程称为突触稳态。突触后受体如何跨突触逆向影响突触前结构和功能是神经生物学研究的核心科学问题。突触结构和功能的紊乱与精神分裂症、自闭症及智力发育迟缓等多种神经精神疾病密切相关,解析突触后谷氨酸受体如何调控突触前 ...中科院遗传与发育生物学研究所 本站小编 Free考研 2020-05-26周奕华研究组在细胞壁高级结构形成调控研究中取得新进展
细胞壁是多糖组成的复杂网络结构,这些多糖经折叠、交联,形成适应植物生长发育所需的细胞壁高级结构。研究细胞壁高级结构形成的精准调控机制是植物学新的学科前沿。 乙酰化是一种广泛存在于细胞壁多糖上的修饰形式,可控制多糖构象及多聚物间的交联,对高级结构的构建至关重要,成为解析细胞壁结构及其功能的突破口。阿 ...中科院遗传与发育生物学研究所 本站小编 Free考研 2020-05-26钱文峰研究组优化单细胞DNA甲基化修饰异质性算法并发布数据库HeteroMeth
DNA甲基化是真核生物体内广泛存在的一种表观遗传修饰,在基因转录调控、细胞分化、基因组印迹、X染色体失活等生物学过程中发挥着至关重要的作用。由于测序技术和计算方法的局限,以往研究者获得的是一个细胞群体的平均DNA甲基化水平。平均化的甲基化水平虽然承载着一定的信息,却丢失了诸如不同细胞之间存在的甲基化 ...中科院遗传与发育生物学研究所 本站小编 Free考研 2020-05-26刘西岗研究组在染色质高级结构调控花分生组织活性的分子机制解析中取得新进展
高等植物的所有组织和器官均来源于分生组织,WUCHEL基因是植物分生组织的维持和终止的关键基因。WUS的表达调控是一个复杂的网络,但对其具体的调控机制还很不清楚。越来越多的研究表明,染色质的高级结构对调控基因的表达具有重要作用。 中国科学院遗传与发育生物学研究所农业资源研究中心刘西岗研究组以拟南芥花 ...中科院遗传与发育生物学研究所 本站小编 Free考研 2020-05-26小麦醇溶蛋白染色体位点结构与功能研究以及育种应用价值分析获得新进展
醇溶蛋白及其同源物广泛存在于禾本科植物种子中,是水稻、小麦、玉米等作物籽粒加工与营养品质的一个重要决定因素。在六倍体普通小麦,醇溶蛋白基因以多拷贝方式存在于六个复杂的染色体位点(Gli-A1, B1, D1, A2, B2 & D2),其积累量一般占籽粒总蛋白含量的40-50%,对面筋、面团的功能以 ...中科院遗传与发育生物学研究所 本站小编 Free考研 2020-05-26中英合作研究首次揭示水稻体内mRNA二级结构组
RNA是生命信息传递的核心成员之一,在生物体内通过形成复杂的二级结构及更高级的空间结构来行使其生物学功能。除了我们熟知的非编码RNA具有独特且稳定的RNA二级结构来参与可变剪切、翻译等生物学过程,目前越来越多的研究表明,mRNA二级结构也在mRNA转录后和翻译调控过程中发挥着重要作用。但是,解析体内 ...中科院遗传与发育生物学研究所 本站小编 Free考研 2020-05-26