删除或更新信息,请邮件至freekaoyan#163.com(#换成@)

当化石形态学遇上信息论

本站小编 Free考研考试/2022-01-03

长久以来,化石作为古生物学研究最主要也是几乎唯一的材料不可避免地受到保存环境的影响,其中的噪声造成了形态学特征的不完整与失真,进而影响后续的系统发育和功能形态方面研究。尽管部分研究讨论了不同地区与年代中化石保存的完整性,但其中绝大多数停留在数据收集与统计上,并没有将化石中受到噪声的影响量化。甚至在大量古生物学研究中,信息一词也常常与数据,信号,观测结果等等概念混淆,并没有清晰的定义。这些基础概念的模糊导致了在系统发育研究中,不同作者对于“特征”、“物种”等概念缺乏共识,学界始终缺乏合适的理论框架与方法对化石中的形态学信息进行定量化的研究。

图1. 经典通信系统模型与基于信息论框架的古生物学
  近日,国际学术期刊《生态学与演化》(Ecology and Evolution)在线发表了由美国自然历史博物馆余琮煜,北京大学地球与空间科学学院江左其杲,古脊椎所王海冰等合作的题为“形态学特征中的信息(Information in morphological characters)”的论文,提出了可以将信息论与通信系统工程作为古生物形态学研究的理论基础。文章讨论了多个脊椎动物形态学特征矩阵中的信息熵,互信息,信道容量等参数,提出目前的形态学矩阵并没有很好地区分信源编码与信道编码,不同特征之间差异较大的信息熵往往被忽视,矩阵中过多的特征数量可能导致了信息传递的低效。
  尽管人造通信系统存在的时间几乎与人类的历史一样久远,但对通信系统完整的数学描述直到1948年才被克劳德香农提出。一个典型的通信系统可以分为信源,发送设备,信道,接收设备,信宿,其中信道在现实中往往伴随着噪声。信源中的原始消息(message)经过发送设备编码之后进入信道,接收设备收到编码信号(signal)之后进行解码将消息传递给信宿,由于现实通信中几乎无法避免噪声,为了确保解码后的消息与编码前的消息的一致性,精心设计的编码是非常必要的。香农提出编码过程可以进一步细分为信源编码与信道编码,而且这两个步骤可以分开进行互不影响。信源编码需要以尽可能低的成本(编码长度)表示出所有可能出现的消息,也就是要完整表达出信源的信息熵,其典型例子有电报通信中的摩斯电码。信道编码的主要目的是对抗信道中的噪声,恰当地引入冗余可以保证即使一部分信号丢失或者失真,接收设备依然可以解码得到原始消息,从而保证有效的通信。
  香农认为通信中最基础的问题是在一处近似或者精确地重现另一处的消息,类似的,我们认为古生物学中最基础的问题是在现代近似或者精确地重现在地质年代中的古生物,包括他们的演化历史与形态功能等诸多方面。在古生物学系统发育研究中,绝大多数研究只能依靠形态学数据,与此相反的是,在现代生物或者最近灭绝的生物的系统发育研究中,研究人员可以利用DNA或者蛋白质序列这样易于数字化的数据。因此,DNA或者蛋白质序列非常接近于现代通信系统中的数字信号,而形态学数据更接近于模拟信号。形态学的数字化通常依靠形态学特征矩阵来完成,但是如何选择特征,每个特征中有多少信息量,各个特征之间的相关性,这些问题都是模糊不清的。
  该研究首先计算了多个脊椎动物形态学特征矩阵中每个特征的信息熵(信息量),拥有更多特征状态的特征有明显较高的信息熵。对于矩阵中多个特征的联合信息熵的结果显示仅仅少数形态学特征即可描述信源信息熵,绝大多数特征并没有提供额外的信息。这与古脊椎动物学研究中报道新物种的习惯符合,即利用少数特征作为鉴定特征,而在系统发育研究中则会使用数量大得多的特征。类似地,这样的区别可以用通信系统工程当中的信源与信道编码过程解释。进一步地,研究计算了每个特征矩阵中特征对之间的互信息,发现特征之间的相关性广泛存在,但习惯上对于解剖结构的划分并没有体现出较好的模块性。

图2. 特征矩阵中的多个特征的联合信息熵与互信息分布
  基于加性高斯白噪声信道模型,研究估算了不同特征矩阵对应的信道容量,发现信道容量均被特征数量饱和。香农的理论告诉我们超越信道容量的通信速率必然带来噪声,而在加性高斯白噪声信道模型中,随着带宽的提高,信道容量并不会无限提高,过宽的带宽不仅浪费通信资源也无法改善通信的质量。这与目前被研究人员偏爱的超大型特征矩阵相悖。
  由于信息熵直接度量了单个变量的信息量多少,因此可以在系统发育的特征权重方面提供参考依据。研究比较了平等加权(equal weighting),隐含加权(implied weighting)与信息熵加权在多个脊椎动物类群中的系统发育结果。尽管最终结果十分接近,但信息熵加权由于完全不需要任何先验知识,且直接建立了特征权重与信息熵之间的关系,比其他加权方式拥有更好的解释性和更少的额外假设。

图3. 加性高斯白噪声信道模型下的特征矩阵中的信道容量与特征数的关系
  随着观测手段的进步,古生物学家需要处理飞速增加的数据,但目前大量的古生物数据依然依靠研究人员的手工处理。尽管大量的数字化手段已经在古生物学研究中被实践,例如形态学特征矩阵,基于标志点的形态几何学,CT扫描等等,如何在海量的数据中寻找我们需要的信息依然是很有挑战性的工作。利用已经发展成熟的信息论与通信系统工程作为理论基础,为形态学数据的数字化提供了理论支持,也为基于形态学的系统发育研究提供了指导。正如现代通信系统在数字信号取代模拟信号之后迎来的大发展,未来基于信息论的古生物学有希望帮助我们更好地破解生物演化的密码。
  本文第一及通信作者为美国自然历史博物馆古生物部博士研究生余琮煜,共同作者有北京大学博雅博士后江左其杲和中科院古脊椎所副研究员王海冰,参与工作的还有德国汉堡大学与美国自然历史博物馆的科研人员。
论文链接:https://onlinelibrary.wiley.com/doi/10.1002/ece3.7874

相关话题/信息 数据 系统 通信 信号

  • 领限时大额优惠券,享本站正版考研考试资料!
    大额优惠券
    优惠券领取后72小时内有效,10万种最新考研考试考证类电子打印资料任你选。涵盖全国500余所院校考研专业课、200多种职业资格考试、1100多种经典教材,产品类型包含电子书、题库、全套资料以及视频,无论您是考研复习、考证刷题,还是考前冲刺等,不同类型的产品可满足您学习上的不同需求。 ...
    本站小编 Free壹佰分学习网 2022-09-19
  • 白垩纪的幼鸟为早期鸟类演化提供新的信息
    长期以来,德国索伦霍芬发现的始祖鸟一直是古生物学家探索鸟类起源的最重要的证据。然而,自上世纪90年代以来,中国辽西地区早白垩世热河生物群发现了大量带羽毛恐龙和原始鸟类,为鸟类起源和早期演化提供了更多关键性的证据。  最近一项研究报道了一件产自热河生物群的古喙鸟(Archaeorhynchus)标本, ...
    本站小编 Free考研考试 2022-01-03
  • 中生代今鸟型类燕鸟科系统学研究取得进展
    近期,《系统古生物学杂志》(Journal of Systematic Palaeontology)发表了中国科学院古脊椎动物与古人类研究所王敏、刘庆国、李志恒、周忠和完成的关于中生代今鸟型类燕鸟科(Yanornithidae)的多样性和分支系统厘定工作,提出燕鸟科目前包括三个属和种,整个燕鸟科在体 ...
    本站小编 Free考研考试 2022-01-03
  • CT数据三维重建和可视化软件开发新进展
    近日,中国科学院古脊椎动物与古人类研究所卢静副研究员、澳大利亚国立大学博士生胡雨致和澳大利亚国家计算中心 Ajay Limaye博士在《皇家学会开放科学》(Royal Society Open Science)上发表了团队在三维重建和可视化计算机软件开发方面取得的最新进展。图1. Drishti p ...
    本站小编 Free考研考试 2022-01-03
  • 角形类系统发育研究取得新进展
    犀牛和貘虽然在外形上差别巨大,但两者都属于奇蹄目,形态和分子生物学的证据都表明两者构成姐妹群,是由共同的祖先演化而来,统称为角形类(Ceratomorpha)。虽然现生的犀仅包括四属五种,貘仅有一属四种,但在新生代(6500万年前至今)很长的一段时期内,角形类是非常繁盛、多样的类群。  大约5000 ...
    本站小编 Free考研考试 2022-01-03
  • 早白垩世鸟类繁殖系统研究新进展
    近日,《生物通讯》(Communications Biology)杂志在线发表中科院古脊椎所周忠和团队的最新研究成果。这是该团队继 2013年在《自然》杂志发表题为“早白垩世鸟类卵泡的精美保存对研究恐龙繁殖行为的意义”的论文之后,对相关标本研究的最新进展。  从恐龙到鸟的演化涉及到一系列关键特征的改 ...
    本站小编 Free考研考试 2022-01-03
  • 工热物理所在CO2近零排放燃煤发电系统集成方面取得进展
    近日,工程热物理研究所分布式供能与可再生能源实验室研究人员围绕超临界水煤气化技术,开展了CO2近零排放的发电系统集成方法与机理研究。研究小组深入研究了超临界水煤气化过程能量转换机理,找到了提升能量利用效率的最大潜力,提出了系统集成原则和方法,进一步发明了CO2近零排放的发电系统,研究表明该系统的净发 ...
    本站小编 Free考研考试 2022-01-03
  • 研究所在应用机器学习在光伏热电混合系统结构参数优化研究中取得进展
    热电转换技术和光电转换技术是利用能源转换材料将太阳能直接转换为电能的两种主要技术形式。二者在提高太阳能利用率的技术研究发展方面的关键点,一是研究和开发高效热电材料和光伏材料及其组件,二是发展聚光型光伏热电技术。太阳能热电光电复合发电系统的核心是热电光伏复合发电单元,聚集太阳光入射后,光伏电池首先利用 ...
    本站小编 Free考研考试 2022-01-03
  • 10MW级压缩空气储能系统蓄热子系统通过第三方测试
    近日,中国科学院工程热物理所在压缩空气储能系统研发方面取得重要进展,10MW级压缩空气储能系统蓄热子系统通过国家建筑节能质量监督检测中心第三方测试,测试结果为蓄热装置蓄热量达68GJ,保温4小时蓄热效率为97.32%,保温8小时蓄热效率为96.56%,超过项目指标要求,达到国际领先水平。  压缩空气 ...
    本站小编 Free考研考试 2022-01-03
  • 研究所在压缩空气储能系统有限时间热力学研究方面取得重要进展
    近日,工程热物理所储能研发中心科研人员采用有限时间热力学方法首次建立了压缩空气储能系统的有限时间热力学模型,该模型充分考虑了热力过程中有限时间和有限尺寸对系统性能的影响,并实现了时间项和尺寸项的解耦,在解析模型中可以清晰看到压缩空气储能系统储/释能时间、关键设备尺寸和其他部件性能参数对系统效率的影响 ...
    本站小编 Free考研考试 2022-01-03
  • 燃气轮机可倾瓦轴承-拉杆转子系统流固耦合特性研究进展
    随着现代燃气轮机向着重型化和高功率方向的发展,复杂工作环境下(热弹、流固、机电耦合环境)燃气轮机拉杆转子连接界面的状态发生变化,易引起转子系统振动响应大幅增加,如何准确预测转子在复杂工况下动力学响应,是目前燃气轮机转子动力学设计与振动控制面临的重要问题之一。  依托研究所承担的两机专项课题,分布式供 ...
    本站小编 Free考研考试 2022-01-03