宏蛋白质组学是一门新型科学,它运用质谱技术规模化地采集自然界微生物种群的蛋白质信息,并结合多种组学数据,开展微生物种群的遗传特征及其生物功能的研究.宏蛋白质组学的信息分析与传统蛋白质组学方法有较大的不同,亟需拓展新的分析思路.由于宏蛋白质组的研究对象是复杂度极高的微生物样品,因此,需要构建尽可能囊括样本中所含微生物的基因组信息的物种数据库.面对庞大的数据库,必须考虑到分析过程中所消耗的计算资源和鉴定结果的质控标准,因此,需要高度优化库容量、搜库、假阳性控制等参数.鉴于宏蛋白质组数据中广泛存在复杂的同源蛋白质序列,因此,需要充分利用NCBI数据库中的分类信息进行匹配,并运用LCA算法过滤处理才能将蛋白质有效地归组到物种.本文立足于宏蛋白质组学信息分析,从宏蛋白质组的数据库建立、蛋白质归并、生物学意义发掘等几个方面着手,对该领域的发展现状、面临挑战以及未来研究方向进行了评述.
PDF全文下载地址:
http://www.pibb.ac.cn/pibbcn/ch/reader/create_pdf.aspx?file_no=20170187&flag=1&journal_id=pibbcn
删除或更新信息,请邮件至freekaoyan#163.com(#换成@)
宏蛋白质组学信息分析的基本策略及其挑战
本站小编 Free考研考试/2022-01-02
相关话题/微生物 信息 数据库 数据 计算
耿智等-EG:人工智能地震信息挖掘——物理机制约束下的大数据智能学习技术
人工智能地质大数据分析是典型的新兴交叉学科,核心是在物理规律约束下,通过建立数学模型,用数据科学的方法分析和挖掘有价值的核心信息和关键证据,以解决地质学的认知、发现、决策和评价等理论以及地质资源探测中的实际问题。 深地非常规资源钻探地质风险的钻前预测是长期难题,其中钻井井壁失稳是钻探地质与工程风险 ...中科院地质与地球物理研究所 本站小编 Free考研考试 2022-01-02林巍等-Microbiome:感磁微生物的多样性和起源演化获得新认识
自然界中微生物、昆虫、鱼类、鸟类、哺乳动物等许多生物可以感应并利用地磁场进行定向和导航,生物感磁的起源和演化问题一直没有得到解决。趋磁细菌是研究较为深入的一类感磁生物,它们在细胞内合成纳米级、生物膜包被、链状排列的铁磁性颗粒——磁小体,磁小体的主要功能类似磁罗盘,帮助这类微生物进行感磁定向(图1)。 ...中科院地质与地球物理研究所 本站小编 Free考研考试 2022-01-02耿智等-NC:人工智能地震信息挖掘——基于高效分类多尺度滤波卷积神经网络的自动化设计
人工神经网络(ANN)在数据驱动的自然和信息科学研究领域(例如图像图形学、材料、生物学和医学、天文地理以及地球科学)的应用正在迅猛发展。在勘探地球物理学中,许多此类研究都可以视为可视化图像分类或分割问题。例如,地质学家使用地震反射数据图像对地下沉积单元或油气藏进行分类,并识别断层、裂缝或盐体等不连续 ...中科院地质与地球物理研究所 本站小编 Free考研考试 2022-01-02李兴辉等-GCA:H2O-NaCl-CO2体系热力学模拟及石英溶解度计算对金矿床成矿过程的指示
H2O-NaCl-CO2三元混合流体在岩浆、变质和热液系统中很常见,在成岩和成矿中发挥着重要作用。造山型金矿是世界上最为重要的金矿床类型,矿化以多期H2O-NaCl-CO2±CH4流体叠加成矿为特征。衡量热液系统中流体相平衡和热力学性质(PVTx),对分析成矿流体演化和成矿作用发挥着重要作用。然而早 ...中科院地质与地球物理研究所 本站小编 Free考研考试 2022-01-02面向垂直领域的阅读理解数据增强方法
摘要阅读理解问答系统是利用语义理解等自然语言处理技术,根据输入问题,对非结构化文档数据进行分析,生成一个答案,具有很高的研究和应用价值。在垂直领域应用过程中,阅读理解问答数据标注成本高且用户问题表达复杂多样,使得阅读理解问答系统准确率低、鲁棒性差。针对这一问题,该文提出一种面向垂直领域的阅读理解问答 ...中科院软件研究所 本站小编 Free考研考试 2022-01-02面向人工智能伦理计算的中文道德词典构建方法研究
摘要道德词典资源建设是人工智能伦理计算的一个研究重点。由于道德行为复杂多样,现有的英文道德词典分类体系并不完善,而中文方面目前尚未有相关的词典资源,理论体系和构建方法仍待探究。针对以上问题,该文提出了面向人工智能伦理计算的中文道德词典构建任务,设计了四类标签和四种类型,得到包含25012个词的中文道 ...中科院软件研究所 本站小编 Free考研考试 2022-01-02融合文本特征的汉老双语句子相似度计算方法
摘要双语句子相似度旨在计算不同语言句子间的语义相似程度,在信息检索、平行语料库构建、机器翻译等领域有重要作用。由于汉语、老挝语平行语料稀少,且老挝语在语义表达、句子结构上与汉语有明显差异,导致汉老双语句子相似度研究的难度较大。该文提出了一种融合文本特征的汉老双语句子相似度计算方法,并构建了句子相似度 ...中科院软件研究所 本站小编 Free考研考试 2022-01-02NOBEL: 一种基于拓扑信息与监督学习的蛋白质复合物识别方法
摘要蛋白质复合物对于生物学家有效了解细胞组织和功能具有重要意义,如何通过计算方法从蛋白质-蛋白质相互作用(PPI)网络中识别复合物是当前研究热点之一。然而,由于PPI网络中存在大量假阴性和假阳性噪声数据且现有已知蛋白质复合物并不完整,使得如何克服PPI网络的噪声问题,以及更好地利用已知蛋白质复合物, ...中科院软件研究所 本站小编 Free考研考试 2022-01-02基于数据增强的高考阅读理解自动答题研究
摘要机器阅读理解是自然语言处理领域中的一项重要研究任务,高考阅读理解自动答题是近年来阅读理解任务中的又一挑战。目前高考语文阅读理解任务中真题和模拟题的数量相对较少,基于深度学习的方法受到实验数据规模较小的限制,所得的实验结果相比传统方法无明显优势。基于此,该文探索了面向高考语文阅读理解的数据增强方法 ...中科院软件研究所 本站小编 Free考研考试 2022-01-02面向对话的融入交互信息的实体关系抽取
摘要实体关系抽取旨在从文本中抽取出实体之间的语义关系,是自然语言处理的一项基本任务。在新闻报道、维基百科等规范文本上,该任务的研究相对丰富且已取得了一定的效果,但面向对话文本的相关研究还处于起始阶段。相较于规范文本,对话是一个交互的过程,大量信息隐藏在交互中,这使得面向对话文本的实体关系抽取更具挑战 ...中科院软件研究所 本站小编 Free考研考试 2022-01-02