本文提出了一种基于卷积神经网络和循环神经网络的深度学习模型,通过分析基因组序列数据,识别人基因组中环形RNA剪接位点.首先,根据预处理后的核苷酸序列,设计了2种网络深度、8种卷积核大小和3种长短期记忆(long short term memory,LSTM)参数,共8组16个模型;其次,进一步针对池化层进行均值池化和最大池化的测试,并加入GC含量提高模型的预测能力;最后,对已经实验验证过的人类精浆中环形RNA进行了预测.结果表明,卷积核尺寸为32×4、深度为1、LSTM参数为32的模型识别率最高,在训练集上为0.9824,在测试数据集上准确率为0.95,并且在实验验证数据上的正确识别率为83%.该模型在人的环形RNA剪接位点识别方面具有较好的性能.
PDF全文下载地址:
http://www.pibb.ac.cn/pibbcn/ch/reader/create_pdf.aspx?file_no=20200298&flag=1&journal_id=pibbcn
删除或更新信息,请邮件至freekaoyan#163.com(#换成@)
基于卷积神经网络和循环神经网络的环形RNA剪接位点识别研究
本站小编 Free考研考试/2022-01-02
相关话题/序列 数据 实验 测试 基因
PDZ连接激酶,又一新的原癌基因
PDZ连接激酶(PBK)是一种丝-苏氨酸激酶,属于丝裂原活化蛋白激酶激酶(MAPKK)家族成员.PBK能调控细胞周期进程,促进细胞增殖.近年发现,其在乳腺癌、结肠癌、皮肤癌和前列腺癌等多种恶性肿瘤组织中均呈高表达,与多种癌症预后不良关联密切.PBK主要通过Wnt、PI3K/AKT/mTOR和MAPK ...中科院生物物理研究所 本站小编 Free考研考试 2022-01-02注意缺陷多动障碍共患阅读障碍:认知-脑-基因的多维度研究进展
注意缺陷多动障碍(Attention-Deficit/HyperactivityDisorder,ADHD)和发展性阅读障碍(DevelopmentalDyslexia,DD)是两种常见的神经发育性障碍,二者共患的比率高达25%~48%。本文拟从认知-脑-基因等多个维度对ADHD共患DD的研究进展进 ...中科院生物物理研究所 本站小编 Free考研考试 2022-01-02诺贝尔化学奖授予CRISPR-Cas9基因编辑研究
2020年,诺贝尔化学奖授予现在德国马普感染生物学研究所工作的法国科学家EmmanuelleCharpentier和美国加州大学伯克利分校的?JenniferDoudna,表彰她们发明CRISPR基因编辑方法。她们揭示了Cas9具有RNA介导的DNA核酸内切酶活性,可以切断任意DNA双链,产生DNA ...中科院生物物理研究所 本站小编 Free考研考试 2022-01-02SSVEP次谐波的诱发影响因素及其功率变化——建模及实验研究*
稳态视觉诱发电位(steady-statevisualevokedpotential,SSVEP)在大脑的感知、认知研究中具有广泛应用。目前,对SSVEP次谐波的诱发机制尚未清楚。为此,本文通过视皮层网络模型进行SSVEP次谐波的诱发因素和功率变化的研究;进一步,测试20名受试者的头表SSVEP,对 ...中科院生物物理研究所 本站小编 Free考研考试 2022-01-02蛋白质-RNA序列结构界面偏好性及用于对接打分统计势的构建
本文对来自PDB(ProteinDataBank)数据库的蛋白质-RNA复合物结构构建了非冗余非核糖体数据库(694个结构),并对此数据库统计了蛋白质和RNA序列及二级结构的界面偏好性.结果发现蛋白质β折叠、310-helix和RNA未配对核苷酸,尤其是未配对中空间排列不规整的核苷酸具有显著的界面偏 ...中科院生物物理研究所 本站小编 Free考研考试 2022-01-02拟南芥不同组织基因表达及可变剪接差异分析
可变剪接是转录后重要的基因表达调控方式,也是转录组和蛋白质组多样性的重要来源.近年来随着拟南芥、水稻、玉米等植物转录组测序的完成,研究人员发现植物pre-mRNA可变剪接的发生与组织分化、发育等生物学过程密切相关.本工作基于GEO数据库的RNA-seq数据,使用高通量测序数据分析常用的Trimmom ...中科院生物物理研究所 本站小编 Free考研考试 2022-01-02利用CRISPR/Cas9系统构建Tiki1基因修饰猪模型
Tiki1基因是哈佛大学儿童医学院贺熹教授实验室发现的一个对蛙头部的诱导起到决定性作用的新基因,但Tiki1基因在小鼠等啮齿类动物中缺失,因此无法利用小鼠等小动物来研究其在哺乳动物中的作用.本文利用CRISPR/Cas9系统结合体细胞克隆技术构建Tiki1基因修饰猪模型,研究Tiki1基因在猪发育中 ...中科院生物物理研究所 本站小编 Free考研考试 2022-01-02基于蛋白质基因组学方法的新抗原鉴定流程
肿瘤新抗原是免疫治疗的重要靶点,但基因组数据产生的候选新抗原数量庞大,预测假阳性肽段过多,实验验证费时费力,影响肿瘤新抗原的临床应用.本研究以乳腺癌为例,使用比转录组水平筛选更严格、比细胞学实验更省时的蛋白质基因组学方法来预测和筛选新抗原.研究发现,C2(IFN-γdominant)免疫表型的新抗原 ...中科院生物物理研究所 本站小编 Free考研考试 2022-01-02虎杖中一种新的2-吡喃酮合酶基因的克隆和功能研究
4-羟基-6-甲基-2-吡喃酮(2-吡喃酮)及其衍生物是一类重要的植物次生代谢产物,具有抗虫、抗真菌等功能,在工业上可用于生产可再生化学平台间苯三酚和1,3,5-三氨基-2,4,6-三硝基苯.2-吡喃酮合酶(2PS),一种Ⅲ型聚酮合酶(PKSs),是合成2-吡喃酮的关键酶.本研究以中药材虎杖(Pol ...中科院生物物理研究所 本站小编 Free考研考试 2022-01-02单细胞全基因组扩增技术与应用
同一组织中的细胞往往具有类似的结构和功能,然而通过对单个细胞进行测序分析后,发现每个细胞都具有一定异质性.单细胞全基因组扩增技术是进行单细胞测序的前提,该技术可用于揭示单细胞基因组结构差异,同时在肿瘤研究、发育生物学、微生物学等研究中发挥重要作用,并成为生命科学研究技术的热点之一.单细胞全基因组扩增 ...中科院生物物理研究所 本站小编 Free考研考试 2022-01-02