删除或更新信息,请邮件至freekaoyan#163.com(#换成@)

基于预训练语言模型的BERT-CNN多层级专利分类研究

本站小编 Free考研考试/2022-01-02

闁诲孩顔栭崰鎺楀磻閹剧粯鈷戞い鎰剁悼椤e弶绻濋埀顒勫箥椤旀儳宕ュ┑顔筋殘椤︾硽闂備焦瀵х粙鎺楁儗椤斿墽鍗氶悗娑欋缚閳绘棃鏌涢妷銏℃珦婵炲吋宀搁弻銈夊级閸喗娈堕梺缁樼墱閸庛倗绮欐径鎰闁肩⒈鍓涢幊婵嬫煟閻樺弶澶勭€规洘锕㈤敐鐐碘偓锝庡亾缁憋綁鏌熸潏楣冩妞ゆ挾鎳撻妴鎺戭潩閾忣偆銆婂┑鐘亾闁告稑鐡ㄩ弲顒勬倶閻愭彃鈷旀俊灞傚姂閺岋繝宕奸銏犲箰缂備焦顨呴ˇ闈涚暦濮橆叏绱eù锝勮娴煎洭姊洪崨濠傜瑨婵☆偅绻堥獮鎰板醇閺囩喐娅栨繛杈剧秬濞咃綁宕″⿰鍫熷€甸柣銏犵仛閸も偓闂佹悶鍔嶇换鍕垝鐠囧弬鏃傗偓锝庡墰閿涳拷
547闂備礁婀遍。浠嬪磻閹剧粯鈷掗柛鏇楁櫅閻忣亪鏌eΔ鈧柊锝夊箠閹捐绀冩い蹇撴閻撴盯姊洪崗鍏肩凡闁哥噥鍋勯悾鐑芥晸閿燂拷1130缂傚倷绀侀ˇ顖滅矓閻㈢鍋撻崹顐g殤闁逞屽墲椤鍠婂澶婃辈闁逞屽墴閺屸剝寰勭€n亜顫庡┑鐐茬墛閸ㄥ灝鐣烽敓鐘茬鐟滃繒绮欓崶鈺冪<濠㈣泛锕︽晥闂佸憡菧閸婃牜缂撻挊澹╂棃宕担瑙勭槣闂佸湱鍘ч悺銊╁箰閸洖鐒垫い鎴炲缁佺増銇勯銏╁剱闁挎稒鍔欓獮瀣敍濠婂拋妲锋繝鐢靛仦閸ㄥ綊寮粙妫电儤绻濋崶銊ユ闁哄鐗滈崑鎺楀吹閺冨牊鐓忛柛鈩冩礉閸忓瞼绱掗鍏夊亾鐡掍浇顫夐幆鏂库槈閹烘垳澹曟繛杈剧悼閺咁偄危閸儲鐓曢柟鐑樻尰閸嬬娀鏌嶈閸忔稓娆㈠璺洪棷濡わ絽鍟幊姘扁偓骞垮劚閸熺娀宕戦幘瀛樺闁绘垶锚閳ь剛鍋熼埀顒冾潐閹爼宕曢鐐茬劦妞ゆ垼鍎婚崗灞俱亜閹惧瓨鍊愰柟顔肩埣瀹曢亶骞囬妸銉ゅ婵炶揪绲炬禍鑺ョ閿曗偓闇夐柛蹇曞帶閹兼悂鏌嶈閸忔稑霉閸ヮ剙纾奸柕濠忕畱椤曡鲸鎱ㄥΟ绋垮姉闁稿鎸婚幏鍛喆閸曨剛鏆氶梻浣哄帶瀵儼銇愰崘顏嗙处濡わ絽鍟崑鐘绘煕閳╁啫濮€闁稿鎸婚幏鍛存偪椤栨艾绠戦梻浣告惈閸婄ǹ煤閵忋倕鐒垫い鎴炲缁佹澘顭跨憴鍕磳鐎殿喚鏁婚、娑樜熷畡棰佸婵炶揪缍€椤鎮¢埀顒勬⒒閸屾艾鈧粙顢欐繝鍕潟闁割偅娲栫粻缁樸亜閹炬潙顥氶柛瀣尰閹峰懘宕烽婧惧亾婵犲洦鍊垫繛鎴濈枃缁€瀣煃瑜滈崗娑氱矆娴h桨鐒婇柟娈垮枓閸嬫挸鈽夌€圭姷顦伴梺閫炲苯鍘告繛鏉戞喘椤㈡﹢宕妷褌绗夊┑掳鍊撻悞锔捐姳濮樿埖鐓忛柛鈩冩礈椤︼妇鈧湱枪椤嘲鐣烽敐鍥︽勃闁稿本顨呮禍鎯归敐鍛暈闁告洟绠栭弻锝夋倷閸欏妫戦梺閫炲苯鍘搁柣鎺炵畵瀵剟宕掑锝嗙參濠殿喚鎳撳ú鐘诲磻閹惧瓨濯撮柛娑橈攻閸f悂鏌f惔銏犲枙閻犳劗鍠栭崺鈧い鎴炲椤﹂绱撳鍜佸剶闁硅櫕鐗犻幊鐘活敆閸愮偓钑夌紓鍌欑劍閸愬骞忛敓锟�28缂傚倷绶¢崑澶愵敋瑜旈、妤呮偄閾忓湱鐓嬮梺瑙勬儗閸ㄥ磭澹曢敓锟�
摘要专利文献的自动分类对于知识产权保护、专利管理和专利信息检索十分重要,构建准确的专利自动分类器可以为专利发明人、专利审查员提供辅助支持。该文以专利文献分类为研究任务,选取国家信息中心公布的全国专利申请信息为实验数据,提出了基于预训练语言模型的BERT-CNN多层级专利分类模型。实验结果表明: 在该数据集上,BERT-CNN模型在准确率上达到了84.3%,大幅度领先于卷积神经网络和循环神经网络等其他深度学习算法。BERT抽取的特征向量在表达词汇与语义方面比传统Word2Vec具有更加强大的性能。另外,该文还探讨了全局与局部策略在专利多层文本分类上的差异。

PDF全文下载地址:

http://jcip.cipsc.org.cn/CN/article/downloadArticleFile.do?attachType=PDF&id=3219
闁诲孩顔栭崰鎺楀磻閹剧粯鈷戞い鎰剁悼椤e弶绻濋埀顒勫箥椤旀儳宕ュ┑顔筋殘椤︾硽闂備焦瀵х粙鎺楁儗椤斿墽鍗氶悗娑欋缚閳绘棃鏌涢妷銏℃珦婵炲吋宀搁弻銈夊级閸喗娈堕梺缁樼墱閸庛倗绮欐径鎰闁肩⒈鍓涢幊婵嬫煟閻樺弶澶勭€规洘锕㈤敐鐐碘偓锝庡亾缁憋綁鏌熸潏楣冩妞ゆ挾鎳撻妴鎺戭潩閾忣偆銆婂┑鐘亾闁告稑鐡ㄩ弲顒勬倶閻愭彃鈷旀俊灞傚姂閺岋繝宕奸銏犲箰缂備焦顨呴ˇ闈涚暦濮橆叏绱eù锝勮娴煎洭姊洪崨濠傜瑨婵☆偅绻堥獮鎰板醇閺囩喐娅栨繛杈剧秬濞咃綁宕″⿰鍫熷€甸柣銏犵仛閸も偓闂佹悶鍔嶇换鍕垝鐠囧弬鏃傗偓锝庡墰閿涳拷
547闂備礁婀遍。浠嬪磻閹剧粯鈷掗柛鏇楁櫅閻忣亪鏌eΔ鈧柊锝夊箠閹捐绀冩い蹇撴閻撴盯姊洪崗鍏肩凡闁哥噥鍋勯悾鐑芥晸閿燂拷1130缂傚倷绀侀ˇ顖滅矓閻㈢鍋撻崹顐g殤闁逞屽墲椤鍠婂澶婃辈闁逞屽墴閺屸剝寰勭€n亜顫庡┑鐐茬墛閸ㄥ灝鐣烽敓鐘茬鐟滃繒绮欓崶鈺冪<濠㈣泛锕︽晥闂佸憡菧閸婃牜缂撻挊澹╂棃宕担瑙勭槣闂佸湱鍘ч悺銊╁箰閸洖鐒垫い鎴炲缁佺増銇勯銏╁剱闁挎稒鍔欓獮瀣敍濠婂拋妲锋繝鐢靛仦閸ㄥ綊寮粙妫电儤绻濋崶銊ユ闁哄鐗滈崑鎺楀吹閺冨牊鐓忛柛鈩冩礉閸忓瞼绱掗鍏夊亾鐡掍浇顫夐幆鏂库槈閹烘垳澹曟繛杈剧悼閺咁偄危閸儲鐓曢柟鐑樻尰閸嬬娀鏌嶈閸忔稓娆㈠璺洪棷濡わ絽鍟幊姘扁偓骞垮劚閸熺娀宕戦幘瀛樺闁绘垶锚閳ь剛鍋熼埀顒冾潐閹爼宕曢鐐茬劦妞ゆ垼鍎婚崗灞俱亜閹惧瓨鍊愰柟顔肩埣瀹曢亶骞囬妸銉ゅ婵炶揪绲炬禍鑺ョ閿曗偓闇夐柛蹇曞帶閹兼悂鏌嶈閸忔稑霉閸ヮ剙纾奸柕濠忕畱椤曡鲸鎱ㄥΟ绋垮姉闁稿鎸婚幏鍛喆閸曨剛鏆氶梻浣哄帶瀵儼銇愰崘顏嗙处濡わ絽鍟崑鐘绘煕閳╁啫濮€闁稿鎸婚幏鍛存偪椤栨艾绠戦梻浣告惈閸婄ǹ煤閵忋倕鐒垫い鎴炲缁佹澘顭跨憴鍕磳鐎殿喚鏁婚、娑樜熷畡棰佸婵炶揪缍€椤鎮¢埀顒勬⒒閸屾艾鈧粙顢欐繝鍕潟闁割偅娲栫粻缁樸亜閹炬潙顥氶柛瀣尰閹峰懘宕烽婧惧亾婵犲洦鍊垫繛鎴濈枃缁€瀣煃瑜滈崗娑氱矆娴h桨鐒婇柟娈垮枓閸嬫挸鈽夌€圭姷顦伴梺閫炲苯鍘告繛鏉戞喘椤㈡﹢宕妷褌绗夊┑掳鍊撻悞锔捐姳濮樿埖鐓忛柛鈩冩礈椤︼妇鈧湱枪椤嘲鐣烽敐鍥︽勃闁稿本顨呮禍鎯归敐鍛暈闁告洟绠栭弻锝夋倷閸欏妫戦梺閫炲苯鍘搁柣鎺炵畵瀵剟宕掑锝嗙參濠殿喚鎳撳ú鐘诲磻閹惧瓨濯撮柛娑橈攻閸f悂鏌f惔銏犲枙閻犳劗鍠栭崺鈧い鎴炲椤﹂绱撳鍜佸剶闁硅櫕鐗犻幊鐘活敆閸愮偓钑夌紓鍌欑劍閸愬骞忛敓锟�28缂傚倷绶¢崑澶愵敋瑜旈、妤呮偄閾忓湱鐓嬮梺瑙勬儗閸ㄥ磭澹曢敓锟�
相关话题/文献 实验 数据 信息 管理

  • 领限时大额优惠券,享本站正版考研考试资料!
    大额优惠券
    优惠券领取后72小时内有效,10万种最新考研考试考证类电子打印资料任你选。涵盖全国500余所院校考研专业课、200多种职业资格考试、1100多种经典教材,产品类型包含电子书、题库、全套资料以及视频,无论您是考研复习、考证刷题,还是考前冲刺等,不同类型的产品可满足您学习上的不同需求。 ...
    本站小编 Free壹佰分学习网 2022-09-19
  • 面向垂直领域的阅读理解数据增强方法
    摘要阅读理解问答系统是利用语义理解等自然语言处理技术,根据输入问题,对非结构化文档数据进行分析,生成一个答案,具有很高的研究和应用价值。在垂直领域应用过程中,阅读理解问答数据标注成本高且用户问题表达复杂多样,使得阅读理解问答系统准确率低、鲁棒性差。针对这一问题,该文提出一种面向垂直领域的阅读理解问答 ...
    本站小编 Free考研考试 2022-01-02
  • NOBEL: 一种基于拓扑信息与监督学习的蛋白质复合物识别方法
    摘要蛋白质复合物对于生物学家有效了解细胞组织和功能具有重要意义,如何通过计算方法从蛋白质-蛋白质相互作用(PPI)网络中识别复合物是当前研究热点之一。然而,由于PPI网络中存在大量假阴性和假阳性噪声数据且现有已知蛋白质复合物并不完整,使得如何克服PPI网络的噪声问题,以及更好地利用已知蛋白质复合物, ...
    本站小编 Free考研考试 2022-01-02
  • 基于数据增强的高考阅读理解自动答题研究
    摘要机器阅读理解是自然语言处理领域中的一项重要研究任务,高考阅读理解自动答题是近年来阅读理解任务中的又一挑战。目前高考语文阅读理解任务中真题和模拟题的数量相对较少,基于深度学习的方法受到实验数据规模较小的限制,所得的实验结果相比传统方法无明显优势。基于此,该文探索了面向高考语文阅读理解的数据增强方法 ...
    本站小编 Free考研考试 2022-01-02
  • 面向对话的融入交互信息的实体关系抽取
    摘要实体关系抽取旨在从文本中抽取出实体之间的语义关系,是自然语言处理的一项基本任务。在新闻报道、维基百科等规范文本上,该任务的研究相对丰富且已取得了一定的效果,但面向对话文本的相关研究还处于起始阶段。相较于规范文本,对话是一个交互的过程,大量信息隐藏在交互中,这使得面向对话文本的实体关系抽取更具挑战 ...
    本站小编 Free考研考试 2022-01-02
  • 基于时空注意力的社交网络信息级联预测模型
    摘要针对目前信息级联预测模型的构建多基于级联的时序信息或者空间拓扑结构、极少考虑两者的结合问题,该文提出一种面向社交网络的基于深度学习方法的信息级联预测(InformationCascadePrediction,ICP)模型。首先,使用拉普拉斯矩阵对级联节点采样,生成空间序列;然后,通过结合了图卷积 ...
    本站小编 Free考研考试 2022-01-02
  • 基于文章和近答案句信息的问题生成模型
    摘要自动问题生成任务旨在给文章中的一段文本生成相应的自然语言的问句,该研究在问答系统和语音助手的对话系统中有重要作用,可以帮助它们启动对话和继续对话。目前的神经网络问题生成模型主要是将包含答案的句子或者整篇文章作为模型的输入,而这些方法存在语义表示不能很好地结合句子和文章信息的问题。因此该文提出多输 ...
    本站小编 Free考研考试 2022-01-02
  • 融合词义信息的文本蕴涵识别方法
    摘要文本蕴涵识别是对两个文本之间语义关系的有向推理,而词汇的词义对理解文本的语义以及推理文本之间的语义蕴涵关系有着重要作用。因此,为了有效利用词汇的词义信息推断文本之间的语义蕴涵关系,该文提出一种融合词义信息的文本蕴涵识别方法。该方法首次提出将原始的词汇转化为对应的目标词义,然后利用词汇的词义信息改 ...
    本站小编 Free考研考试 2022-01-02
  • 多目标情感分类中文数据集构建及分析研究
    摘要目标级情感分类任务是为了得到句子中特定评价目标的情感倾向。一个句子中往往存在多个目标,多个目标的情感可能一致,也可能不一致。但在已有针对目标级情感分类的评测数据集中:①大多数是一个句子一个目标;②在少数有多个目标的句子中,多个目标情感倾向分布并不均衡,多个目标情感一致的句子占较大比例。数据集本身 ...
    本站小编 Free考研考试 2022-01-02
  • 聚合邻域信息的联合知识表示模型
    摘要知识表示学习在关系抽取、自动问答等自然语言处理任务中获得了广泛关注,该技术旨在将知识库中的实体与关系表示为稠密低维实值向量。然而,已有的模型在建模知识库中的三元组时,或是忽略三元组的邻域信息,导致无法处理关联知识较少的罕见实体,或是在引入邻域信息时不能自适应地为每个实体抽取最相关的邻节点属性,导 ...
    本站小编 Free考研考试 2022-01-02
  • 基于部分标签数据和经验分布的命名实体识别
    摘要近年来,基于数据驱动的命名实体识别方法在新闻、生物医疗等领域上取得了很大的成功,然而许多领域缺少标签,且人工标注成本高昂。为了降低标注成本,该文尝试使用含有噪声的部分标签数据进行命名实体识别,提出了一种基于部分标签数据和经验分布的方法。首先介绍基于部分标签数据的建模方法,然后引入标签经验分布的假 ...
    本站小编 Free考研考试 2022-01-02