删除或更新信息,请邮件至freekaoyan#163.com(#换成@)

基于分布式表示的汉字部件表义能力测量与应用

本站小编 Free考研考试/2022-01-02

闂傚倷鑳堕幊鎾绘偤閵娾晛绀夐柟鐑樻⒐鐎氬鏌i弮鍌氬妺閻庢碍宀搁弻娑樷枎瀹ュ懎濮庨梺杞拌閺呯娀骞冪捄琛℃閺夊牃鏅涚敮銊х磽娴d粙鍝虹紒璇茬墕閻e嘲顫濈捄鍝勮€块梺鍝勬储閸ㄥ宕i幇鐗堢厽闁绘ê寮堕幖鎰熆瑜岀划娆撳春閵忋倖鍤冮柍鍝勫€搁惃顐︽⒑閸涘﹥澶勯柛鎾村哺閹﹢骞囬悧鍫氭嫼闂佸憡鎸嗛崘褍顥氶梺姹囧焺閸ㄤ即顢氶鐔侯洸闁告稑锕ョ紞鍥ㄣ亜閹扳晛鐏╂鐐差儔濮婃椽宕楅悡搴″Б闂佹悶鍨肩亸顏堝Φ閹扮増鏅搁柨鐕傛嫹40%闂傚倷绀佸﹢杈╁垝椤栫偛绀夐柡宥庡幖閸ㄥ倹鎱ㄥΟ鍧楀摵閻忓繐瀛╅幈銊ノ熼崹顔惧帿闁诲繐娴氭禍顏堝蓟閵娿儮妲堥柧蹇e亜椤忥拷
闂傚倷娴囬~澶嬬娴犲绀夌€光偓閳ь剛鍒掔拠宸悑闁搞儯鍔岄惃顐⑩攽椤旇褰掑春閺嶎偂鐒婃い蹇撶墛閻撴稑顭跨捄鐚村伐闁哄棛鍠愮换娑欏緞濡搫绫嶆繝纰樺墲閹稿啿鐣烽幒鎴旀斀闁归偊鍓氶鏇炩攽閻愬樊鍤熷┑顖氼嚟缁辩偤鍩€椤掑嫭鐓忛柛鈩冾殔閺嗭絿鈧娲╃紞渚€銆佸☉銏″€烽柍杞版婢规洖鈹戦鐭亞澹曢鐘典笉闁哄稁鐏愰悷鎵冲牚闁告洦鍋嗛鍕箾鐎电ǹ孝闁绘绻掑Σ鎰板籍閸繄顓洪梺缁樏悘姘跺箚閿濆鈷掑〒姘搐娴滄繈鏌$仦璇插婵炲棎鍨介幃娆戔偓鐢电《閺嬫牠姊虹紒妯虹仸閽冮亶鏌熼悿顖欏惈缂佽鲸甯″顕€鍩€椤掑嫭鍋¢柨鏃傚亾閺嗘粎鎲搁悧鍫濈鐎规挷绶氶弻娑⑩€﹂幋婵囩彯闂佸憡鑹鹃幊搴ㄦ箒闂佸吋绁撮弲娑溾叴闂備線鈧偛鑻晶顖炴⒑閼恒儱鈷奝婵犵數鍋炲ḿ娆撳触鐎n喗鍤屽Δ锝呭暙缁犵喖鏌熼幆鐗堫棄闁诲繗娅曠换婵嬪垂椤愶絽鏆楃紓浣插亾濠㈣埖鍔栭悡鐔兼煃瑜滈崜娆愪繆娴犲鐓曢柍鍝勫€诲ú鎾煛鐏炶姤鍣规い顐g箓閻g兘宕堕埡鍐╂瘒闂備浇宕垫慨鏉懨洪妶鍫涗汗闁绘劕鎼懜瑙勩亜閹烘垵鈧綊宕戝鈧弻鏇熺箾瑜嶇€氼噣寮抽悩缁樷拺闁告稑锕ょ粭鎺撲繆椤愶絾顥堟俊顐㈡嚇閸╋繝宕ㄩ鎯у及闂備胶绮崝锕傚礈濞嗘劕绶炵€广儱顦伴悡娆撴倵濞戞瑡缂氬褜鍓熼弻鐔兼儌閸濄儳袦濡ょ姷鍋涢柊锝嗕繆閻戣棄惟闁靛濡囨禍宄扳攽閻愭潙鐏︽慨濠勬嚀椤灝顫滈埀顒勭嵁閸愩剮鏃堝川椤旇姤鐝柣搴″帨閸嬫捇鏌涢幇顓炲姢婵炲牏鍋撶换娑氣偓鐢登归鎾剁磽瀹ヤ礁浜鹃梻渚€娼уΛ妤呭疮閹绢喖绠犻柕蹇曞Х閺嗗鏌℃径搴㈢《闁诡噯鎷�40%闂傚倷绀佸﹢杈╁垝椤栫偛绀夐柡宥庡幖閸ㄥ倹鎱ㄥΟ鎸庣【鏉╂繈姊虹粙鎸庢拱缂佽绉瑰畷鐢告晝閳ь剟婀侀梺缁樼懃閹虫劗绮旈鍕厪闁糕剝顨呴弳鐔兼煙瀹勬壆绉烘い銏∶埞鎴﹀炊瑜滄导鍡涙⒒娴e憡鎯堥柣妤佺矒瀹曟粌鈽夐姀鈥充户濡炪倖鐗楃粙鎾汇€呴悜鑺ュ仯濞达絽鎽滈敍宥囩磼婢跺﹦浠㈤棁澶嬬節瑜忔慨鎾疮椤栫偛绠氶柛宀€鍋為悡銉︾箾閹寸們鍦偓姘卞缁绘盯鎮℃惔鈽嗗妷缂備礁鍊哥粔褰掋€侀弴銏狀潊闁绘ḿ鏁歌ⅲ9闂傚倷鑳堕、濠囧春閺嶎剙缍橀梻渚€鈧偛鑻晶顕€鏌涙繝鍐╁€愰柟顖氬暣婵偓闁靛牆鎳愰ˇ顐︽⒑缁洖澧叉繛鑼枛閹繝鍩¢崨顔规嫼闂佸憡鎸嗛崘褍顥氶梺姹囧焺閸ㄩ亶骞愰搹顐$箚閻庢稒蓱婵挳鎮峰▎蹇擃仼闂傚偆鍨跺铏规兜閸涱垰鐗氶梺绋块瀹曨剟婀佸┑顔姐仜閸嬫捇鏌熼銊ユ搐閻愬﹪鏌嶉崫鍕殲闁诡垽缍佸娲箰鎼达絺妲堥梺鍏兼た閸ㄧ敻濡甸幇鏉跨<闁绘劘灏欓ˇ顐︽⒑閸濆嫷妲规い鎴炵懇瀹曟繈宕ㄧ€涙ḿ鍘搁悗瑙勬尰閸濆酣宕愰妶澶婄柈闁割偁鍎查悡鏇犳喐鎼达絿鐭欓煫鍥ㄧ☉閻掑灚銇勯幋锝呭姷闁稿繐鏈换娑㈠川椤愩垹顬夐梺璇″灡濡啴寮崘鈺傚缂佸娉曟禒顓㈡⒒娴e憡鍟為柣銊︾矋閹峰懘骞撻幒宥咁棜濠电偠鎻紞渚€寮查懠顒冨С闁规儼濮ら悡鏇熶繆閵堝嫮顦﹂柟鍏兼倐閺屽秷顧侀柛蹇旂〒缁牊鎷呴崷顓ф锤闂佸搫娲ㄩ崰鎾诲煘瀹ュ绠抽柟鎯版閻掑灚銇勯幋婵堜虎闁稿﹥妲嬬紓鍌氬€风粈渚€寮甸鈧—鍐寠婢光晜鐩畷绋课旈埀顒冪箽濠电偠鎻紞鈧繛鍜冪秮瀹曪綁鍩€椤掍胶绠鹃柟瀵稿仦閻撱儳绱掗妸锔姐仢闁糕斁鍋撳銈嗗灦鐎笛呯矈娴煎瓨鐓熸い蹇撴噺鐏忥箓鏌熼鑺ャ仢闁轰焦鍔欏畷鍫曞煛閸屾稑鍔橀梻鍌欑閹诧繝鎳濋崜褉鍋撳鐓庡⒋濠碉紕鏁诲畷鍫曨敆閸屾氨銈﹂梻浣告啞閸旀牞銇愰崘顔界厐闂侇剙绉甸悡蹇涙煕閳藉棗骞楅悗姘炬嫹
摘要汉字的表义性是其区别于表音文字的一大特点。部件作为构字单位,同汉字的意义之间有着很大的联系。然而,汉字部件的表义能力究竟如何是学界尚待讨论的课题。针对这一问题,该文从汉字部件入手,提出了融合部件的字词分布式表示模型。该模型在向量内部评测任务上性能获得了一定提升,在汉字理据性测量任务上也与人工打分结果显著相关。基于该模型,进一步提出了部件表义能力的计算方法,对汉字部件的表义能力做了整体评估,并结合部件的构字能力建立了现代汉字部件的等级体系。测量结果显示,现代汉字部件具有一定表义能力,但整体而言表义能力偏低。最后,将测量结果应用于对外汉语教学中,确立了适用于部件教学法的部件范围,并提出了对应的汉字教学顺序方案。

PDF全文下载地址:

http://jcip.cipsc.org.cn/CN/article/downloadArticleFile.do?attachType=PDF&id=3128
相关话题/测量 对外汉语 方案 汉字 部件

  • 领限时大额优惠券,享本站正版考研考试资料!
    大额优惠券
    优惠券领取后72小时内有效,10万种最新考研考试考证类电子打印资料任你选。涵盖全国500余所院校考研专业课、200多种职业资格考试、1100多种经典教材,产品类型包含电子书、题库、全套资料以及视频,无论您是考研复习、考证刷题,还是考前冲刺等,不同类型的产品可满足您学习上的不同需求。 ...
    本站小编 Free壹佰分学习网 2022-09-19
  • ISO/IEC 10646国际编码标准下的香港电脑汉字编码及字形原则
    摘要在ISO/IEC10646国际编码标准中,香港使用的汉字载于H列。该文介绍了如何在ISO/IEC10646国际编码标准下进一步完善香港电脑汉字的扩展机制及H列字符字源资料的编码方案。由于目前H列的很多字形并未完全反映香港的实际习惯写法,因此香港制定了一套适用于香港常用写法的电脑汉字参考字形,该文 ...
    本站小编 Free考研考试 2022-01-02
  • 融入汉字字形特征的中英神经机器翻译模型
    摘要神经机器翻译技术是目前机器翻译应用中取得效果最好的方法。将外部语言学知识如单词词性、依存句法标签引入神经机器翻译系统以提高翻译性能已经被很多****证明是一种行之有效的途径。相较于其他表音文字,汉字是一种形声字,其构造方法具有一半表音、一半表意的特殊结构,这种特殊的构造法使得汉字含有丰富的语义、 ...
    本站小编 Free考研考试 2022-01-02
  • 联机汉字篇章书写质量评价研究
    摘要该文的研究工作针对硬笔汉字篇章书写练习的智能评价与指导需求展开。在PAD等数字录入设备支持的联机书写状态下,以记录书写笔迹的时序点集为依据,先实现分行割字,再进行行水平、行间距稳定性、行间距均匀性、字间距均匀性和左对齐等的计算并获得特征参量。最终通过专家经验赋权法给出直观的书写质量评价结果。实验 ...
    本站小编 Free考研考试 2022-01-02
  • 基于多译文的中文转述语料库建设及转述评价方案
    摘要转述语料是转述现象研究的基础。针对目前学术界中文转述语料稀缺的现状,该文以《简爱》的多个中文译本为基础,通过句对齐得到五万句级别的平行转述语料。使用无监督的小句对齐和词对齐算法,从语料中挖掘到九千多对词汇转述知识。同时,还复现和改进了机器翻译测评指标Meteor,使得该指标更适合于中文转述句子的 ...
    本站小编 Free考研考试 2022-01-02
  • 全委托的公共可验证的外包数据库方案
    摘要:为解决可验证外包数据库方案存在的预处理阶段开销较大及不支持公共可验证的问题,提出了一个全委托的公共可验证的外包数据库模型.给出了模型的架构及交互流程,对模型进行了形式化定义,并给出了模型的正确性定义和安全性定义.利用双线性映射及可验证外包模幂运算协议,构建了一个全委托的公共可验证外包数据库方案 ...
    本站小编 Free考研考试 2022-01-02
  • 基于阈值动态调整的重复数据删除方案
    摘要:云存储已经成为一种主流应用模式.随着用户及存储数据量的增加,云存储提供商采用重复数据删除技术来节省存储空间和资源.现有方案普遍采用统一的流行度阈值对所有数据进行删重处理,没有考虑到不同的数据信息具有不同的隐私程度这一实际问题.提出了一种基于阈值动态调整的重复数据删除方案,确保了上传数据及相关操 ...
    本站小编 Free考研考试 2022-01-02
  • 一种基于MLWE的同态内积方案
    摘要:同态内积在安全多方几何计算、隐私数据挖掘、外包计算、可排序的密文检索等场景有广泛的应用.但现有的同态内积计算方案大多是基于RLWE的全同态加密方案,普遍存在效率不高的问题.在柯程松等人提出的基于MLWE的低膨胀率加密算法基础上,提出了一种同态内积方案.首先给出了密文空间上的张量积运算,该密文空 ...
    本站小编 Free考研考试 2022-01-02
  • 应用区块链的多接收者多消息签密方案
    摘要:信息通过公共链路进行传输时极易遭受窃听、篡改等形式的网络攻击,因此有必要保障信息在传输过程中的机密性和完整性,而签密技术能够有效地实现上述目的.基于椭圆曲线,提出一种多接收者多消息签密方案,能够有效地适配到广播系统中.采用多密钥分发中心管理系统主密钥信息,且能够周期地更新各自的秘密信息,以抵抗 ...
    本站小编 Free考研考试 2022-01-02
  • 医疗大数据隐私保护多关键词范围搜索方案
    摘要:随着医疗信息系统的急速发展,基于医疗云的信息系统将大量电子健康记录(EHRs)存储在医疗云系统中,利用医疗云强大的存储能力和计算能力对EHRs数据进行安全与统一的管理.尽管传统加密机制可以保证医疗数据在半诚实云服务器中的机密性,但对加密后的EHRs数据执行安全、快速、有效的范围搜索,仍是一个有 ...
    本站小编 Free考研考试 2022-01-02
  • 抗量子计算的多变量盲签名方案
    摘要:盲签名是一种特殊的数字签名,可广泛应用于各种匿名场合.目前,大多数盲签名的安全性主要基于大整数分解问题或离散对数问题的难解性.然而,实用量子计算机的即将诞生会使得传统的盲签名不再安全,而且量子算法的出现对传统的盲签名亦提出了挑战.因此,构造能够防御量子计算攻击的盲签名方案具有重要的意义.多变量 ...
    本站小编 Free考研考试 2022-01-02