删除或更新信息,请邮件至freekaoyan#163.com(#换成@)

基于优化“未定义”类话语检测的话语领域分类

本站小编 Free考研考试/2022-01-02

摘要“未定义”类话语在面向任务的对话语料中广泛存在,具有成分复杂,与其余“已定义”类话语边界模糊的特点,影响着话语领域的分类总体正确率。“未定义”类话语一旦错分,将会使用户对口语对话系统的功能有效性产生怀疑,导致大大降低用户体验。该文提出一种基于优化“未定义”类话语检测的领域分类方案,采用两阶段法完成口语话语的领域分类任务。首先,采用聚类方法将“已定义”类话语聚为几个大类,简化众多的“已定义”类话语独立存在时与“未定义”类话语之间的边界。进而利用分类模型对聚类后的“已定义”类话语大类以及“未定义”类话语进行领域分类,优化目标是“未定义”类话语的检测效率。最后,将第一阶段分类为“已定义”类的话语,在去除了绝大部分“未定义”类话语干扰的基础上进行再次分类。该文的分类模型采用了深度学习模型LSTM,并利用无标签微博数据训练词向量用于话语特征表达。在SMP 2017 意图领域分类比赛的多任务语料上的评测结果表明,该方案在 “未定义”类话语检测的F1值以及所有话语的领域分类总正确率上均有明显提升。

PDF全文下载地址:

http://jcip.cipsc.org.cn/CN/article/downloadArticleFile.do?attachType=PDF&id=2555
相关话题/方案 优化 系统 数据 干扰

  • 领限时大额优惠券,享本站正版考研考试资料!
    大额优惠券
    优惠券领取后72小时内有效,10万种最新考研考试考证类电子打印资料任你选。涵盖全国500余所院校考研专业课、200多种职业资格考试、1100多种经典教材,产品类型包含电子书、题库、全套资料以及视频,无论您是考研复习、考证刷题,还是考前冲刺等,不同类型的产品可满足您学习上的不同需求。 ...
    本站小编 Free壹佰分学习网 2022-09-19
  • 儿童外语学习认知数据收集的在线游戏框架
    摘要近年来,人工智能技术飞速发展,不少工作试图从人类的认知发展过程中探索前进方向,语言学习认知的过程成为了重点关注的研究领域。已有的语言认知研究工作主要集中在学龄前儿童母语的词汇学习认知方面,依赖于WordBank①等大规模语料库。然而就我们所知,目前在第二语言学习方面研究不多,尚未有大规模的第二语 ...
    本站小编 Free考研考试 2022-01-02
  • 基于Spark的大规模语义规则后向链推理系统
    摘要近年来,语义网数据快速增长,适合于处理静态小规模语义数据的前向链语义推理技术暴露出了需对数据进行频繁更新等问题。面对大规模动态语义网数据,对数据更新不敏感的后向链语义推理开始成为新的研究热点。后向链语义推理由查询目标驱动,在查询时根据规则集推理出查询结果。后向链语义推理具有推理过程复杂、规则扩展 ...
    本站小编 Free考研考试 2022-01-02
  • MHW蒙古文脱机手写数据库及其应用
    摘要建立公开、权威的蒙古文手写数据库是研究和开发蒙古文手写识别系统的基础。该文在蒙古文编码、构词和语法的研究基础上,公开了一个蒙古文大词汇量脱机手写数据库MHW,其中训练集由5000个单词构成,每个词采集了20个样本,共包含10万样本,测试集Ⅰ包含5000样本,测试集Ⅱ包含14085样本。该文利用蒙 ...
    本站小编 Free考研考试 2022-01-02
  • 面向多目标优化的多样性代理辅助进化算法
    摘要:代理辅助进化算法(SAEA)是目前解决昂贵优化问题的一种有效途径.提出一种基于多样性的代理辅助进化算法(DSAEA)来解决昂贵多目标优化问题.DSAEA采用Kriging模型近似每个目标来代替原目标函数进行评估,加速了进化算法的优化过程.其引入参考向量把问题分解为多个子问题,根据解与参考向量之 ...
    本站小编 Free考研考试 2022-01-02
  • 全委托的公共可验证的外包数据库方案
    摘要:为解决可验证外包数据库方案存在的预处理阶段开销较大及不支持公共可验证的问题,提出了一个全委托的公共可验证的外包数据库模型.给出了模型的架构及交互流程,对模型进行了形式化定义,并给出了模型的正确性定义和安全性定义.利用双线性映射及可验证外包模幂运算协议,构建了一个全委托的公共可验证外包数据库方案 ...
    本站小编 Free考研考试 2022-01-02
  • 基于动态赋权近邻传播的数据增量采样方法
    摘要:数据采样是快速提取大规模数据集中有用信息的重要手段,为更好地应对越来越大规模的数据高效处理要求,借助近邻传播算法的优异性能,通过引入分层增量处理和样本点动态赋权策略,实现了一种能够非常有效地平衡处理效率和采样质量的新方法.其中的分层增量处理策略考虑将原始的大规模数据集进行分批处理后再综合;而样 ...
    本站小编 Free考研考试 2022-01-02
  • 面向数据特征的人机物融合服务分派方法
    摘要:随着工业互联网的不断发展,大数据和人工智能促成了人机物全面互联.用户使用服务时产生的任务数据量正呈指数级增长,在为线上用户推荐服务满足个性化需求的同时,对于需要通过人机物交互完成的服务,如何整合线上和线下资源,并分派合适的人快速、有效地完成任务,也已成为一个挑战性问题.为了保证服务分派的准确性 ...
    本站小编 Free考研考试 2022-01-02
  • 噪音数据的属性选择算法
    摘要:正则化属性选择算法减小噪音数据影响的效果不佳,而且样本空间的局部结构几乎没有被考虑,在将样本映射到属性子空间后,样本之间的联系与原空间不一致,导致数据挖掘算法的效果不能令人满意.提出一个抗噪音属性选择方法,可以有效地解决传统算法的这两个缺陷.该方法首先采用自步学习的训练方式,这不仅能大幅度降低 ...
    本站小编 Free考研考试 2022-01-02
  • 改进的元启发式优化算法及其在图像分割中的应用
    摘要:元启发式算法自20世纪60年代提出以后,由于其具有可以有效地减少计算量、提高优化效率等优点而得到了广泛应用.该类算法以模仿自然界中各类运行机制为特点,具有自我调节的特征,解决了诸如梯度法、牛顿法和共轭下降法等这些传统优化算法计算效率低、收敛性差等缺点,在组合优化、生产调度、图像处理等方面均有很 ...
    本站小编 Free考研考试 2022-01-02
  • 优化简单表缩减算法求解因子分解编码实例
    摘要:表约束在约束程序(constraintprogramming,简称CP)中被广泛研究.目前,求解表约束问题效率最高的算法是CT(compact-table)和STRbit(simpletabularreductionbit).它们在搜索过程中维持广义弧相容(generalizedarccons ...
    本站小编 Free考研考试 2022-01-02