摘要社会网络平台上的社交短文本不同于网页或其他文本,它的特点是内容短、文本间存在转发评论等关系、话题复杂多样、与Web页面有链接关系、文本的作者间有关注关系等,现有的检索系统不能完全适应。该文提出一个基于多重增强图的社交短文本检索方法SSTR,它利用多重增强图算法对通过Indri获得的初步检索结果实现再排序优化和去重。多重增强图算法是基于马尔科夫链理论设计出的图模型算法,社交短文本中蕴含的文本、作者、词语等不同层面的关系通过不同的图层及图中节点之间的边来建模。三个层面的关系相互增强,通过多次迭代运算,最终寻求多个层面间相互关系所处的稳定状态。多重增强图构建时,短文本的相似度计算基于主题分析结果,克服了传统余弦相似度计算时TF-IDF权重在短文本上的局限性。实验结果表明,与Indri、reRank-COS和reRank-LDA相比,基于多重增强图算法的SSTR排序的效果更好,适合初始检索结果相对较多的应用场合。
PDF全文下载地址:
http://jcip.cipsc.org.cn/CN/article/downloadArticleFile.do?attachType=PDF&id=2540
删除或更新信息,请邮件至freekaoyan#163.com(#换成@)
基于多重增强图和主题分析的社交短文本检索方法
本站小编 Free考研考试/2022-01-02
相关话题/计算 社会 网络 优化 设计
网络传播信息内容的可信度研究进展
摘要网络中存在着大量的谣言、偏激和虚假信息,这对网络信息的质量、可信度以及舆情的产生与发展趋势具有严重的负面影响。为实现信息可信度的准确判断与高效度量,该文在大量已有最新研究成果与文献的基础上,将不可信信息分为极端突发事件信息、网络偏激信息、网络谣言、虚假信息、误报信息和垃圾信息等类型,并分别针对这 ...中科院软件研究所 本站小编 Free考研考试 2022-01-02基于双向LSTM神经网络模型的中文分词
摘要中文分词是中文自然语言处理的基础。分词质量的好坏直接影响之后的自然语言处理任务。目前主流的分词是基于传统的机器学习模型。近年来,随着人工智能大潮的又一次兴起,长短期记忆(LSTM)神经网络模型改进了普通循环神经网络模型无法长期依赖信息的缺点,被广泛应用于自然语言处理的各种任务中,并取得了不错的效 ...中科院软件研究所 本站小编 Free考研考试 2022-01-02基于深度神经网络的语义角色标注
摘要该文提出了一个基于多层长短期记忆神经网络的语义角色标注方法,并装置了新颖的“直梯单元”(elevatorunit,EU)。EU包含了对单元内部输入和输出的线性连接,使信息可以通畅地在不同层之间传播。通过EU,一个20层的LSTM网络可以得到比较充分的优化。重要的是,这个线性连接包含的“门”函数可 ...中科院软件研究所 本站小编 Free考研考试 2022-01-02开放域上基于深度语义计算的复述模板获取方法
摘要利用实体关系从网络大规模单语语料获取复述模板的方法可以规避对单语平行语料或可比语料的依赖,但是后期需要人工对有语义差异的关系模板分类后获取复述模板。针对这一遗留问题,该文提出基于深度语义计算的复述模板自动获取方法,首先设计基于统计特征的模板裁剪方法,从非复述语料中获取高质量的关系模板,然后设计基 ...中科院软件研究所 本站小编 Free考研考试 2022-01-02融合CNN和结构相似度计算的排比句识别及应用
摘要排比句具有结构紧凑、句式整齐、富有表现力等鲜明的特点,广泛应用在各种文体之中,在近几年语文高考的鉴赏类问题中也多有考察,但在自动识别方面的研究还鲜有涉及。该文依据排比句结构相似、内容相关的特点,以句子的词性、词语作为基本特征,设计了融合卷积神经网络和结构相似度计算的排比句识别方法。首先将词向量和 ...中科院软件研究所 本站小编 Free考研考试 2022-01-02面向多目标优化的多样性代理辅助进化算法
摘要:代理辅助进化算法(SAEA)是目前解决昂贵优化问题的一种有效途径.提出一种基于多样性的代理辅助进化算法(DSAEA)来解决昂贵多目标优化问题.DSAEA采用Kriging模型近似每个目标来代替原目标函数进行评估,加速了进化算法的优化过程.其引入参考向量把问题分解为多个子问题,根据解与参考向量之 ...中科院软件研究所 本站小编 Free考研考试 2022-01-02基于实值RBM的深度生成网络研究
摘要:受限玻尔兹曼机(restrictedBoltzmannmachine,简称RBM)是一种概率无向图,传统的RBM模型假设隐藏层单元是二值的,二值单元的优势在于计算过程和采样过程相对简单,然而二值化会对基于隐藏层单元的特征提取和数据重构过程带来信息损失.因此,将RBM的可见层单元和隐藏层单元实值 ...中科院软件研究所 本站小编 Free考研考试 2022-01-02基于可变形卷积时空网络的乘车需求预测模型
摘要:随着滴滴、Uber等出租车服务的日益普及,用户的乘车需求预测逐渐成为智慧城市、智慧交通的重要组成部分.准确的预测模型既可以满足用户的出行需求,也可以降低道路车辆空载率,有效地避免资源浪费,并缓解交通压力.车辆服务商可以收集到大量GPS数据及用户需求数据,然而,如何合理运用数据进行需求预测,是关 ...中科院软件研究所 本站小编 Free考研考试 2022-01-02基于混合神经网络的脑电时空特征情感分类
摘要:提出一种脑电图(electroencephalograph,简称EEG)数据表示方法,将一维链式EEG向量序列转换成二维网状矩阵序列,使矩阵结构与EEG电极位置的脑区分布相对应,以此来更好地表示物理上多个相邻电极EEG信号之间的空间相关性.再应用滑动窗将二维矩阵序列分成一个个等长的时间片段,作 ...中科院软件研究所 本站小编 Free考研考试 2022-01-02功能分发网络:基于容器的智能边缘计算平台
摘要:随着大数据、机器学习等技术的发展,网络流量与任务的计算量也随之快速增长.研究人员提出了内容分发网络(CDN)、边缘计算等平台技术,但CDN只能解决数据存储,而边缘计算存在着难以管理和不能跨集群进行资源调度等问题.容器化技术广泛应用在边缘计算场景中,但目前,边缘计算采取的容器编排策略普遍比较低效 ...中科院软件研究所 本站小编 Free考研考试 2022-01-02