DOI: 10.11908/j.issn.0253-374x.2019.04.019
作者:
作者单位:
作者简介:
通讯作者:
中图分类号: TP391
基金项目: 国家自然科学基金资助项目(71171126); 上海市科学技术委员会“科技创新行动计划”资助项目(16511104704); 同济大学青年优秀人才培养计划(1508-219-040).
Topic Discovery Method of Stock Bar Forum Based on Integration of Frequent Item-set and Latent Semantic Analysis
Author:
Affiliation:
Fund Project:
摘要
| 图/表
| 访问统计
| 参考文献
|相似文献
| 引证文献
| 资源附件
摘要:针对股评论坛主题发现,提出基于频繁项集与潜在语义相结合的短文本聚类(STC_FL)框架.在基于知网的知识获取后得到概念向量空间,挖掘并筛选出重要频繁项集,然后采用统计和潜在语义相结合的方法进行重要频繁项集的自适应聚类.最后,提出TSCSN(text soft classifying based on similarity threshold and nonoverlapping)算法,通过参数调优策略选择和控制文本软聚类过程.股吧论坛数据实证分析发现:所提出的STC_FL框架和TSCSN算法可充分挖掘文本潜在语义信息,并有效降低特征空间维度,最终实现对短文本的深层次信息挖掘和主题归类.
Abstract:To achieve more effective topic discovery of stock bar forum, this paper presents a framework with short text clustering based on frequent itemset and latent semantic (STC_FL). The important frequent itemsets are acquired with the concept vector space based on HowNet, and then a combination pattern of statistics and latent semantics is used to realize the selfadaptive clustering of important frequent itemsets. Finally, the algorithm of text soft classifying based on similarity threshold and nonoverlapping (TSCSN) is proposed. Text soft clustering is selected and controlled with parameter optimization. By taking the real stock bar forum data as a specific case of empirical analysis, it is shown that STC_FL framework and TSCSN algorithm can fully exploit the latent semantic information of text and reduce the dimension of feature space, which realizes the deep information mining and topic classification of short texts.
PDF全文下载地址:
点我下载PDF
删除或更新信息,请邮件至freekaoyan#163.com(#换成@)
融合频繁项集和潜在语义分析的股评论坛主题发现方法
本站小编 Free考研考试/2022-02-13
相关话题/信息 文献 空间 统计 同济大学
既有空间结构位形推算的空间系统抽样方法
DOI:10.11908/j.issn.0253-374x.2019.05.001作者:作者单位:作者简介:通讯作者:中图分类号:TU393.3基金项目:国家自然科学基金项目(51678431)SpatialSystemSamplingMethodforReckoningGeometricShape ...同济大学科研学术 本站小编 Free考研考试 2022-02-13驾驶员驾驶行为的统计学特性
DOI:10.11908/j.issn.0253-374x.2019.06.013作者:作者单位:作者简介:通讯作者:中图分类号:U471.3基金项目:国家重点研发计划(2016YFB0100904-2)DrivingBehaviorStatisticalCharacteristicsoftheDr ...同济大学科研学术 本站小编 Free考研考试 2022-02-13基于信息熵的城市道路可变信息板布点方法
DOI:10.11908/j.issn.0253-374x.2019.08.010作者:作者单位:作者简介:通讯作者:中图分类号:U491.1基金项目:“十三五”国家科技支撑计划(2014BAG03B02)LocationOptimizationofUrbanVariableMessageSignB ...同济大学科研学术 本站小编 Free考研考试 2022-02-13基于建筑信息模型的支吊架全过程设计系统
DOI:10.11908/j.issn.0253-374x.2019.10.001作者:作者单位:作者简介:通讯作者:中图分类号:TP391基金项目:国家自然科学基金(51578404)WholeProcessDesignSystemforSupportandHangerStructuresBase ...同济大学科研学术 本站小编 Free考研考试 2022-02-13基于多源信息的桥梁网级评估方法
DOI:10.11908/j.issn.0253-374x.2019.11.006作者:作者单位:作者简介:通讯作者:中图分类号:TU997基金项目:国家重点研发计划(2017YFC1500605),上海市科委(18DZ1201203)AConditionAssessmentMethodforBri ...同济大学科研学术 本站小编 Free考研考试 2022-02-13多尺度空间下的隧道裂缝与渗水区域检测
DOI:10.11908/j.issn.0253-374x.2019.12.019作者:作者单位:作者简介:通讯作者:中图分类号:TP391.41基金项目:国家自然科学基金(51878486)TunnelCrackandSeepageDetectioninMulti-scaleSpaceAuthor ...同济大学科研学术 本站小编 Free考研考试 2022-02-13基于信息熵和Lempel-Ziv的生产线复杂性测度与线平衡
DOI:10.11908/j.issn.0253-374x.2018.02.013作者:作者单位:同济大学,同济大学,同济大学,同济大学作者简介:通讯作者:中图分类号:TH166.TH162基金项目:国家高档数控机床与基础制造装备科技重大专项(2013ZX04012-071);上海市科委(上海市科技 ...同济大学科研学术 本站小编 Free考研考试 2022-02-13基于建筑信息模型的建筑多专业协同设计流程分析
DOI:10.11908/j.issn.0253-374x.2018.08.020作者:作者单位:天津大学软件学院天津300354,天津大学建筑学院天津300072,天津大学软件学院天津300354作者简介:通讯作者:中图分类号:TU17基金项目:浙江大学CAD&CG国家重点实验室开放课题(A182 ...同济大学科研学术 本站小编 Free考研考试 2022-02-13基于统计能量法的汽车风噪传播特性分析
DOI:10.11908/j.issn.0253-374x.2018.12.012作者:作者单位:同济大学上海地面交通工具风洞中心,同济大学汽车学院,同济大学理学部,重庆长安有限公司作者简介:通讯作者:中图分类号:U461.1基金项目:上海市地面交通工具空气动力与热环境重点实验室科研计划项目(18D ...同济大学科研学术 本站小编 Free考研考试 2022-02-13基于互信息理论与递归神经网络的短期风速预测模型
王岩a,陈耀然a,韩兆龙a,b,c,周岱a,b,c(),包艳a,b,ca.上海交通大学船舶海洋与建筑工程学院,上海200240b.上海交通大学海洋工程国家重点实验室,上海200240c.上海交通大学水动力学教育部重点实验室,上海200240收稿日期:2020-12-25出版日期:2021-09-28 ...上海交通大学科研学术 本站小编 Free考研考试 2022-02-12