删除或更新信息,请邮件至freekaoyan#163.com(#换成@)

哈尔滨工业大学计算机科学与技术学院/国家示范性软件学院研究生考研导师简介-刘远超

本站小编 Free考研网/2019-05-25

基本信息科学研究教育教学论文专著
基本信息
刘远超

男,博士,副教授,博士生导师。研究方向:自然语言处理、机器学习、深度学习、数据挖掘等。

博士生、硕士研究生招生联系方式
每年可招收自然语言处理方向博士生1-2名、硕士生3人。

主要培养方向:自然语言处理、机器学习、深度学习等。

请发邮件: ycliuharbin@163.com 。 或者qq:**


荣誉称号
2012年,获国家留学基金委--IBM中国优秀教师奖研金2012年,获国家留学基金委--IBM中国优秀教师奖教金2008年,获国家留学基金委--IBM中国优秀教师奖教金


教育经历
1991年-1995年, 就读于哈尔滨工业大学, 获学士学位1997-1999年,就读于哈尔滨工业大学, 获硕士学位2002年-2006年,就读于哈尔滨工业大学, 获博士学位2007-2009年,就读于哈尔滨工业大学,博士后出站。


主要任职
CCF中文信息专委委员、CCF高级会员、国家自然科学基金同行评议专家、国家科技部专家库专家、教育部学位中心通讯评议专家
顶级国际会议NIPS、期刊《IEEE Transactions on Knowledge and Data Engineering》 (IEEE TKDE)、《计算机学报》、《中文信息学报》、《Artificial Intelligence in Medicine》等学术刊物的审稿专家。


我的新闻



科研项目
主持国家自然科学基金面上项目 “网购产品评论可信计算模型、方法及评价研究”(2017.1--2020.12)主持国家863探索导向类课题“面向大规模文本信息的快速聚类和认知技术研究”(项目编号:2007AA01Z172)主持黑龙江省博士后科研启动金资助(一等),题目为“互联网产品意见量化以及挖掘技术研究”主持哈尔滨工业大学科研创新基金资助,题目为“文本聚类中特征选择技术研究”主持微软重点实验室开放基金,题目为“产品意见细颗粒度挖掘技术研究”.参加的自然基金及863项目:

国家自然科学基金面上项目---基于逻辑框架的多文档自动文摘技术, 2004.1-2004.12(排名第2)国家自然科学基金重点项目—问答式信息检索的理论与方法研究, 2005.1-2008.12国家863计划目标导向类课题“基于NLP的搜索引擎技术研究”2006.12--2008.12企业合作项目:

企业合作项目(北京九瑞公司)“科技文献自动分类检索”, 2005.3-2005.12;(负责聚类模块)


研究领域
数据挖掘;自然语言处理等

奖励情况
2011年,“网络环境拼音语句输入技术”获黑龙江省技术发明奖一等奖(排名第6)


演示系统
写作辅助系统 WINGS:演示视频@爱奇艺: http://www.iqiyi.com/w_19rsbbnk8l.html#vfrm=8-8-0-1UH , 请选择超清 720p 模式观看;


Code 及语料
复杂情感语义块(下载地址:http://pan.baidu.com/s/1c1qEZgG );用python实现的细颗粒度情感分析程序(下载地址:http://pan.baidu.com/s/1hryEwO8);用python实现的面向亚马逊语料评价的评论者行为特征提取程序(下载地址:http://pan.baidu.com/s/1RaDuY)Wings写作辅助系统的代码(下载地址:http://pan.baidu.com/s/1jHfQz7S)和安装包(下载地址:http://pan.baidu.com/s/1i4kCsgl),具体实现细节见ACL 2014 Paper:Xian-jun dai,Yuan-chao Liu(*Corresponding author). WINGS: Writing with Intelligent Guidance and Suggestions. ACL 2014 . baltimore, USA, June 22-25,2014.


招生信息
研究方向:自然语言处理、搜索、数据挖掘等。毕业研究生去向较好,一般为BAT(百度、阿里、腾讯等),年薪约30万元以上。

指导的计算机学院硕士研究生名单:

2006:刘娟(协助)、罗克刚(协助)、沙新光(协助)、钟彬彬(协助)、刘寒磊(协助)

2007:朱善宗(台资公司)

2008:马二磊(大唐)、郭凯(去哪网)

2009:宋明凯(航天部)、蒋磊(腾讯)

2010:程辉(搜狗公司)、高雄(总参)、王鑫(读博)

2011:吴峰(58同城)、张想(腾讯)

2012:李静静(中国平安保险公司)、代贤俊(本科合肥工大,目前就职于阿里巴巴杭州)

2013:孔行(腾讯)、陈俊文(百度)

2014:王俊琪(腾讯)、张婷婷

2015: 张恒(腾讯)、陈姗姗

2016: 连冬阳(今日头条)、庞博(百度)

2017: 许博、李跃

指导的软件学院工程硕士名单:

2017: 崔鹏、麻俊满、胡乐
2016:于泽萍(百度)、刘宇

2015 王明月

2014: 赵计刚、王云龙(杭州同花顺)、王秀忱

2011:陈剑平

2008:柯巍、张超、李锋、盘隆

2009:张勇(深圳电信)、刘其伟、张磊

指导的本科生名单:

2007:陈云星、张亮、王岩峰、王灯武、徐遥(软件学院)、姚佳瑜(软件学院)

2008:刘刚毅、蒋磊

2009:程辉

2010:张想、吴震(搜狗公司)

2011:段刚

2012:于文涛、陶冶

2014: 于晶、姜嘉尧、苗宇庭

2015:陈炼、王思雨、花澍、王世玉、王与琛(软件学院,北京大学读研)、孙晋权(软件学院,南京大学读研)

2016:李誉峰、黄永生、后润李、李婷婷、孙兵、崔鹏、周鑫鹏、柳洋(保研浙大)、于喜超

2017: 杨斌斌(保研清华大学)、王进翔(深圳tplink公司)




讲授课程
承担课程与教学情况:

2017 起开设创新研修课《自然语言处理的深度学习方法》;计算机学院、软件学院AIX、E-business、Linux等课程的任课教师;IBM公司大学合作部兼职讲师,曾在北京大学担任教育部-IBM公司合作项目Lotus Domino&Notes的T3教师;
《电子商务》课程

课程编号:S**

课程中文名称:电子商务(核心知识)

课程英文名称:e-business—core knowledge

总学时:30 讲课学时:20 习题课学时:0 实验学时:10 上机学时:0

总学分:2

授课对象:计算机科学与技术专业、信息安全专业、生物信息技术专业

先修课程:计算机网络、操作系统、internet 技术、java语言、动态网页设计等

课程要求:选修课

课程分类:专业课

开课单位:计算机科学与技术学院

课程教学目的电子商务课程是一门用以培养学生了解电子商务原理,设计电子商务网站能力的技术选修课,本课程主要以IBM有限公司的电子商务解决方案为例,研究一个比较典型的电子商务网站的工作原理、设计工具及其设计过程,其主要任务是培养:

树立正确的商务理念以及规划构建电子商务系统的设计思想,理论联系实际,培养创新精神。掌握设计电子商务网站规划、设计和建设的基本概念、基本知识、基本方法和技能,了解电子商务网站的架构,培养正确的设计理念和构建电子商务系统的设计方法,培养利用JSP和Servlet等技术构建电子商务系统的能力。了解IBM公司设计电子商务系统的工具。掌握电子商务应用的部署。培养学生把握电子商务的新理论、新方法和未来发展趋势的能力。

教学内容及学时安排 电子商务核心技术课程的教学内容包括:

1.绪论(Introduction)2学时

主要介绍电子商务(核心技术)课程的目的意义;电子商务的研究对象、研究内容;本门课程的性质、特点和学习方法。

2.WEB初步及电子商务智能(A Web Programming Primer)6学时

WEB原理;客户端技术;服务器端技术;Servlet与JSP等各种常用WEB技术基本知识;cache等WEB技术与网站安全等内容简介、自然语言处理技术在智能电子商务上的应用。

3.一个电子商务网站实例(Designing the Home Banking Application)4学时

如何针对该具体商务网站实例利用Rational Rose等工具进行设计,如利用用例来表示应用逻辑,动态内容生成,状态维护等。

4.常用电子商务开发工具简介(Tool Usage in the Home Banking Application)4学时

IBM公司电子商务系统开发工具介绍,如:Visual Age for Java,netobjects fusion,netobjects beanbuilder ,websphere studio , websphere application server 等。

5.具体实现(Implementing the Home Banking Application , Deploying the Home Banking Application)4学时

各个子系统如:防火墙、商务模型等的具体实现以及应用部署等具体问题。

三、教学基本要求

1.课程基本要求:

使学生在理解电子商务的架构,掌握电子商务的基本概念,基本知识和基本技能的基础之上,能够把握电子商务系统的总体架构,掌握电子商务系统设计中的关键技术,了解当前常用的电子商务开发工具,进行电子商务系统规划与设计。

2.实验基本要求:

通过实验使学生感性地了解电子商务系统及其各项关键技术,并能够将先行课所学的基本技术和知识运用到实际的电子商务系统中,学习和熟悉IBM电子商务开发工具Websphere的使用,并利用Websphere设计一个简单的银行系统。

3.考试基本要求:

根据学生具体情况可选择主客观题考试的形式或采用让学生写有关电子商务或其中课题解决方案及其相关论文等形式考核。

IBM DB2 数据库系统》课程

课程编号:

课程中文名称:IBM DB2 数据库系统

课程英文名称:IBM DB2 database system

总学时:30 讲课学时:30 习题课学时:0 实验学时:0 上机学时:0

总学分:2.0

授课对象:软件工程专业本科生

先修课程:数据库系统

课程要求:选修课

课程分类:技术基础课

开课单位:软件学院

教材:IBM公司提供的通用标准教材《IBM DB2 database system》

一、课程教学目的:

通过该课程的学习,让学生掌握目前在银行等金融服务机构普遍使用的IBM DB2数据库系统的实际应用知识。IBM DB2是一种高端应用数据库,可以运行在不同的机器平台(包括pc机、小型机和大型机)和不同的操作系统平台(windows,linux,AIX等等)上。

二、教学内容:

IBM DB2数据库系统的核心知识和常用工具的使用(2学时)

IBM DB2数据库系统的备份管理、用户管理等(2学时)

IBM DB2数据库系统的编程和调试环境的熟悉,面向应用的程序设计和调试案例介绍(2学时)

DB2 PureXMl技术(2学时)

三、建议授课模式及对教师的能力要求:

授课模式:中文/双语; 授课教师:教师应该熟练掌握 IBM DB2数据库系统的基本知识和实际编程环境。

《中文信息处理》课程

课程编号:

课程中文名称:中文信息处理

课程英文名称(In English):Natural Language Processing

总学时:40 讲课学时:30 习题课学时:0 实验学时:0 上机学时:10

总学分:2.0

授课对象:计算机专业本科生(成人教育)

先修课程:数据库系统

课程要求:选修课

课程分类:技术基础课

开课单位:计算机学院

教材:自编课件

一、课程教学目的:

通过该课程的学习,掌握中文信息处理的主要方法和基本理论,了解中文语言处理研究的现状、主要研究对象及所面临的问题,同时为未来的工作奠定扎实的基础。

二、教学内容:

汉字编码

汉字输入输出简介

汉语分词

基于语言理解的处理方法

统计语言模型

音字转换技术

汉字识别技术

信息检索技术

三、建议授课模式及对教师的能力要求:

授课模式:中文。



《大学计算机基础》课程,详见乐学网 https://cms.hit.edu.cn

教学成果
申报的《AIX/Linux操作系统高级开发技术》被批准为教育部-IBM 2011年精品课程。

论文期刊


近年来发表的论文主要有:

Yuanchao Liu, Xin Wang, Ming Liu, Xiaolong Wang. Write-righter: an academic writing assistant sytem. AAAI 2016, USA, phoenix.(CCF A类)


Yuanchao Liu, Ming Liu Xin Wang. Towards Semantically sensitive Text Clustering: A Feature Space Modeling Technology Based on Dimension Extension. Plos one, 10(3), 2015. (SCI, IF: 3.5)

Xin Wang, Yuanchao Liu, Ming Liu, Chengjie Sun, Xiaolong Wang: Understanding Gating Operations in Recurrent Neural Networks through Opinion Expression Extraction. Entropy 18(8): 294 (2016) (SCI: 1.743)

Xin Wang, Yuanchao Liu, Chengjie Sun, Ming Liu, Xiaolong Wang. Extended Dependency-Based Word Embeddings for Aspect Extraction. ICONIP 2016. Kyoto,Japan,October 16 to 21, 2016. (CCF C类)


Xin Wang; Yuanchao Liu; Xiaolong Wang; Baoxun Wang. Predicting Polarities Of Tweets By Composing Word Embedding With Long Short-Term Memory. ACL 2015, BeiJing. Xian-jun dai,Yuan-chao Liu(*Corresponding author). WINGS: Writing with Intelligent Guidance and Suggestions. ACL 2014 . baltimore, USA, June 22-25,2014. (CCF A类)
Yuan-chao Liu, Ming liu, Xiaolong Wang, Jingjing Li. PAL: A Chatterbot System for Answering Domain-specific Questions. ACL 2013, Sofia, Bulgaria, August 4-9,2013 (CCF A类)
Yuan-Chao Liu,Chong Wu, Ming Liu. Research of Fast SOM Clustering for Text Information. Expert Systems with Applications. Volume 38, Issue 8, August 2011, Pages 9325-9333. (SCI, IF:2.2)
Yuan-chao Liu, Xiao-long Wang, etc. ConSOM: A conceptional self-organizing map model for text clustering. Neurocomputing. Volume 71, Issues 4-6, January 2008, Pages 857-862. (SCI, IF: 1.6)
Ming Liu; Chong Wu; Yuanchao Liu, Weight evaluation for features via constrained data-pairscan’t-linkq, Information Sciences (SCI, IF:3.6), 282卷, pp 70-91, 2014/10/20
Ming Liu,Yuan-chao Liu. Probability-based text clustering algorithm by alternately repeating two operations. Journal of Information Science06/2013; 39(3):372-383. . (SCI, IF:1.2)
刘远超;宋明凯;刘铭. 用于细颗粒度挖掘的产品评论语料库构建技术. 哈尔滨工业大学学报,2012,44(3):64-68.
刘铭,王晓龙, 刘远超. 基于词汇链的关键短语抽取方法的研究. 计算机学报.2010, 33(7):1246-1255(EI检索:**899)
Yuanchao LIU, Xiaolong WANG, Ming LIU. V-SOM: A Text Clustering Method based on Dynamic SOM Model. Journal of Computational Information Systems. 2009,5(1): 141-145(国际期刊,EI检索:**714)
卢志茂,徐森,刘远超.使用"分裂-合并"策略改进文本聚类集成算法的研究. 高技术通讯, 2010,20(7):714-718(EI检索:**452)
Lei jiang, yuanchao liu, bingquan liu, chengjie sun. Research of Sentiment Block Identification for Customer Reviews Based on Conditional Random Fields. AIRS 2010, TAIPEI:261-269(EI检索:**297)
Ming liu, xiaolong wang, yuanchao liu.Research on Clustering Technology Based on Manual Feedback.Journal of information. 2010,13(1):175-185( SCI检索:587CX
刘铭, 王晓龙,刘远超. 面向大规模高维数据快速聚类的研究. 自动化学报. 2009,35(7):859-866(EI检索:**562)
刘铭, 王晓龙,刘远超. 基于主题分析的文本分割技术研究. 电子学报. 2009,37(2):278-284(EI检索:**280)
Zhu Kunpeng, Wang Xiaolong, Liu Yuanchao. A new query expansion method based on query logs mining. International Journal on Asian Language Processing, 2009, 19 (1): 1-12.
刘铭,刘远超,王晓龙. 主题分析技术在文档聚类中的应用. 哈尔滨工业大学学报. 2009,41(3):682-686.(EI检索:**352)
Peiliang tian, yuanchao liu, Ming Liu. Research of Product Ranking Technology Based on Opinion Mining. The Second International Conference on Intelligent Computation Technology and Automation. Changsha, Hunan, China. 10-11 october 2009. Pages: 239-243. (EI检索:**869)
Shanzong Zhu, Yuanchao Liu, Ming Liu. Research on Feature Extraction from Chinese Text for Opinion Mining. International Conference on Asian Language Processing (IALP). 2009, Singapore. pages:7-10.(EI检索:**773)
Ming Liu, Yuan-Chao Liu, Xiao-Long Wang. FSSOM: One Novel SOM Clustering Algorithm Based on Feature Selection. 2008 International Conference on Machine Learning and Cybernetics(ICMLC),2008: 429-435(EI检索: **955)
Li-juan wang, Xiao-long Wang, yuan-chao liu. Combination Of Multiple Real-Valued Nearest Neighbor Classifiers Based On Different Feature Subsets With Fuzzy Integral. International Journal of Innovative Computing, Information and Control. 2008,4(2):369-379(SCI检索:264FL
Kegang luo, yuanchao liu, xiaolong, wang. A Dynamic SOM Algorithm for Clustering Large-scale Document Collection. The 6th International Conference on Advanced Language Processing and Web Information Technology ALPIT)luoyang,China. 2007:15-20(EI检索:**)
Ming Liu, Yuan-Chao Liu, Xiao-Long Wang. IGSOM: Incremental Clustering Based on Self-Organizing-Mapping. The Fourth International Conference on Intelligent Information Hiding and Multimedia Signal Processing,(IIHSMP,EI), 2008. Pages:885-890(EI检索:**)
刘远超,王晓龙等.文本聚类综述.中文信息学报,2006,20(3):55-62.
刘远超,王晓龙等. 基于多知识源融合的关键词重要性评价研究.哈尔滨工业大学学报,2007,39(7):1138-1141(EI检索:**)
Xinguang Sha, Yuanchao Liu, Ming Liu, Xiaolong Wang. A Clustering Retrieval System of Chinese information. 2008 IEEE International Conference on Natural Language Processing and Knowledge Engineering (IEEE NLP-KE@#%08), Beijing, China, October 2008.Pages:1-6(EI检索: **345)
刘远超,王晓龙等.基于聚类分析策略的文本偏好挖掘.计算机应用研究. 2005,12.pages:21-23.
Juan Liu, Yuanchao Liu, Wei Jang, Xiaolong Wang. Research on Automatic Acquisition of Domain Terms.2008 International Conference on Machine Learning and Cybernetics(ICMLC), Kunming, China, July 2008.:3026-3031(EI检索:**)
刘远超,王晓龙等.信息检索中的聚类分析技术.电子与信息学报.2006,28(4) :606-609(EI检索:**)
刘远超,王晓龙等.基于粗集理论的中文关键词短语构成规则挖掘.电子学报,2007, 35(2): 371-374(EI检索:**).
刘远超,王晓龙等.一种改进的k-means文本聚类初值选择算法.高技术通讯.2006.16(1):11-15 (EI检索:**)
李鹏, 王晓龙, 刘远超, 王宝勋.一种基于混合策略的失衡数据集分类方法.电子学报.2007,35(11):2161-2165.

出版物
参加编写专著一部《计算机自然语言处理》,清华大学出版社,2005年5月,ISBN:**



相关话题/课程 技术 系统 设计 中文