男,1970年生,黑龙江省宁安市人。教授、博士生导师。曾主持、参加过多项国家自然科学基金重点及面上、八六三项目重点及面上项目,以及国际国内合作项目的研究。在IEEE TRANSACTION on SMC等国际期刊,《中国科学》《计算机学报》等国内一级期刊和核心期刊,ACL,ICDM等国际国内会议上发表论文八十余篇,提出了系统相似及其测度理论等多项创新成果,出版专著一部。
联系方式
关毅教授
电 话:**
E-mail:guanyi@hit.edu.cn
邮 编:150001
个人主页:wi.hit.edu.cn/1/professors/guanyi.html
工作经历
2000年香港科技大学电气与电子工程系人类语言技术中心任副研究员
2001年香港Weniwen有限公司任研究科学家
2001年5月哈尔滨工业大学任教
2001年10月特评为哈尔滨工业大学副教授
2006年哈尔滨工业大学教授
2007年哈尔滨工业大学博士生导师
教育经历
1988年至1992年在天津大学计算机科学与工程系软件专业获工学学士学位。1992年至1995年在哈尔滨工业大学计算机应用专业获得硕博连读资格1995年至1999年在哈尔滨工业大学计算机应用专业获得博士学位
我的新闻
-----------------------------------------------------------------
基本信息
男,1970年生,黑龙江省宁安市人。教授、博士生导师。曾主持、参加过多项国家自然科学基金重点及面上、八六三项目重点及面上项目,以及国际国内合作项目的研究。在IEEE TRANSACTION on SMC等国际期刊,《中国科学》《计算机学报》等国内一级期刊和核心期刊,ACL,ICDM等国际国内会议上发表论文八十余篇,提出了系统相似及其测度理论等多项创新成果,出版专著一部。
联系方式
关毅教授
电 话:**
E-mail:guanyi@hit.edu.cn
邮 编:150001
个人主页:wi.hit.edu.cn/1/professors/guanyi.html
工作经历
2000年香港科技大学电气与电子工程系人类语言技术中心任副研究员
2001年香港Weniwen有限公司任研究科学家
2001年5月哈尔滨工业大学任教
2001年10月特评为哈尔滨工业大学副教授
2006年哈尔滨工业大学教授
2007年哈尔滨工业大学博士生导师
教育经历
1988年至1992年在天津大学计算机科学与工程系软件专业获工学学士学位。1992年至1995年在哈尔滨工业大学计算机应用专业获得硕博连读资格1995年至1999年在哈尔滨工业大学计算机应用专业获得博士学位
我的新闻
-----------------------------------------------------------------
研究领域
健康信息学智能化信息检索网络挖掘自然语言处理认知语言学
科研项目
下一代信息检索系统国家自然科学基金重点2008年1月~2011年12月参与纵向项目
基于一种新的系统相似度度量的文本情感倾向性研究微软教育部语言语音重点实验室开放基金项目2010年1月~负责人横向项目
基于内容的网络信息压缩及摘要自动生成技术网络安全项目2001年10月~2002年10月参与纵向项目
基于粗糙集大规模语料库语言学知识发现模型研究国家自然基金2002年1月~2004年12月参与纵向项目
富士通博客或bbs情感倾向性分析技术研究富士通研发中心2008年10月~2009年6月负责人横向项目
手机操作系统智能输入富士通公司2002年3月~2003年6月参与横向项目
新加坡词法分析国际合作项目新加坡信息通信研究院2008年1月~2008年12月负责人横向项目
智能化中文信息处理平台**年10月~2002年10月参与纵向项目
淘宝购物网站中针对产品节点的信息挖掘技术研究淘宝网2010年9月~2011年3月负责人横向项目
网站主题分析、标引与检索技术研究微软基金2006年6月~2007年6月负责人横向项目
网络信息的通用开放语义类名实体自动识别与标注研究哈工大校基金2003年6月~2005年6月负责人纵向项目
联通客服问答系统八达集团2002年6月~2003年6月负责人横向项目
问答式信息检索的理论与方法研究国家自然科学基金重点2006年1月~2009年12月参与纵向项目
阿里巴巴浅层句法分析技术研究阿里巴巴公司2009年1月~2009年11月负责人横向项目
隐式用户兴趣挖掘技术研究myspace公司2007年12月~2008年12月负责人横向项目
非常规突发事件网络舆情分析方法和预警机制的研究国家自然科学基金重点2009年1月~参与纵向项目
面向IOS平台的语句输入系统WI 输入法研究自选2010年11月~负责人横向项目
面向奥运智能信息服务的语料加工、文摘、检索技术研究863重点项目2003年12月~2005年12月参与纵向项目
面向智能化信息检索的危险式人工免疫网络理论与方法研究国家自然科学基金青年基金2006年1月~2009年12月负责人纵向项目
面向特定领域的词典获取和统计语言模型的建立微软基金2004年6月~2006年6月负责人横向项目
面向语句间语义相似度计算基于词主体自治学习的强化学习机制研究国家自然科学基金2009年1月~负责人纵向项目
奖项成果
WI 输入法2011关毅 阎于闻 周春波 贾祯 田作辉等2010中国互联网创新产品评选最佳技术创新提名奖
-----------------------------------------------------------------
讲授课程
研究生专业必修课《自然语言处理》
-----------------------------------------------------------------
出版物
王晓龙 关毅 《计算机自然语言处理》清华大学出版社 2005年
论著成果
1995年,微软拼音输入法(与微软公司合作)主要参加人
1996年,Macintosh用BOPOMPOFO智能语句输入法(与日本佳能泰克(佳能公司子公司)公司合作)主要参加人
2000年,Weniwen智能中文搜索引擎 主要参加人
2002年,智能化中文信息处理平台 主要参加人
2003年,Insun_TC文本分类系统 主要负责人
2004年,面向体育、旅游领域的智能中文问答系统InsunTourQA 主要负责人
2005年,ICSU词法分析系统 主要负责人
2005年,InsunQA英文问答系统 主要负责人
2008年,面向博客bbs的中文情感极性分析系统(与富士通中国研发中心合作)第一负责人
2008年,myspace隐式用户兴趣挖掘系统(与myspace公司聚友网合作)第一负责人
2009年,中文浅层句法分析系统(与阿里巴巴公司合作)第一负责人
2010年,面向IOS的中文智能语句输入法WI输入法 第一负责人
2010年,电子病历管理系统(与哈尔滨医科大学第二附属医院合作)第一负责人
论文期刊
Automatic and efficient recognition of proper nouns based on maximum entropy modelPeng Li, Yi Guan, Xiao Long Wang, Jun Sun2005年6月ICMLC2005
A Maximum Entropy Chunking Model with N-fold Template CorrectionSun Guanglu, Guan Yi, Wang Xiaolong2007年5月 Journal of Electronics(China)
A Maximum Entropy Markov Model for ChunkingGuang-Lu Sun, Yi Guan, Xiao-Long Wang, Jian Zha2005年6月Proceedings of the Fourth International Conference on Machine Learning and Cybernetics
A New Measurement of Systematic SimilarityYi Guan, Xiaolong Wang, and Qiang Wang2008年7月IEEE TRANSACTIONS ON SYSTEMS, MAN, AND CYBERNETICS—PART A: SYSTEMS AND HUMANS
A Novel Dynamic Adaptive Method Based on Artificial Immune System in Chinese Named Entity RecognitionWei Jiang, Yi Guan, XiaoLong Wang2006年6月International Journal of Computer Science and Network Security
A Novel Feature Selection Method Based on Category Information Analysis for Class Prejudging in Text ClassificationQiang Wang, Yi Guan, XiaoLong Wang and Zhiming Xu2006年6月International Journal of Computer Science and Network Security
A Pragmatic Chinese Word Segmentation Approach Based on Mixing ModelsJiang Wei, Guan Yi, Wang Xiao-Long2006年12月International Journal of Computational Linguistics and Chinese Language Processing
A Pragmatic Chinese Word Segmentation SystemJiang, W., Y. Guan, and X.-L. Wang2006年6月proceedings of the Fifth SIGHAN Workshop on Chinese Language Processing
A Probabilistic Approach to Syntax-based Reordering for Statistical Machine TranslationChi-Ho Li, Dongdong Zhang, Mu Li, Ming Zhou,Minghui Li, Yi Guan2007年6月Proceedings of the 45th Annual Meeting of the Association of Computational Linguistics
A Study of Semi-discrete Matrix Decomposition for LSI in Automated Text CategorizationQiang Wang, Xiaolong Wang, Guan Yi2004年6月 A Study of Semi-discrete Matrix Decomposition for LSI in Automated Text Categorization
An Improved Feature Representation Method for Maximum Entropy Model Data MiningGuan Yi, Zhao Jian2006年12月Data Mining Workshops, 2006. ICDM Workshops 2006. Sixth IEEE International Conference
An Improved Unknown Word Recognition Model based on Multi-Knowledge Source MethodJiang, W., Y. Guan, and X.-L. Wang2006年6月6th International Conference on Intelligent Systems Design and Applications (ISDA'06)
An Overview of Learning to Rank for Information RetrievalDong, X.; Chen, X.; Guan, Y.; Xu, Z.; Li, S.2009年3月Proc. WRI World Congress on Computer Science and Information Engineering
Analyzing the Incomplete Data based on the Improved Maximum Entropy ModelJian Zhao, XiaoLong Wang, Yi Guan, Lei Lin2005年6月 International Journal ofInformation Technology
Answer Extraction Based on System Similarity Model and Stratified Sampling Logistic Regression in Rare DataPeng Li, Yi Guan, Xiaolong Wang, Yongdong Xu2006年3月IJCSNS International Journal of Computer Science and Network Security
Applying Rough Sets in Word Segmentation Disambiguation Based on Maximum Entropy ModelJiang, W., X.-L. Wang, Y. Guan, and G.-H. Liang2006年6月Journal of Harbin Institute of Technology (New Series)
Automatic Text Summarization Based on Lexical ChainsYanmin Chen, Xiaolong Wang, Guan Yi2005年6月ICNC (1)
Automatically Generating Questions from Queries for Community-based Question AnsweringZhao, ShiqiandWang, HaifengandLi, ChaoandLiu, TingandGuan, Yi2011年11月Proceedings of 5th International Joint Conference on Natural Language Processing
Biomedical Named Entities Recognition Using Conditional Random Fields ModelChengjie Sun, Yi Guan, Xiaolong Wang, Lei Lin2006年6月Lecture Notes in Computer Science of Fuzzy Systems and Knowledge Discovery
Chinese Word Segmentation based on Mixing ModelJiang, W., J. Zhao, Y. Guan, and Z.-M. Xu2005年6月The 4th SIGHAN Workshop
Classifying Incomplete Data based on Maximum Entropy Model with New Feature CompensatingZhao Jian, Xiao-long Wang, Guan Yi, Lin Lei2006年11月 Journal of Electronics
Complete Syntactic Analysis Based on Multi-level ChunkingZhiPeng Jiang and Yu Zhao and Yi Guan and. Chao Li and Sheng Li2010年8月Proceedings of CIPS-SIGHAN Joint Conference on Chinese Language Processing (CLP2010)
Conditional Random Fields Based Label Sequence and Information FeedbackWei Jiang, Yi Guan, Xiao-Long Wang2006年6月Lecture Notes in Computer Science of Natural Language Processing and Expert Systems
Domain-Specific Term Extraction and Its Application in Text ClassificationTao Liu, Xiao-long Wang, Yi Guan, Zhi-ming Xu, Qiang Wang,2005年6月Proceedings of 8th Joint Conference on Information Sciences (JCIS2005)
Exploiting residue-level and profile-level interface propensities for usage in binding sites prediction of proteinsQiwen Dong, Xiaolong Wang, Lei Lin, Yi Guan2007年8月BMC Bioinformatics
Exploring Efficient Feature Inference and Compensation In Text ClassificationQiang Wang, Yi Guan and Xiaolong Wang2006年6月Journal of Chinese Language and Computing
Extracting answers to natural language questions from large-scale corpusPeng Li, Xiao Long Wang, Yi Guan, Yu Ming Zhao2005年10月Proceedings of 2005 IEEE International Conference on Natural Language Processing and Knowledge Engineering
HIT_LTRC at TREC 2010 Blog Track: Faceted Blog DistillationJinfeng Yang, Xishuang Dong, Yi Guan, Chengzhen Huang, Sheng Wang2010年8月Proceedings of TREC 2010
Improving Feature extraction in Named Entity Recognition based on Maximum Entropy ModelJiang, W., Y. Guan, and X.-L. Wang2006年6月2006 International Conference on Machine Learning and Cybernetics (ICMLC2006)
Improving Sequence Tagging using Machine-Learning TechniquesWei Jiang, Xiao-Long Wang, Yi Guan2006年6月2006 International Conference on Machine Learning and Cybernetics (ICMLC2006)
Insun05QA on QA Track of TREC 2005Yuming Zhao,Yi Guan, ZhiMing Xu, Peng Li2005年6月Proceedings of TREC 2005
InsunQA06 on QA track of TREC2006Zhao, Y., Xu, Z., Li, P., & Guan, Y2006年6月Fifteenth Text REtrieval Conference (TREC 2006).
K-NN 与 SVM 相融合的文本分类技术研究王强,王晓龙,关毅,徐志明2005年6月高技术通讯
Learning of humanoid robot walk parameters based on FSRYuan, Quan-De,Hong, Bing-Rong, Guan, Yi ,Ke, Wen-De2010年2月 China Journal of Harbin Institute of Technology (New Series)
Recent advances on NLP research in Harbin Institute of TechnologyTiejun Zhao, Yi Guan, Ting Liu, Qiang Wang2007年4月Frontiers of Computer Science in China
Research on Chinese Named Entity Recognition Base on Conditional Random FieldsZhao Jian , Xiao-long Wang, Guan Yi, Xu Zhiming2006年12月Journal of Electronics
Rich features based Conditional Random Fields for biological named entities recognitionChengjie Sun, Yi Guan, Xiaolong Wang, Lei Lin2007年6月Computers in Biology and Medicine archive
Selecting Optimal Feature Template Subset for CRFsXingjun Xu and Guanglu Sun and Yi Guan and. Xishuang Dong and Sheng Li2010年8月 Proceedings of CIPS-SIGHAN Joint Conference on Chinese Language Processing (CLP2010)
SVM-Based Spam Filter with Active and Online LearningQiang Wang, Yi Guan, Xiaolong Wang2006年6月Proceeding of Text REtrieval Conference on Spam Filtering Task(TREC2006)
Using category-based semantic field for text categorizationQiang Wang, XiaoLong Wang, Yi Guan, ZhiMing Xu2005年8月The 4th International Conference on Machine Learning and Cybernetics(ICMLC)
Using Maximum Entropy Model to Extract Protein-Protein Interaction Information from Biomedical LiteratureChengjie Sun, Lei Lin, Xiaolong Wang, Yi Guan2007年6月Lecture Notes in Computer Science of Advanced Intelligent Computing Theories and Applications with Aspects of Theoretical and Me
一个基于免疫机制的在线机器学习算法何晏成 关毅 岳淑珍2007年11月第三届全国信息检索与内容安全学术会议
一种基于粗糙集增量式规则学习的问题分类方法研究李鹏;王晓龙;关毅2008年5月电子与信息学报
一种改进的Wu-Manber 多模式匹配算法及应用孙晓山 王强 关毅 王晓龙2006年2月中文信息学报
中文名实体识别:基于词触发对的条件随机域方法赵健 王晓龙 关毅 徐志明2006年8月高技术通讯
中文情感词倾向消歧孙慧 关毅 董喜双2010年8月第六届全国信息检索学术会议论文集(CCIR 2010)
基于 Cover 级别的中文信息检索技术的研究包刚,关毅,王强,赵健2005年4月计算机工程与应用
基于Swarm的人工免疫网络算法研究杜新凯 关毅 岳淑珍 徐兴军2008年6月微计算机信息
基于X2统计和词情感分类相结合的中文情感词挖掘张书娟,朱力,关毅,董喜双2011年6月2011信息技术与管理科学国际学术研讨会
基于上下文平均互信息的问句查询扩展模型邵兵,关毅,王强,王晓龙,任瑞春2004年6月第二届全国学生计算语言学研讨会
基于多知识源的中文词法分析系统姜维 王晓龙 关毅 赵健2007年1月计算机学报
基于支持向量机的音字转换模型姜维 关毅 王晓龙 刘秉权2007年2月中文信息学报
基于数据挖掘思想的网页正文抽取方法的研究蒲宇达,关毅,王强2006年6月第三届学生计算语言学研讨会论文集
基于最大熵模型和最小割模型的中文词与句褒贬极性分析董喜双,邹启波,关毅,高翔,闫铭2011年10月第三届中文倾向性分析评测(COAE2011)
基于最大熵模型的中文词与句情感分析研究董喜双 关毅 李本阳 陈志杰2009年10月第二届中文倾向性分析评测(COAE2009)
基于最大熵模型的汉语基本块分析技术研究李超 孙健 关毅 徐兴军 侯磊 李生2009年10月中文信息学会句法分析评测(CIPS-ParsEval-2009)
基于最大熵马尔科夫模型和条件随机域模型的汉语组块分析技术研究李超,关毅,李生2011年6月2011信息技术与管理科学国际学术研讨会
基于条件随机域的词性标注模型姜维 关毅 王晓龙2006年6月计算机工程与应用
基于标题类别语义识别的文本分类算法研究王强 关毅 王晓龙2007年12月电子与信息学报
基于特征类别属性分析的文本分类器分类噪声裁剪方法王强 关毅 王晓龙2007年8月自动化学报
基于电子商务用户行为的同义词识别张书娟,董喜双,关毅2012年5月中文信息学报
基于矢量空间模型和最大熵模型的词义问题解决策略赵岩,王晓龙,刘秉权,关毅2005年6月高技术通讯
基于短语的汉语N-gram语言模型研究刘秉权,王晓龙,王轩,关毅2001年6月863计划智能计算机主题学术会议
基于统计与规则相结合的汉语计算语言模型及其在语音识别中的应用关毅,王晓龙.1998年6月高技术通讯
基于统计的汉语词汇间语义相似度计算关毅,王晓龙2003年6月语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集,
基于统计的网页正文信息抽取方法的研究孙承杰, 关毅2004年6月中文信息学报
基于统计的计算语言模型关毅,张凯,付国宏1999年6月计算机应用研究
基于词聚类特征的统计中文组块分析模型孙广路 王晓龙 关毅2008年12月电子学报
基于购物网站用户搜索日志的商品词发现杨锦锋,吕新波,关毅,周春波2011年11月计算机应用与软件
基于转移的音字转换纠错规则获取技术关毅,王晓龙,张凯1999年6月计算机研究与发展
多文档文摘中基于语义相似度的最大边缘相关技术研究刘寒磊,关毅,徐永东2005年6月全国第八届计算语言学联合学术会议 (JSCL-2005)
应用粗糙集理论提取特征的词性标注模型姜维 王晓龙 关毅 徐志明2005年10月高技术通讯
文档聚类综述刘远超,王晓龙,徐志明,关毅2006年6月中文信息学报
汉语大词表 N—gram 统计语言模型构造算法徐志明,王晓龙,关毅1999年6月计算机应用研究
现代汉语计算语言模型中语言单位的频度—频级关系关毅,王晓龙,张凯1999年2月中文信息学报
电子商务中针对产品的摘要挖掘技术研究季知祥,董喜双,关毅2011年6月2011信息技术与管理科学国际学术研讨会
网页结构树相似度计算祁钰;关毅;吕新波;岳淑珍2009年5月黑龙江大学自然科学学报
蛋白质二级结构预测: 基于词条的最大熵马尔科夫方法董启文,王晓龙,林磊,关毅,赵健2005年6月中国科学 C 辑 生命科学 2005
融合聚类触发对特征的最大熵词性标注模型赵岩,王晓龙,刘秉权,关毅2006年6月计算机研究与发展
论系统相似的度量关毅,王晓龙,王强2005年6月全国第八届计算语言学联合学术会议 (JSCL-2005) 论文集
语音识别语言理解模型徐志明,王晓龙,张凯,关毅,孙玉琦1998年6月第五届全国人机语音通讯学术会议论文集
面向专业网站的中文问答系统研究关毅,王晓龙,赵岩,赵健2003年6月Proceedings of the 20th International Conference on Computer Processing of Oriental Languages