删除或更新信息,请邮件至freekaoyan#163.com(#换成@)

中国科学院软件研究所研究生导师简介-孙 乐

软件研究所 免费考研网/2013-11-28


队伍建设
百人计划
杰出青年
人才招聘
科技副职



二、目前主要研究方向及简介
主要研究方向:下一代文本信息检索模型、辅助机器翻译算法、跨语言信息检索、文本分类、汉语语义理解模型等。目前在研课题:国家自然科学基金项目2项,国家863项目2项,国家语委项目1项。在研项目简介:
自然科学基金重点项目(与哈工大、清华合作):下一代信息检索研究
课题摘要:下一代搜索引擎的一个突出特点是个性化,本课题围绕个性化信息检索展开研究。个性化信息检索是以用户为中心的信息检索技术,它获取以多种形式表达的用户需求(包括显式的、隐式的以及相关用户的需求),并综合利用这些用户信息,提高信息检索系统的性能。本课题在理论方面,以用户为中心的用户参考文档模型和基于用户需求分析的网页价值模型;在个性化用户信息挖掘方面,从个人、群体和整体三个线索对用户的兴趣、检索偏好、社会关系网络和宏观用户行为进行挖掘;将从多个信息源采集到的信息集成在一起,支持个性化信息检索过程。在个性化检索系统的评价方法方面,构建人工标注的标准评测集,同时展开基于用户行为分析进行自动评价的探索。在理论研究的基础上,本课题选择了客户端隐式个性化检索和协同式个性化推荐作为应用实例。本课题力争在个性化检索的计算理论和核心技术上有所突破。

自然科学基金项目(独立承担):基于NLP的高精度文本检索模型研究
课题摘要:文本检索系统的查询条件和文档集都是由自然语言构成的。由于传统文本检索系统本质上只是将文本看作一组无序词串,利用简单的词频统计来模糊计算相关性,因此,传统检索系统面临许多无法解决的问题。同时,一些研究表明将相对复杂和精确的自然语言处理(NLP)技术直接(浅层)应用于传统检索系统并不能带来性能的明显的改善。本申请书提出的基于NLP的高精度文本检索模型研究,是以NLP技术与信息检索中的语言模型方法的深层次融合为出发点,主要探讨不同于传统IR模型的能够融入NLP技术的新的语言模型检索方法,研究这些不同层次的NLP技术对IR性能的影响,并期望在比较后获得相对最佳的融合模型。本项目试图建立NLP与IR之间的紧密的联系,来系统地揭示一些客观现象。

863重点项目(与计算所、哈工大、厦门大学、自动化所合作):面向跨语言搜索的机器翻译关键技术研究
课题摘要:本课题主要以统计机器翻译方法为关键技术来开展跨语言信息检索的研究。主要研究内容如下:第一,翻译模型研究:探索词汇、句法信息及语义信息的结合,研究融入结构知识的翻译模型;第二,翻译知识获取研究:针对各种不同的翻译模型,研究翻译知识的获取算法;第三,解码算法研究:研究全局优化与局部优化的结合方法,建立启发式搜索与动态规划等多种策略相结合的高效、智能搜索策略;第四,跨语言检索研究:研究查询语句翻译与检索相融合的跨语言信息检索模型,检索结果翻译与用户反馈相结合的查询反馈模型,以及跨语言检索系统的实用化问题;第五,系统实现:探索合理的集成机器翻译的跨语言搜索系统总体架构。

863项目(独立承担):大规模网络文本数据的语义理解和分类技术
课题摘要:本课题提出的面向信息检索的网络文本数据理解和分类研究,拟采用自然语言理解的关键技术对文本数据进行浅层的语义理解,在浅层理解的基础上通过文本语义特征和文本网络特征相融和的新分类算法进行文本分类,分类后的网络文本数据可以帮助搜索引擎用户高效地获取相关信息;同时,通过设定不良信息类别,可以从源头上阻止这类信息的传播。由于视频检索中包含图像、声音、文字等信息,图片中包含文字说明,文字信息是相对比较可靠的分类依据,因此,该技术也可以应用于对图片、视频等多媒体数据的分类和理解。课题的主要研究内容包括网络文本的正规化(网络非规范文本的去噪处理)、网络文本的浅层语义理解(汉语命名实体识别、实体间语义关系识别、句子级事件识别、篇章级发文目的识别以及上述各级精加工语料标注规范的研究)、文本语义特征和文本网络特征相融和的分类算法以及大规模网络数据分类效率的提高等。
三、学习经历
1998年博士毕业于南京理工大学
1998年至2000年在中国科学院软件研究所,博士后,从事辅助翻译研究
四、工作经历
2001年1月至2003年2月中国科学院软件研究所副研究员中心副主任
2003年3月至2003年9月英国Birmingham大学语料库研究中心访问学者
从事汉英平行语料库研究
2003年10月至2004年11月中国科学院软件研究所副研究员中心副主任
2004年12月至2005年12月加拿大Montreal大学计算机系访问学者
从事高精度和个性化信息检索研究。
2005年12月——至今中国科学院软件研究所副研究员

五、社会兼职
中国中文信息学会秘书长
中文信息学报副主编
中文信息学会内容安全与信息检索专委会委员
人工智能学会自然语言处理专委会委员
ACL(theAssociationforComputationalLinguistics)Member
ACMSIGIR(SpecialInterestGrouponInformationRetrieval)Member
2003、2004和2005年863信息检索和文本分类测评的组织者
2008国际测评NTCIR-7MOAT中文简体任务的组织者
国际计算语言学大会(COLING2010)组织委员会主席
六、研究成果与获奖情况
在国内外主要刊物和会议上共发表论文50多篇,软件登记5项,软件专利3项,已经培养博士4名,硕士12名。曾获2007年中国科学院软件研究所优秀导师。

七、代表论著
期刊:
[1]黄瑞红,孙乐,冯元勇,黄云平,基于核方法的中文实体关系抽取研究,中文信息学报,22(5),pp.102-108,2008
[2]李文波,孙乐,张大鲲.基于Labeled-LDA模型的文本分类新算法.计算机学报,pp.620-627,31(4),2008
[3]李文波,孙乐,诺明花,吴健.基于核方法的敏感信息过滤的研究.通信学报,pp.57-62,29(4),2008
[4]冯元勇,孙乐,张大鲲,李文波.基于单字提示特征的中文命名实体识别快速算法,中文信息学报,22(1),2008
[5]冯元勇,孙乐,董静,李文波.基于分类信心重排序的中文共指消解研究,中文信息学报,21(6):22-28.2007
[6]LIUQun,WANGXiangdong,LIUHong,SUNLe,TANGSheng,XIONGDeyi,HOUHongxu,LVYuanhua,LIWenbo,LINShouxun,QIANYueliang,IntroductiontoHTRDPevaluationsonChineseinformationprocessingandintelligenthuman-machineinterface,FrontiersofComputerSciencesinChina,Vol.1,No.1,Feb.2007
[7]董静,孙乐,冯元勇,黄瑞红,中文实体关系抽取中的特征选择研究,中文信息学报,2007,21(4):80-85
[8]张玮,孙乐,冯元勇,李文波,黄瑞红,词汇搭配和用户模型在拼音输入法中的应用,中文信息学报,2007,21(4):105-110
[9]张大鲲,张炜,冯元勇,孙乐“基于非连续短语的统计翻译模型研究”,中文信息学报,2007,21(1)
[10]张俊林,刘洋,孙乐,刘群,“2005年度863信息检索评测方法研究和实施”,中文信息学报,2006
[11]张俊林,孙乐,孙玉芳“一种改进的基于记忆的自适应汉语语言模型”,中文信息学报,2005,19(1)
[12]曲为民,张俊林,孙乐,孙玉芳,“Difx:利用动态索引算法实现高效的XML数据查询”,计算机研究与发展,2005Vol.42No.11
[13]曲为民,孙乐,孙玉芳,“XML数据查询中值匹配查询代价估计算法的研究”,软件学报,2005年4月,16(4)
[14].张俊林,孙乐,孙玉芳,“基于主题语言模型的中文信息检索系统研究”,中文信息学报,2005,19(3)
[15].张俊林,曲为民,孙乐,孙玉芳“一种改善的基于语言模型的中文检索系统研究”,中文信息学报,2004,18(2)
[16].曲卫民,张俊林,孙乐,“基于主题的汉语语言模型的研究”,《计算机研究与发展》2003,Vol,40,No.9,p1368~1374
[17]QuWei-min,ZhangJun-lin,SunLe,SunYu-fang,AnEfficientIndexingandQueryingAlgorithmforLarge-scaleXMLData,《软件学报》,2003,Vol.14,p97~104
[18]闽金明,孙乐,张俊林,重新审视跨语言信息检索,中文信息学报,2006,Vol20(4)
[19].曲为民,张俊林,孙乐,孙玉芳,基于记忆的中文自适应语言模型的研究,中文信息学报,2003,Vol17(5)
[20]曲为民,孙乐,孙玉芳,“半结构化中文信息检索中查询结果相关度算法的研究”,中文信息学报,2004,18(4)
[21]张永臣,孙乐,等中文信息学报,“基于数据的特定领域双语词典抽取”,中文信息学报,2006,20(2)
[22]冯元勇,孙乐,张大鲲,李文波.《基于小规模尾字特征的中文命名实体识别研究》,电子学报

国际会议:
[1]DakunZhang,LeSun,WenboLi,AStructuredPredictionApproachforStatisticalMachineTranslation,IJCNLP’2008(poster),pp.649-654.Hyderabad,India,2008
[2]WenboLi,LeSun,etc.SmoothingLDAModelforTextCategorization.4thAsiaInformationRetrievalSymposium(AIRS’2008),LNCS4993,pp.83–94,Harbin,2008
[3]LiJing,LeSun,ALexicalChainApproachforQuery-focusedUpdate-styleMulti-documentSummarization,AIRS2008,LNCS4993,pp.310-320
[4]LiJing,LeSun,KitChunYu,J.Webster,AQuery-focusedMulti-documentSummarizerbasedonLexicalChains,DUCworkshop,2007
[5]RuihongHuang,LeSun,YuanyongFeng,Studyofkernel-basedMethodsforChineseRelationExtraction,AIRS2008,LNCS
[6]YuanyongFeng,RuihongHuang,LeSun,Two-stepChineseNamedEntityRecognitionBasedonConditionalRandomFields,ProceedingsofSIGHANWorkshop,2007
[7]RuihongHuang,LongxiPan,LeSun,ISCASinOpinionAnalysisPilotTask:ExperimentwithSentimentalDictionarybasedClassifierandCRFModel,ProceedingsofNTCIRWorkshopMeeting,Tokyo,Japan,May,2007
[8]YuanhuaLv,LeSun,etc.AnIterativeImplicitFeedbackApproachtoPersonalizedSearch,ProceedingofCOLING/ACL2006,Sydney
[9]YuanyongFeng.LeSun.YuanhuaLv,ChineseWordSegmentationandNamedEntityRecognitionBasedonConditionalRandomFieldsModelsProceedingsoftheFifthSIGHANWorkshoponChineseLanguageProcessing,2006,Sydney
[10]QuanZhou,LeSun,YuanhuaLv,ISCASatDUC06,ProceedingoftheDocumentUnderstandingConferences(DUC)2006
[11]JinmingMin,LeSunandJunlinZhang,ISCASinEnglish-ChineseCLIRatNTCIR-5,ProceedingsoftheFifthNTCIRWorkshoponResearchinInformationAccessTechnologiesInformationRetrieval,QuestionAnsweringandSummarization,TokyoJapan,2005.
[12]QuanZhou,LeSun,Jian-YunNie,AMulti-DocumentSummarizerbasedonDocumentIndexGraphicandLexicalChains,ProceedingoftheDocumentUnderstandingConferences(DUC)2005,10
[13]JunlinZhang,LeSun,UsingtheWebCorpustoTranslatetheQueriesinCross-LingualInformationRetrieval,2005IEEEInternationalConferenceonNaturalLanguageProcessingandKnowledgeEngineering.Oct.,2005
[14]YuanyongFeng,LeSunandJulinZhang,EarlyResultsforChineseNamedEntityRecognitionUsingConditionalRandomFieldsModel,HMMandMaximumEntropy,2005IEEEInternationalConferenceonNaturalLanguageProcessingandKnowledgeEngineering.Oct.,2005.
[15]JunlinZhang,LeSun,Quanzhou,ACue-basedHub-AuthorityApproachforMulti-DocumentTextSummarization,2005IEEEInternationalConferenceonNaturalLanguageProcessingandKnowledgeEngineering.Oct.,2005.
[16]ZhangJunlin,Sunle,LvYuanhua,ZhangWeiRelevanceFeedback.byExploringtheDifferentFeedbackSourceandCollectionStructureProceedingoftheTextREtrievalConference(TREC).TREC2005
[17]Sunle,ZhangJunlin,SunYufang,ISCASatTREC2004:HARDTrack.ProceedingoftheTextREtrievalConference(TREC).TREC2004
[18]ZhangJunlin,SunLe,QuWeimin,SunYufang.ATriggerLanguageModel-basedIRsystem,The20thInternationalConferenceonComputationalLinguistics(COLING2004).Geneva,Switzerland,Vol.1,pp.680-686,Aug,2004
[19]ZhangJunlin,SunLe,YongchenZhang,ApplyingLanguageModelintoIRTask,NTCIRWorkshopFourthMeeting,2004.
[20]ZhangJL,SunLe,QuWM,etal.,Athreelevelcache-basedadaptiveChineselanguagemodel,1stInternationalJointConferenceonNaturalLanguageProcessing(IJCNLP2004),MAR22-24,2004
[21]ZengWu,LinDu,LeSun,ShiweiYeTREC12HARDTrackatISCAS,ProceedingoftheTextREtrievalConference(TREC)TREC2003
[22]SunLe,QuWei-min,XueSong,ConstructingofaLarge-ScaleChinese-EnglishParallelCorpus,InColing2002,The3rdWorkshoponAsianLanguageResourcesandInternationalStandardization,TaiWan,2002
[23]ZhangJun-linZhang,SunLe,QuWei-min,DuLin,XueSong,ISCASINNTCIR-3,NTCIR-3,Tokyo,Japan,2002
[24]SunLe,ZhangYiBo,ZhangJunLin,SunYuFang,PECAT:AComputer-AidedTranslationToolBasedOnBilingualCorpora,ProceedingoftheIEEESMC2001,Tucson,Arizona,USA,Oct.7-10,2001,p927~932
[25]SunLe,ZhangJunlin,QuWeiming,SunYufang,EvaluationofanEnglish-ChineseCLIRExperimentalSystemBasedonBilingualDictionary,InternationalConferenceonChineseComputing,Singapore,Nov.2001
[26]ZhangYibo,SunLe,DuLin,JinYoubing,SunYufang,ISCAS’TextRetrievalinNTCIRWorkshopII,ProceedingsoftheSecondNTCIRWorkshopResearchinChinese&JapaneseTextRetrievalandTextSummarization,Tokyo,Japan,pp.146-153,Mar.7-9,2001

著作:
DanielJurafsky&JamesH.Martin,冯志伟孙乐译《自然语言处理综论》,电子工业出版社,2005年6月,587页(SPEECHandLANGUAGEPROCESSING:AnIntroductiontoNaturalLanguageProcessing,ComputationalLinguistics,andSpeechRecognition),

八、承担项目

相关话题/软件

  • 领限时大额优惠券,享本站正版考研考试资料!
    大额优惠券
    优惠券领取后72小时内有效,10万种最新考研考试考证类电子打印资料任你选。涵盖全国500余所院校考研专业课、200多种职业资格考试、1100多种经典教材,产品类型包含电子书、题库、全套资料以及视频,无论您是考研复习、考证刷题,还是考前冲刺等,不同类型的产品可满足您学习上的不同需求。 ...
    本站小编 Free壹佰分学习网 2022-09-19
  • 中国科学院软件研究所研究生导师简介-苏璞睿
    队伍建设百人计划杰出青年人才招聘科技副职二、目前主要研究方向及简介网络与系统安全三、学习经历四、工作经历五、社会兼职六、研究成果与获奖情况七、代表论著八、承担项目 ...
    软件研究所 免费考研网 2013-11-28
  • 中国科学院软件研究所研究生导师简介-张振峰
    队伍建设百人计划杰出青年人才招聘科技副职二、目前主要研究方向及简介主要从事密码学理论与应用、安全协议的设计与分析等方面的研究工作。主持国家自然科学基金项目“高信度密码协议的设计与分析”、“密码协议的安全模型与可证明安全性研究”等项目,进行安全协议的设计与分析,密码系统安全模型的建立与可证明安全性研究 ...
    软件研究所 免费考研网 2013-11-28
  • 中国科学院软件研究所研究生导师简介-邓 勇
    队伍建设百人计划杰出青年人才招聘科技副职二、目前主要研究方向及简介空间综合电子信息系统三、学习经历1996年国防科技大学电子学与信息系统工学学士;1999年国防科技大学信息与通信工程工学硕士;哈尔滨工业大学信息与通信工程博士生。四、工作经历五、社会兼职六、研究成果与获奖情况七、代表论著八、承担项目 ...
    软件研究所 免费考研网 2013-11-28
  • 中国科学院软件研究所研究生导师简介-马恒太
    队伍建设百人计划杰出青年人才招聘科技副职二、目前主要研究方向及简介卫星组网与信息安全三、学习经历1991-1995武汉治金科技大学自动化系工学学士学位 计算机应用1995-1997武汉科技大学自动化系工学硕士学位 计算机应用1997-2001中国科学院软件研究所工学博士学位 计算机应用技术四、工作经 ...
    软件研究所 免费考研网 2013-11-28
  • 中国科学院软件研究所研究生导师简介-郑 刚
    队伍建设百人计划杰出青年人才招聘科技副职二、目前主要研究方向及简介卫星组网通信;网络信息安全;网络控制网络控制系统分析与设计;网络安全与信息安全;网络系统管理;混杂系统分析、控制和优化;故障诊断与容错控制;计算机仿真。与管理。三、学习经历2001.9——2004.7,中国科学院自动化研究所,控制理论 ...
    软件研究所 免费考研网 2013-11-28
  • 中国科学院软件研究所研究生导师简介-刘立祥
    队伍建设百人计划杰出青年人才招聘科技副职二、目前主要研究方向及简介网络及其通信技术、网络计算技术三、学习经历2002/7毕业于上海交通大学,获得博士学位四、工作经历2003/2-2005/2中科院软件所博士后2005/3-至今中科院软件所综合信息系统国家重点实验室五、社会兼职六、研究成果与获奖情况主 ...
    软件研究所 免费考研网 2013-11-28
  • 中国科学院软件研究所研究生导师简介-张金芳
    队伍建设百人计划杰出青年人才招聘科技副职二、目前主要研究方向及简介地形分析,大地形可视化,虚拟现实。三、学习经历四、工作经历五、社会兼职六、研究成果与获奖情况七、代表论著"地形可视性分析"系统仿真学报,2005.8八、承担项目 ...
    软件研究所 免费考研网 2013-11-28
  • 中国科学院软件研究所研究生导师简介-彭启民
    队伍建设百人计划杰出青年人才招聘科技副职二、目前主要研究方向及简介综合信息处理与集成:(1)图像处理与理解,包括图像及视频的预处理、目标检测、目标识别等;(2)模式识别与机器学习,包括特征提取,分类器设计等;(3)信息融合,包括多源多层信息的融合处理算法设计及系统集成。三、学习经历北京理工大学计算机 ...
    软件研究所 免费考研网 2013-11-28
  • 中国科学院软件研究所研究生导师简介-徐帆江
    队伍建设百人计划杰出青年人才招聘科技副职二、目前主要研究方向及简介三、学习经历四、工作经历五、社会兼职六、研究成果与获奖情况七、代表论著八、承担项目 ...
    软件研究所 免费考研网 2013-11-28
  • 中国科学院软件研究所研究生导师简介-郑昌文
    队伍建设百人计划杰出青年人才招聘科技副职二、目前主要研究方向及简介信息处理与集成、人工智能、计算机仿真三、学习经历2003.10-2005.5中国科学院软件研究所博士后1999.9-2003.9华中科技大学图像识别与人工智能研究所工学博士1996.9-1998.10华中理工大学经济学院经济学硕士19 ...
    软件研究所 免费考研网 2013-11-28