窦志成
窦志成,于2003年和2008年分别获得南开大学学士和博士学位。毕业后加入微软亚洲研究院,任研究员。2014年9月份加入中国人民大学,任特别研究员,2018年8月破格晋升教授。主要研究兴趣为信息检索、数据挖掘,信息抽取以及机器学习,重点研究基于深度学习的检索排序和NLP算法。已在国际知名会议和学术期刊上(如SIGIR、WWW、CIKM、WSDM、EMNLP及IEEE TKDE等)发表论文30余篇。担任过多个国际学术会议(如SIGIR、WWW、KDD、WSDM、CIKM)的程序委员会成员,是亚洲信息检索协会筹划指导委员会主席。
除研究工作外,还乐于将研究想法实现成可运行的系统。 在亚洲研究院任职期间,参与了多个项目的开发, 如WebStudio、 ProjectQ、 和 WebSensor等。 他拥有多项专利,参与研发的多项技术已经成功转化到微软产品中(如必应搜索Bing和Office)。
详细>>
个人主页:http://playbigdata.ruc.edu.cn/dou/
电子邮箱:dou at ruc.edu.cn
详细资料
教育经历
1999-2008 南开大学 本科-硕士-博士
工作经历
2008年-2014年 微软研究院 研究员
2014年至今 中国人民大学
研究方向
信息检索,自然语言处理,数据挖掘,大数据,信息抽取,机器学习
讲授课程
数据结构
大数据分析导论
网络群体与市场
计算机科学研究方法概论
互联网文本分析
程序设计实践
智能信息检索
对学生的培养要求
具有丰富的学生培养和指导经验,在微软亚洲研究院工作6年多的时间内,先后指导20多个实习生。
报名要求:
读研究生的目的:想要在硕士生或博士生阶段培养自己的项目开发或者科研能力,为将来的工作或进一步深造打好基础,而不是仅仅为了拿到研究生学历或硕士博士学位;
态度:踏实、勤奋、做事有责任心,能够认真对待老师分配给的项目或者研究课题;
基础:具有一定的编程开发动手能力,具有一定的自我学习能力,能够将研究想法编程实现;
对学生的培养:
能力培养:本着对学生负责的态度,同时培养学生的系统开发(编程、系统设计、项目管理)和科学研究能力(论文阅读、工作调研、问题分析、方法设计、实验分析、论文写作等),为结合学生的特长和职业规划,为不同学生制定不同的能力培养计划;
素质培养:培养学生做事的态度,锻炼语言沟通能力,增强团队合作意识;
欢迎各位有意向攻读硕士或博士学位的同学报考!
科研项目
基于深度学习的个性化搜索技术研究,自然科学基金面上项目
基于法律法规的司法解释文件核查关键技术研究,国家重点研发计划课题
信息检索中搜索结果个性化和多样化融合技术研究,自然科学基金青年项目
交互式文本数据多维分析方法研究,北京理工大学
基于大规模裁判文书和法律论坛数据的中国法制现状研究,中国法学会
基于UCL的中文信息处理应用理论体系,中国电子技术标准化研究院
互联网演艺设备大数据采集、抽取和检索技术研究,文化部科技文化提升项目
农业互联网大数据采集、分析与展示合作项目,北京金禾天成科技有限公司
科研成果
Xiaojie Wang, Zhicheng Dou, Tetsuya Sakai, and Ji-Rong Wen. Search Result Diversity Evaluation based on Intent Hierarchies, IEEE Trans. Knowl. Data Eng., 30(1), 156-169, 2018 CCF A corresponding author
Zhengbao Jiang, Zhicheng Dou, Ji-Rong Wen, Wayne Xin Zhao, Jian-Yun Nie, Ming Yue. Supervised Search Result Diversification via Subtopic Attention (Accepted) CCF A corresponding author Online
Zhengbao Jiang, Ji-Rong Wen, Zhicheng Dou, Wayne Xin Zhao, Jian-Yun Nie, Ming Yue. Learning to Diversify Search Results via Subtopic Attention. To appear in SIGIR 2017 CCF A corresponding author
Zhengbao Jiang, Zhicheng Dou, Ji-Rong Wen: Generating Query Facets Using Knowledge Bases. IEEE Trans. Knowl. Data Eng. 29(2): 315-329 (2017) CCF A corresponding author
窦志成,江政宝, 李谨秀,张宜春,文继荣. 基于词项图分析的查询分面挖掘方法[J]. 计算机学报, 2017, 40(3):556-569. first author
胡莎,窦志成,文继荣.论子话题粒度对搜索结果多样化算法的影响[J].中文信息学院, 2014, 31(4): 165-173.
Won-Kyung Sung, Hanmin Jung, Shuo Xu, Krisana Chinnasarn, Kazutoshi Sumiya, Jeonghoon Lee, Zhicheng Dou, Grace Hui Yang, Young-Guk Ha, Seungbock Lee: Information Retrieval Technology - 13th Asia Information Retrieval Societies Conference, AIRS 2017, Jeju Island, South Korea, November 22-24, 2017, Proceedings. Lecture Notes in Computer Science 10648, Springer 2017, ISBN 978-3-319-70144-8
Xiaojie Wang, Zhicheng Dou, Tetsuya Sakai, and Ji-Rong Wen. Evaluating Search Result Diversity using Intent Hierarchies. In Proceedings of SIGIR, 2016. CCF A corresponding author
Zhicheng Dou, Zhengbao Jiang, Sha Hu, Ji-Rong Wen, Ruihua Song: Automatically Mining Facets for Queries from Their Search Results. IEEE Trans. Knowl. Data Eng. (TKDE) 28(2):385-397 (2016) CCF A first author
Sha Hu, Ji-Rong Wen, Zhicheng Dou, Shuo Shang. Following the dynamic block on the Web. World Wide Web 19(6): 1077-1101 (2016)
Takehiro Yamamoto, Yiqun Liu, Min Zhang, Zhicheng Dou, Ke Zhou, Ilya Markov, Makoto P. Kato, Hiroaki Ohshima, Sumio Fujita. Overview of the NTCIR-12 IMine-2 Task. NTCIR 2016
Ming Yue, Zhicheng Dou, Sha Hu, Jinxiu Li, Xiao-Jie Wang, Ji-Rong Wen. RUCIR at NTCIR-12 IMINE-2 Task. NTCIR 2016
Shaoping Ma, Ji-Rong Wen, Yiqun Liu, Zhicheng Dou, Min Zhang, Yi Chang, Xin Zhao. Information Retrieval Technology - 12th Asia Information Retrieval Societies Conference, AIRS 2016, Beijing, China, November 30 - December 2, 2016, Proceedings. Lecture Notes in Computer Science 9994, Springer 2016, ISBN 978-3-319-48050-3
Zhongqi Lu, Zhicheng Dou, Xing Xie, Jianxun Lian, Qiang Yang. Content-based Collaborative Filtering for News Topic Recommendation. In Proceedings of Twenty-Ninth AAAI Conference on Artificial Intelligence (AAAI 2015), Austin Texas, USA, Jan 25-29, 2015. CCF A corresponding author
Sha Hu, Zhicheng Dou, Xiaojie Wang, Tetsuya Sakai, and Ji-Rong Wen. 2015. Search Result Diversification Based on Hierarchical Intents. In Proceedings of the 24th ACM International on Conference on Information and Knowledge Management (CIKM \'15). ACM, New York, NY, USA, 63-72. DOI=http://dx.doi.org/10.1145/**.** CCF B corresponding author
Sha Hu, Zhicheng Dou, Xiao-Jie Wang, Ji-Rong Wen: Search Result Diversification Based on Query Facets. J. Comput. Sci. Technol. (JCST) 30(4):888-901 (2015)
窦志成. 文本大数据分析技术的机遇与挑战[J]. 金融电子化, 2015(11):59-61.
窦志成, 文继荣. 大数据时代的互联网分析引擎[J]. 大数据, 2015(3).36-47 (2015-09-20)
Yiqun Liu, Ruihua Song, Min Zhang, Zhicheng Dou, Takehiro Yamamoto, Makoto Kato, Hiroaki Ohshima, Ke Zhou. Overview of the NTCIR-11 IMine Task. Proceedings of the 11th NTCIR conference.
Fei Chen, Yiqun Liu, Zhicheng Dou, Keyang Xu, Yujie Cao, Min Zhang, and Shaoping Ma, Revisiting the Evaluation of Diversified Search Evaluation Metrics with User Preferences. Proceedings of the 10th Asia Information Retrieval Society Conference (AIRS 2014)
Jingfei Li, Dawei Song, Peng Zhang, Ji-Rong Wen, and Zhicheng Dou, Personalizing Web Search Results Based on Subspace Projection, Proceedings of the 10th Asia Information Retrieval Society Conference (AIRS 2014)
Shu Tang, Zhicheng Dou, Xing Xie, and Jun He, Detecting and Monitoring Dynamic Content Blocks of a Web Page by Merging its Historical Versions, in SIGIR 2014 Workshop on Temporal, Social and Spatially-aware Information Access (TAIA2014), 2014
2013
Xiao Ding, Zhicheng Dou, Bing Qin, Ting Liu, and Ji-Rong Wen, Improving Web Search Ranking by Incorporating Structured Annotation of Queries, in Proceedings of EMNLP 2013, pages 468-478, October 2013 CCF B corresponding author
Kosetsu Tsukuda, Tetsuya Sakai, Zhicheng Dou, and Katsumi Tanaka, Estimating Intent Types for Search Result Diversification, in Information Retrieval Technology, pages 25-37, Springer Berlin Heidelberg, 2013
Ke Zhou, Tetsuya Sakai, Mounia Lalmas, Zhicheng Dou, and Joemon M. Jose, Evaluating Heterogeneous Information Access, in ACM SIGIR 2013 Workshop on Modeling User Behavior for Information Access Evaluation,
Qinglei Wang, Yanan Qian, Ruihua Song, Zhicheng Dou, Fan Zhang, Tetsuya Sakai, and Qinghua Zheng, Mining Subtopics from Text Fragments for a Web Query, in Information Retrieval 16(4) pages 484-503, 2013
Tetsuya Sakai and Zhicheng Dou, Summaries, Ranked Retrieval and Sessions: A Unified Framework for Information Access Evaluation, in Proceedings of the 36th international ACM SIGIR conference on Research and development in information retrieval (SIGIR 2013), pages 473-482, ACM, 2013 (The Best Paper Runner-Up Award) CCF A
Tetsuya Sakai, Zhicheng Dou, and Carles Clarke, The Impact of Intent Selection on Diversified Search Evaluation, in Proceedings of the 36th international ACM SIGIR conference on Research and development in information retrieval (SIGIR 2013), pages 921-924, ACM, 2013 CCF A
Tetsuya Sakai, Zhicheng Dou, Takehiro Yamamoto, Yiqun Liu, Min Zhang, Makoto Kato, Ruihua Song, and Mayu Iwata, Summary of the NTCIR-10 INTENT-2 Task: Subtopic Mining and Search Result Diversification, in Proceedings of the 36th international ACM SIGIR conference on Research and development in information retrieval (SIGIR 2013), pages 761 - 764, ACM, 2013 CCF A
Tetsuya Sakai, Zhicheng Dou, Takehiro Yamamoto, Yiqun Liu, Min Zhang, and Ruihua Song, Overview of the NTCIR-10 INTENT-2 Task, in Proceedings of the 10th NTCIR Conference, pages 94-123, June 18-21, 2013
Kosetsu Tsukuda, Zhicheng Dou, and Tetsuya Sakai, Microsoft Research Asia at the NTCIR-10 Intent Task, in Proceedings of the 10th NTCIR Conference, June 2013
Kazuya Narita, Tetsuya Sakai, Zhicheng Dou, and Young-In Song, MSRA at NTCIR-10 1CLICK-2, in Proceedings of the 10th NTCIR Conference, 2013
Tetsuya Sakai, Zhicheng Dou, Ruihua song, and Noriko Kando, The Reusability of a Diversified Search Test Collection, in Information Retrieval Technology (AIRS 2012), pages 26-38, Springer Berlin Heidelberg, 20 December 2012 (The Best Paper Award)
2011
Zhicheng Dou, Sha Hu, Kun Chen, Ruihua Song, and Ji-Rong Wen, Multi-dimensional Search Result Diversification, in Proceedings of the fourth ACM international conference on Web search and data mining (WSDM 2011), pages 475-484, ACM, February 2011 CCF B first author
Zhicheng Dou, Finding Dimensions for Queries, in Proceedings of the 20th ACM international conference on Information and knowledge management (CIKM 2011), pages 1311-1320, ACM, 2011 CCF B first author
Jialong Han, Qinglei Wang, Naoki Orii, Zhicheng Dou, Tetsuya Sakai, and Ruihua Song, Microsoft Research Asia at the NTCIR-9 Intent Task, in Proceedings of the 10th NTCIR Conference (NTCIR-9), National Institute of Informatics, 2011
Tetsuya Sakai, Nick Craswell, Ruihua Song, Stephen Robertson, Zhicheng Dou, and Chin-Yew Lin, Simple Evaluation Metrics for Diversified Search Results, in Proceedings of the Third International Workshop on Evaluating Information Access (EVIA), Volumn 26, pages 27, National Institute of Informatics, June 2010
Ruihua Song, Zhicheng Dou, Hsiao-Wuen Hon, and Yong Yu, Learning Query Ambiguity Models by Using Search Logs, Journal of Computer Science and Technology, 25(4), pages 782-738, Springer, July 2010
Zhicheng Dou, Kun Chen, Ruihua Song, Yunxiao Ma, Shuming Shi, and Ji-Rong Wen, Microsoft Research Asia at the Web Track of TREC 2009, in Proceedings of TREC 2009, November 2009
Ji-Rong Wen, Zhicheng Dou, and Ruihua Song, Personalized Web Search, in Encyclopedia of Database Systems, pages 2099-2103, Springer-Verlag, New York, USA, September 2009
Zhicheng Dou, Ruihua Song, Jian-Yun Nie, and Ji-Rong Wen, Using Anchor Texts with Their Hyperlink Structure for Web Search, in Proceedings of the 32nd international ACM SIGIR conference on Research and development in information retrieval(SIGIR 2009), pages 227-234, ACM, July 2009 CCF A first author
Zhicheng Dou, Ruihua Song, Ji-Rong Wen, and Xiaojie Yuan, Evaluating the Effectiveness of Personalized Web Search, in IEEE Transactions on Knowledge and Data Engineering (TKDE), 21(8), pages 1178-1190, IEEE computer Society Digital Library, Aug., 2009 CCF A first author
Zhicheng Dou, Ruihua Song, Xiaojie Yuan, and Ji-Rong Wen, Are click-through data adequate for learning web search rankings?, in Proceeding of the 17th ACM conference on Information and knowledge management (CIKM 2008), pages 73-82, ACM, New York, NY, USA, 2008 CCF B first author
Zhicheng Dou, Xiaojie Yuan, and Songbai He, Analysis of Query Repetition in a Large-scale Chinese Search Log (大规模中文搜索日志中查询重复性分析), in Computer Engineering (In Chinese), Volumn 21, 2008
Xiaojie Yuan, Zhicheng Dou, Lu Zhang, and Fang Liu, Automatic User Goals Identification Based on Anchor Text and Click-through Data, in Wuhan University Journal of Natural Sciences (WISA2008), 13(4), pages 495-500, 2008
Xiaojie Yuan, Zhicheng Dou, Fang Liu, and Lu Zhang, Personalized Web Search Based on Dynamic User Profile (一种基于动态用户模型的个性化Web搜索算法), in NDBC 2008: Proceedings of the 25th National Database Conference (In Chinese), 2008
窦志成, 袁晓洁, and 何松柏, 大规模中文搜索日志中查询重复性分析, 计算机工程, 34(21), pages 40-44, 2008 (in Chinese)
Lu ZHANG, Xiao-jie YUAN, Fang LIU, and Zhicheng Dou, Research on Distributed Index Mechanism for Large Dataset, Microelectronics & Computer, Volume 10, Pages 037, 2008
Zhicheng Dou, Ruihua Song, and Ji-Rong Wen, A large-scale evaluation and analysis of personalized search strategies, in Proceedings of the 16th international conference on World Wide Web (WWW2007), pages 581-590, ACM Press, New York, NY, USA, 2007
社会兼职
SIGIR 2018 论文PC Chair,
CCIR 2018 青年论坛主席,
亚洲信息检索学术会议指导委员会(AIRS SC)主席,
SIGIR 2018 Senior PC,
ICTIR 2018赞助和工业论坛主席,
Information Retrieval编委。
任多个学术会议和期刊的程序委员会委员和审稿人(CIKM, WWW, TKDE,WSDM,KDD,AAAI,IEEE BigData, AIRS, 计算机学报,JMLC,CCL, NLPCC,JASIST,SIGIR Demo,深圳大学学报,中文信息学报等)。
删除或更新信息,请邮件至freekaoyan#163.com(#换成@)
中国人民大学信息学院导师教师师资介绍简介-窦志成
本站小编 Free考研考试/2020-04-18
相关话题/中国人民大学 信息学院
中国人民大学信息学院导师教师师资介绍简介-堵丁柱
堵丁柱堵丁柱教授现任Texas 大学计算机系教授,美国自然科学基金委计算机理论的项目主管,也是西安交通大学教授。堵丁柱教授已经发表论文160多篇, 出版了40本书。 他是组合优化杂志和系列书籍《网络理论和应用》的主编, 是超过15个杂志的编委。 他因为证明了Gilbert-Pollak猜想和Derman-Leiberman-Ross猜想而著名。 1998年获得美国INFORMS的CSTS奖,199 ...中国人民大学考研导师 本站小编 Free考研考试 2020-04-18中国人民大学信息学院导师教师师资介绍简介-杜小勇
杜小勇杜小勇,男, 1963 年生,工学博士(日本名古屋工业大学),理工处处长、教育部数据工程与知识工程重点实验室主任。中国人民大学信息学院计算机应用技术专业责任教授,博士生导师。详细>>电话 :86-10-6251 5259详细资料教育经历1983 年毕业于原杭州大学数学系并留校任教,1985-1988 年在中国人民大学信息学院计算机应用专业攻读硕士学位,毕业后曾任该校数据与知识工程研究所副所 ...中国人民大学考研导师 本站小编 Free考研考试 2020-04-18中国人民大学信息学院导师教师师资介绍简介-杜玮
杜玮杜玮,女,博士,硕士生导师。主要研究领域为推荐系统、知识图谱、科研计量学、智慧健康等,在Scientometrics、Decision Support Systems、International Journal of Electronic Commerce等国际期刊和ICIS、HICSS、PACIS等国际会议上发表研究论文多篇。任Management Information Systems Q ...中国人民大学考研导师 本站小编 Free考研考试 2020-04-18中国人民大学信息学院导师教师师资介绍简介-付虹蛟
付虹蛟付虹蛟,副教授,1990年7月在北京理工大学获得工学学士学位,1993年7月在中国人民大学获得经济学硕士学位,2004年7月在中国人民大学获得管理学博士学位。2004年受国家留学基金委资助在美国加州大学圣迭戈分校(UCSD)做访问。详细>>电话 :详细资料工作经历1993年7月至今,中国人民大学信息学院。研究方向信息伦理、信息系统对学生的培养要求热爱本专业、踏实勤奋、有上进心。科研项目计算 ...中国人民大学考研导师 本站小编 Free考研考试 2020-04-18中国人民大学信息学院导师教师师资介绍简介-范举
范举范举,1984年生,博士,副教授。2012年7月于清华大学计算机系获得博士学位,2012年至2015年在新加坡国立大学从事博士后研究工作,现为中国人民大学数据工程与知识工程教育部重点实验室副教授。更多信息,请参见个人主页:http://iir.ruc.edu.cn/~fanj/详细>>电话 :+86-个人主页:http://iir.ruc.edu.cn/~fanj/电子邮箱:fanj@ruc ...中国人民大学考研导师 本站小编 Free考研考试 2020-04-18中国人民大学信息学院导师教师师资介绍简介-何军
何军何军,工学博士,信息学院教授,博士生导师。数据工程与知识工程教育部重点实验室研究员,中国计算机学会数据库专委会委员,中国计算机学会大数据专家委员会委员。长期从事数据库与数据挖掘方面的研究,近年主要研究方向为数据挖掘、大数据管理与分析、机器学习,商务智能、社交网络分析与挖掘、个性化推荐等,与国际上多位知名的教授开展合作研究。主持和参加了十多项科研项目,包括973项目、863项目、国家核高基项目、 ...中国人民大学考研导师 本站小编 Free考研考试 2020-04-18中国人民大学信息学院导师教师师资介绍简介-韩家炜
韩家炜韩家炜现为美国伊利诺伊大学计算机系正教授。韩教授于2003年获选美国计算机协会院士(“对知识发现和数据挖掘做出贡献”)。他现在领导伊利诺伊大学的 数据挖掘研究室(Data Mining Research Group)。他现在还是ACM期刊TKDD(ACM Transactions on Knowledge Discovery from Data)的主编。韩教授最近毕业的博士有: Dong X ...中国人民大学考研导师 本站小编 Free考研考试 2020-04-18中国人民大学信息学院导师教师师资介绍简介-黄建军
黄建军2017年美国普渡大学计算机专业博士毕业,主要是通过自然语言处理与静态程序分析相结合进行Android应用程序分析,包括恶意行为发现与隐私泄露检测等。未来的研究包括深度利用自然语言处理技术进行程序分析与相关知识的发现,以及通过机器学习的方法增强程序分析技术。详细>>电话 :**个人主页:https://hjjandy.github.io/电子邮箱:HJJ@ruc.edu.cn详细资料教育经 ...中国人民大学考研导师 本站小编 Free考研考试 2020-04-18中国人民大学信息学院导师教师师资介绍简介-胡鹤
胡鹤胡鹤,1976年出生于吉林长春。1998年本科毕业于吉林大学计算机科学与技术系,2004年6月在吉林大学计算机系获工学博士学位,获优秀博士毕业生。现任中国人民大学信息学院计算机系副教授,硕士生导师。主讲《人工智能》、《数据库技术》等课程。主要研究领域为:人工智能、语义Web等。主持过两项国家自然科学基金项目和一项教育部基金项目,发表论文被SCI、EI和ISTP检索收录30余篇。出版译著《语义W ...中国人民大学考研导师 本站小编 Free考研考试 2020-04-18中国人民大学信息学院导师教师师资介绍简介-蒋洪迅
蒋洪迅蒋洪迅,男,博士,中国人民大学信息学院副教授、系统科学实验室主任。主要研究领域为信息系统工程、网络金融、社交网络、运筹优化、计算智能。主持国家自然科学基金、教育部人文社科基金、国家重点实验室基金、信息产业部重点实验室开放基金、省市部委及金融企业合作项目多项,在Omega、Service Science、J. Systems Science and Systems Engineering、J. ...中国人民大学考研导师 本站小编 Free考研考试 2020-04-18