主 题:文本数据挖掘的统计策略
主讲人:郭建华教授
主持人:林华珍教授
时 间:2014年10月24日14:40-15:20
地 点:通博楼B座212学术会议室
主办单位:统计学院 统计研究中心 科研处
主讲人简介:
郭建华,东北师范大学教授、博士生导师、副校长,国务院学位委员会数学学科、统计学科评议组成员,教育部****特聘教授、国家杰出青年基金获得者,国家社会科学基金学科规划评议组专家、国家自然科学基金会评专家,“新世纪百千万人才工程”国家级人选,教育部“****和创新团队发展计划”创新团队带头人,中国现场统计研究会副理事长、中国统计教育学会副理事长,中国数学会常务理事,享受国务院政府特殊津贴,曾获国家统计局全国统计科学科技进步奖一等奖、国家教委科技进步奖二等奖、国家教育部自然科学奖二等奖。
内容提要:
随着科技进步和社会经济的发展,作为记录信息载体的数据正以指数量级增长。如何管理和理解这些数据,已成为摆在各行各业面前的一种挑战。我们以市长公开电话的热线投诉数据为依托,开展了“数据驱动”的研究,以寻找和发现文本数据背后隐藏的客观规律。在方法论上,系统提出了 “结构降维”的统计思想;在应用上,将相关理论结果应用于吉林、黑龙江、河北等省的30余家城市市长公开电话实际数据的处理,取得了很好的社会效益和经济效益。本报告将概述我们的基本思想和实际做法。