
王晓军代表学院向洪永淼的到来表示欢迎和感谢,并为他颁发了本次讲座的纪念证书。

洪永淼表示,大数据容量巨大,潜在的解释变量繁多,而且数据类型多样,这都给统计学带来了挑战,但也带来了待遇。
他认为,挑战主要体现在三个方面:第一,当大数据的样本容量特别大时,一个变量或参数在统计学上是否显著可能将失去意义。参数估计的不确定性将被模型选择的不确定性所替代,但当前研究者尚未提出新的方法;第二,样本容量的数量小于解释变量的数量时需要降维分析,但不同降维方法得到的模型结果可能不同,以预测为目的时可使用模型平均等技术,但是如果是以模型或者参数解释为目的的话,研究者目前还缺乏必要的统计理论与方法;第三,当解释变量较多且存在较高线性相关性时,模型的不确定性进一步增大,与唯一性假设存在悖离,需要新的建模与推断理论。然而,大数据也给统计学带来了一些机遇。洪教授表示,宏观数据是低频的,而金融市场的数据是高频的,大数据将促进宏观数据的高频化,为研究实体经济和金融市场之间的互动关系提供极大的便利。

由教务处与统计学院联合主办的“中国人民大学通识教育大讲堂——数据科学讲坛”,定期邀请数据科学领域著名专家、领军人物来校为全校师生带来报告,旨在为全校师生普及科学知识,弘扬科学精神,解读专业相关的热点问题和前沿动态。