统计与数据科学学院 沈伊静 报道
2024年4月17日15:00,统计与数据科学学院举办了青年教师学术沙龙(第四期)。此次活动在位育楼417举行,由蔡雄老师主持。特邀本院的周灿老师作为报告人,他的研究领域是机器学习、图模型。
周灿老师报告的题目是《Learning Mixed Latent Tree Models》。在报告中,周灿老师指出,大多数现在结构模型学习中,只关注所有变量都是连续型,或者所有变量都是离散型的问题。然而在实际应用中,数据基本都是离散型和连续性的。因此在这篇论文中,考虑了混合数据挖掘的混合隐树模型。解决了这些混合模型的结构学习和参数估计问题。对于结构学习,提出了一致的自下而上算法,并给出了精确结构恢复的有限样本界保证。对于参数估计,利用矩阵分解提出了一个矩估计量,并证明了估计量的渐近正态性。在模拟数据和真实数据上的实验表明,该方法对于挖掘层次结构和潜在信息是有效的。
互动环节中,老师们和同学们展开了激烈的讨论。中国人民大学统计学院的李杰老师对隐树算法提出问题,是否所有数据都可以通过算法计算出来。周灿老师表示,在结构方程中,是已知每一条的参数,通过把其他变量代入,从而可以计算出所有的数据。并且周灿老师补充,有些变量在比较低的层级,有些变量在比较高的层级,对于变量所处层级不同的问题,需要通过逐步恢复,恢复的原则是每一步恢复的变量之间共同的邻居。刘永欣老师对实际应用中隐变量的选取产生疑问。周灿老师对此做出解释,隐变量在实际数据中不需要选取,而是根据现实背景知识去恢复数据背后的隐变量。比如治安、交通、中医等不同领域,需要了解数据背景,按照知识理解去主观解释。因为隐变量本身是观测不到的,只是在未知的情况下帮助我们去深入了解数据。
报告结束后,与会的学生和教师一致表示,这次讲座给他们带来了很多收获,拓宽了他们的知识视野,为机器学习领域的研究工作提供了新的启发与灵感。