统计与数据科学学院 高楠 报道
4月10日下午,衡强老师应邀为统计学学科研究生及导师开展了专业学术讲座。讲座在位育楼417举行,由统计与数据科学学院院长孔新兵教授主持。
衡强老师于2023年取得北卡州立统计学博士学位,现于加州大学洛杉矶分校从事博士后研究,研究兴趣包括统计学习方法与理论,数值优化及在统计基因组学方面的应用。研究成果发表在JCGS, Technometri cs, ICLR, The American Statistician等。
此次报告主题为“Minimum Covariance Determinant: Spectral Embedding and Subset Size Determination”。 讲座中,衡强老师首先深入解析了trimmed means的概念,这是一种在一维样本中去除最大值与最小值的统计方法。他指出,简单地删除异常值的方法存在局限性,因为较小的异常值和较大的异常值在分布上并不均匀。尤其在超过一维的情况下,“小”和“大”的概念变得模糊不清。接着,衡强老师介绍了他如何选取合适的样本子集的方法。他提出,在样本大小为n的情况下,寻找大小为h的子集,并使这个子集的样本协方差最小。此外,他还引入了projection depth的概念,以此进行排序来使用最中间的h。 在讲述了现有方法FastMCD和MRCD的局限性后,衡强老师分享了他在最新论文中的创新贡献。他提出了一种新的方法,即对样本矩阵进行主成分分析(PCA),使用projection depth来选择样本子集,并通过clustering distance对方法进行改进。在算法的稳定性方面,衡强老师采用了bootstrap方法。最后,衡强老师展示了他的新方法在水果和乳腺癌数据上的应用,证明了该方法在实际数据分析中的有效性和实用性。
此次衡强老师的讲座不仅为异常值识别领域带来了创新的方法和洞见,更为统计机器学习领域的师生提供了宝贵的研究信息和思路。在讲座的讨论环节,我院的孔新兵教授、周灿老师对衡强老师的新方法进行了深入的交流和探讨。