2024年11月27日上午10时,中国科学院数学与系统科学研究院的张新雨研究员受邀莅临沙河主楼E404,为数学学院的师生带来了一场题为《Leveraging Unlabeled Data and Model Averaging to Improve Prediction》的精彩报告。本次报告由夏勇教授主持,吸引了数学科学学院十多位师生的积极参与。
在半监督学习中,面对大量未标记数据和少量已标记数据,有效利用未标记数据成为关键。本报告通过构建基于copula函数和边缘分布的回归函数预测模型,利用未标记数据优化边缘分布估计,并对不同copula预测结果进行加权,权重依据风险最小化原则确定。通过误差-模糊度分解改善风险估计,证明了在半监督框架下,候选模型的copula参数和回归函数估计量具备渐近正态性,且模型平均估计量展现出更快的渐近最优性和权重一致性收敛速度。模拟实验验证了所提方法的有效性。
经过与张新雨研究员的深入交流与探讨,参会师生均表示收获颇丰,受益匪浅。
报告人简介: 张新雨,中科院数学与系统科学研究院研究员。主要从事统计学的理论和应用研究工作,具体研究方向包括模型平均、机器学习、经济预测、医学统计等,担任国内SCI期刊《Journal of Systems Science & Complexity (JSSC)》领域主编和其他5个国内外重要期刊的编委。先后主持国家级青年人才项目和国家级人才项目。