“说到统计,可能人们首先联想到的是统计部门。早在战国时期,商鞅就强调‘审数’的重要性,提出变法图强必须掌握储粮、人口、牲畜等国力统计数据。”在7月11日至13日举行的第三届全国统计与数据科学联合会议上,中国科学院院士、清华大学统计与数据科学系讲席教授陈松蹊告诉记者,统计学不仅用于政府统计,还广泛应用于商业、医学、工程、社会科学等领域。它以数据为研究对象,研究数据的采集、分析、推理等,数据科学即“统计学+应用场景”。
图片来源于网络,如有侵权,请联系删除
本届联合会议在浙江省杭州市召开,邀请21个国家和地区的专家学者参加,学术报告达600多次。其中,将近四分之一的学术报告主题与机器学习、人工智能相关。而根据中国信通院发布的《人工智能发展报告(2024年)》显示,人工智能面临算法模型可解释性不足、框架安全漏洞、数据标注不规范等挑战。
陈松蹊认为,现阶段,有关人工智能的具体应用还比较偏向工程,即优先确保算法、模型的工作运行,对背后机理不够深究。尤其在对精度、安全性要求很高的医学、建筑工程等领域,应当确保算法模型的稳定性、可靠性。
陈松蹊介绍,数据是随机的,模型自身也在变化。考虑到数据的不确定性,在超高维参数设定下,从变化中找到不变的内容,进行归纳、解释,得到稳定、可解释的算法,统计学可在这方面作出贡献。他的团队正在进行相关研究。
在智能时代,海量复杂的数据成为推动各行各业发展的关键要素,学界对统计学人才培养问题也越发重视。“统计与数据科学研究恰逢其时。”陈松蹊说,但这一专业存在供不应求的问题,需要提升高校的培养能力,为业界输送人才的同时,还要让相当一部分人才愿意留在高校,培养更多统计学家、数据分析师。
陈松蹊分析认为,现如今,算法软件虽然功能强大,但人类不能将思考过程“承包”给人工智能,仍然需要明确问题、掌握程序的运行,具备对人工智能的纠错能力,在这方面,统计学科将发挥重要作用。
自2023年以来,全国统计与数据科学联合会议已连续举办三届,逐步形成品牌效应。作为会议组委会指导委员会委员,陈松蹊感触颇多:“从2011年统计学成为一级学科以来,全国统计科学研究快速发展,与其他国家的交流也越来越密切。根据对国际顶级统计期刊发表数据的多维度测算,中国作者所占份额已位居世界第二。”
陈松蹊表示,本次参会的1800多位学者,有15%来自国外。未来,统计与数据科学组委会还将加强与工业界的联系,邀请更多企业参与,促进学科和应用创新融合。(记者 江 耘)
【责任编辑:朱家齐】