4月22日,“感动海淀”2023年度暨第十三届年度人物颁奖典礼在国图音乐厅举行。北京大学计算机学院教授,多媒体信息处理全国重点实验室主任,北京智源人工智能研究院理事长,创始院长黄铁军荣获2023年度“感动海淀”文明人物。
从ChatGPT到视频生成大模型Sora,“大模型”成为科技行业的一个热门词语。早在2020年,在大多数人对大模型还一无所知的时候,黄铁军掌舵北京智源研究院智源研发大模型,并在2021年上半年推出了开创“中国首个”“世界最大”的大模型悟道1.0和悟道2.0,培养了一批大模型人才。当前大模型创业公司、大厂,从事研发的CTO或首席科学家中,参加过悟道项目的人不在少数。如今,他瞄准打造开源开放的人工智能大模型体系,紧紧抓住创新这个“牛鼻子”,加快关键核心技术攻关,培育人工智能开源开放新生态。
深耕人工智能领域掌舵智源研究院
黄铁军研究人工智能领域超过30年,擅长智能视觉信息处理技术,对我国数字视频编码国家标准制定和大规模产业化做出过突出贡献,终结了国外向我国视频行业索取高额专利费的历史。一直以来,黄铁军都在积极投身国家和北京人工智能事业建设发展。早在2015年,黄铁军就作为中国工程院“中国人工智能2.0发展战略研究”重大咨询项目骨干,向中央建议启动人工智能重大科技计划,全程参与我国新一代人工智能发展规划和实施方案起草,并担任国家“科技创新2030”新一代人工智能重大科技项目专家组副组长,牵头构建开源开放的人工智能基础软硬件生态体系。
2018年11月,由科技部和北京市共同支持,联合北京人工智能领域优势单位共建的北京智源人工智能研究院(以下简称“智源研究院”)成立,黄铁军担任首任院长。他选择智源研究院的原因是,这里与企业、学校都不一样,是一种世界范围内都很新的新型研究机构,在这里,可以更高效地探索人工智能。“智源研究院的性质是介于大学和企业之间的一种新型研发机构。我们既不以论文为最终的评价指标,也不以产品作为评价指标,而是要做有创新性的系统。这种机构在国外也是很新的形态。从我个人来说,我2015年就开始参与我国新一代人工智能发展规划,这种科技创新组织方式的改革,是这几年国家很关注的一个方向,我愿意到智源研究院来做这样的尝试。”黄铁军告诉记者,“原有的传统体制下开展人工智能研究,大学受制于资源有限,企业受制于产品收入压力,都约束了创新突破的可能性。智源研究院这种机构有探索出新可能性的很大机会,这是吸引我的最重要的原因。”
推动大模型生态建设助力产业长久发展
2020年,智源研究院决定把大模型作为攻坚目标,70%的预算投入到大模型研发和大模型基础软硬件生态建设。同年3月,黄铁军在悟道1.0发布会上提出,“人工智能正在从‘大炼模型’到‘炼大模型’的新阶段”,这是“大模型”这个概念首次登上历史舞台。“大模型这个方向,虽然外界很少有认知,但在当时的人工智能科研圈里已经有一个比较清晰的趋势判断——大模型将成为人工智能产业生态的底座。”黄铁军告诉记者。
于是,智源研究院投入几乎全部科研力量,深耕大模型领域。2021年3月,“悟道1.0”大模型项目问世,2021年6月,间隔3个月后,“悟道2.0”亮相。当时的“悟道2.0”的参数量达到1.75万亿,是GPT-3采用的1750亿参数量的10倍,也超过了谷歌发布的Switch Transformer(1.6万亿参数量),创造了当时“世界最大”的参数量纪录。
“悟道2.0推出后,我们中间发生了一个重大的变化。当时从我们科研角度来看,新的AI时代已经开始了,虽然那时候没有多少人相信,但在我们这些人眼中,门已经打开了。我们于是开始考虑,既然它是一个时代的事,就绝对不会是智源一家机构在做,它应该是一个全社会、全世界的事情。”黄铁军告诉记者,“当时我们的分歧点是,继续做一个‘悟道3.0’版,把它做得更大更强?还是在全国范围内进行布局,让不仅是北京中关村地区,而是全中国范围都可以做这件事?最终我们选择了后者,在国家新一代人工智能重大科技项目中提出了一个旗舰项目建议,从国家的科技布局角度,做系统化的布局和支持。这也是为什么,‘悟道3.0’直到2023年6月才推出,因为比起单打独斗的探索,我们选择把精力投入在促进整个人工智能大模型的生态构建上。”
黄铁军告诉记者,国家项目立项是需要时间的。从2021年6月份提出建议,到2022年12月份项目批准,花了一年半时间,在传统项目体制下已经是特别快了。现如今,这个旗舰项目2023年1月开始执行,计划通过滚动方式,一直持续到2030年,目标不是把一个模型做多大,或者性能做多高,而是要通过数据共建、算法竞争、开放评测、开源协同的创新机制,建立一套大模型开源开放技术体系,一个支撑大模型持续发展的技术生态。“所以,很多时候大家说中国大模型热是因为ChatGPT火了之后才爆发的,并非如此,早在ChatGPT出现之前一年半,我国就已经开始系统布局,那边爆发的时候,这边生态舰队已经起航。”黄铁军说。
现如今,智源曾经耗费绝大部分资源和精力投入的大模型方向,已经从“无人”变得热闹非凡,也产生了更多未解之谜,有更多需要探索的新无人区。黄铁军表示,智源要与企业错位发展,开展更冒险、更开放、更前瞻、更创新地的工作,这是智源作为研究机构应该做的事。“对我们来讲,更重要的是实现当年立下的十年目标:2028年智源研究院成为全世界公认的顶尖人工智能研发机构。”黄铁军说。(记者 郭思岐)