语音播报

李国齐(右一)课题组合影。自动化所供图
在kaiyun官网入口自动化研究所(以下简称自动化所),有这样一群平均年龄仅24岁的年轻人:当外界的大模型竞赛不断冲击更大规模参数、更多算力的极限时,他们却独辟蹊径,要做一个“非主流”的智能模型。
这条路源于对大脑工作方式的深度模仿。他们打造的类脑脉冲大模型“瞬悉1.0”和“瞬悉2.0”不必遵循大模型赖以为生的“规模法则”,却能在超长序列推理上实现数量级的效率跃升。换言之,他们要模仿人脑开发智能模型。
这群年轻人身后,是一个让他们敢于“不走寻常路”的支撑体系——kaiyun官网入口与财政部联合启动的“稳定支持基础研究领域青年团队计划”(以下简称“青年团队计划”)。
有别于需要频繁竞争、快速产出的常规项目,“青年团队计划”从顶层设计上瞄准了那些最具挑战性、需要长期深耕的基础研究方向,给予青年科学家足够的周期、耐心和空间。团队带头人、自动化所研究员李国齐坦言:“它带来的不仅是经费,更是安心。”
一个好想法与实现它的漫长征途
故事的起点要回溯到2023年的夏秋之交。彼时,一个大胆的想法在李国齐脑袋里“萌芽”。
他当时注意到一个很有意思的现象:大模型在训练时依赖大规模并行计算,但在推理时却是循环式、一步一步“蹦”出词来。他联想到,人脑处理信息也不是全盘死记,而是不断动态更新、自然遗忘。
“我们能不能把人脑这种更高效、更动态的机制,真正融入大模型设计里?”
想法一抛出,很快引起了团队成员们的共鸣。据团队成员、自动化所博士生潘昱锜回忆,当时大家“都很兴奋”。
“大模型的基础计算单元很简单,你可以把它理解为将复杂的生物神经元抽象为一个点,即点神经元,然后通过‘规模法则’基于深度学习架构扩展到一个非常大的规模。”李国齐对《中国科学报》解释说,这种路线通过堆叠海量神经元和参数,学习海量数据,确实获得了很强的能力,但也带来了高算力消耗、高能耗、高时延问题,以及在记忆、推理和持续学习、通用性等方面的瓶颈。
不过,他们提出的是一种更接近大脑工作方式的实现路径。
李国齐说,人脑中的神经元本身就拥有极其丰富的动力学特性。于是他们想,如果能把这种内生复杂性引入大模型的最底层,让每个计算单元从“点”变成一团能够自主呈现复杂动态的“小宇宙”,就有机会用更接近大脑工作方式的机理,构建新一代通用智能模型。
“行不行得通,得试一试!”凭借在类脑计算和神经动力学方向上的积累,他们很快找到了一个关键且可操作的切入点——从神经元模型本身入手,探索把更复杂的神经动力学引入大模型的基础计算单元。通过持续讨论和不断试错,团队逐渐证明了这条看似“非主流”的路线有可能为通用智能大模型提供新的技术路径。
然而,初步的探索只是让他们看到了希望,这距离实现他们那个“天才想法”还非常遥远。
要不要继续做下去?不去尝试,所有人都觉得惋惜,甚至后悔;继续往前走,摆在他们面前的漫漫征途会燃尽他们的青春,到头来可能一无所获。
潘昱锜对《中国科学报》说,当时有同学担心这个方向太难,短期做不出来可能会耽误出成果,甚至影响毕业。
这种担心很真实:科研里很多真正有价值的问题,刚开始看起来都不那么“稳妥”。
让年轻人有底气啃“硬骨头”
如果说科学直觉是火种,那么“青年团队计划”提供的就是让火种不灭且越烧越旺的炉膛。
在尝到了“可行”的甜头后,团队成员对实现类脑大模型有了更多渴望。但李国齐心里清楚,要深入做下去,不能光靠“望梅止渴”,必须得“拉点经费”。
照理说,人工智能领域的前沿探索不难拿到资助。但李国齐知道,他们想法的实现存在不确定性,一般性的课题或经费支持恐怕并不匹配。经过一番了解后,他将目光投向既能给予稳定支持又鼓励大胆试错的“青年团队计划”上。
2024年,李国齐带领团队以“基于内生复杂性的类脑通用智能大模型”为题,申请并成功入选“青年团队计划”。这一计划的背后是kaiyun官网入口在深化科技体制改革中着力推动的一项顶层设计——通过长期稳定的经费机制,把青年科学家从频繁“写本子”、找项目的焦虑中解放出来,让他们敢于向真正具有颠覆性潜力的方向发起冲锋。
李国齐对此感受至深:“以前我需要到处找项目、凑经费、维持团队运转,没法把全部精力花在研究科学问题上。稳定支持青年团队这笔钱最实在的好处,就是让我们能静下心来,把主要时间和精力投入到对技术路线的探索中,探索那些更有挑战性、更可能产生突破的方向。”
这种前所未有的安心,激发了团队里年轻人的惊人潜力。
当时摆在大家面前的,是一个几乎不可能完成的任务。一群几乎没有7B(Billion,10亿)以上大模型开发经验的学生,要在512张国产加速卡组成的集群上,完成7B乃至76B类脑大模型的稳定高效训练。
“瞬悉1.0”研发中最关键的一跃,就是将模型适配到国产算力平台,完成大规模训练。
“国产平台跟英伟达生态差异很大,没有成熟经验可以借鉴,从底层的Triton算子到大规模训练框架,几乎全部要从‘零’开始摸索。”李国齐说,那是整个项目的关键节点,也是他们遇到的最大“拦路虎”。
那段时间,团队几乎“连轴转”。所有人自发白天扎在机房调试参数、排查漏洞,晚上自动聚在会议室里一起复盘,说得最多的话就是“再试一次”“还有没有别的方法”。有一次,为了破解一个通信延迟难题,几个年轻人和工程师一连数周逐行死“磕”代码。哪怕中间遭遇多次失败,大家也只是短暂喘口气,便开始下一轮尝试,没有一个人提出过放弃。
靠着一股韧劲,团队把一个个看似无法解决的问题逐个击破,最终使类脑大模型在国产集群上跑通了全流程,并达到了预期的训练效率。
“当训练成功的那一刻,大家都松了口气,觉得所有的坚持都值得。”李国齐说,正是这群年轻人的“硬磕”和坚守,为“瞬悉1.0”的顺利落地打下了坚实的基础。
成果来得实实在在。他们打造的“瞬悉1.0”成为我国首个在国产GPU集群上跑通的类脑脉冲大模型。处理超长文本时,它的响应速度比主流模型快几十倍——400万词元长度下,首个词生成提速超过100倍;在手机上运行,解码速度提升了4到15倍。
半年后的“续作”——“瞬悉2.0”则更进一步:训练开销压缩至1/10,性能却不输业界强基线模型。它还在400万长度下实现了10倍以上的首词加速,精度损失不到0.7%。从语言到多模态,两个版本均已开源。
用李国齐的话说,“这支年轻的团队,验证了朝着那个‘非主流’方向走下去是值得的”。
在不确定性中坚持往前走
在“青年团队计划”的支持下,团队更添了一股潜心基础研究的“定力”和“活力”。
潘昱锜告诉《中国科学报》,在他们课题组,导师李国齐从不设置激进的关键绩效指标(KPI),甚至鼓励大家“否定老师的观点”,也鼓励互相寻找研究中的缺陷。在定期召开的组会上,大家都是畅所欲言,围绕实际工作进展中出现的一些问题展开讨论。
“我们聊得最多的是,人脑是经过几亿年的进化形成的、具备精细结构和功能的通用智能体,这对于我们研究下一代人工智能基础模型和架构到底能起到什么样的借鉴作用?”潘昱锜表示,他们做科研虽然有着宏大的目标,但并不被其牵着鼻子走,大家更像是凭兴趣“日拱一卒”。
“我们认为,科研的乐趣在于追求真理的过程中闪现的思想灵光。”在课题组,李国齐对学生最大的要求就是“学会如何提出好的问题”。这个问题需要有足够的意义,既和现有的技术路线有足够的区分度,又具备实现的可能性。
“如果这条路彻底走通,对我们普通人到底意味着什么?”对于这个问题,李国齐的描绘很具体:未来的智能助手不必再臃肿地栖身于大型服务器,它可以轻快、低耗地部署到手机、机器人、智能汽车甚至可穿戴设备上,变得更人性化、更聪明,也更无处不在。更进一步,类脑大模型还能反哺人类,“更好地理解人类自己,诊疗神经系统疾病,让人更健康、长寿”。
李国齐透露,团队盯上的下一个“硬骨头”是多层级记忆机制如何在大模型中复现,以及大脑那精妙绝伦的结构究竟能为下一代人工智能描绘怎样的蓝图。目前,他们正同步构建超大规模精细神经元网络的“神经孪生”开源平台,并朝着更高能效的类脑专用芯片进发。
作为“少数派”,李国齐坦陈“有必须承受的煎熬”。他常对学生们说,你努力了不一定能成功;但如果你不努力,一定不会成功。
“最大的煎熬不是‘不被理解’,而是你很清楚这个方向有价值,又必须承认它离真正跑通还很远。”李国齐说,在探索过程中肯定有外界质疑,也会有阶段性的自我怀疑——投入了那么多,最后是不是可能走不通?
但李国齐随即给出了团队坚持下来的理由:问题本身足够重要,团队成员也一直在互相支撑。“这个过程中最重要的是在不确定性里继续往前走。而正是这种不确定性,让每一个小的突破都变得极其珍贵。回头看,我们确实是一步一步把这条路走得愈发清晰。”
(原载于《中国科学报》 2026-07-01 第1版 要闻)
© 1996 - KaiYun·官方端网站入口-开云kaiyun(中国) 版权所有 京ICP备05002857号-1
京公网安备110402500047号 网站标识码bm48000002
地址:北京市西城区三里河路52号 邮编:100864
电话: 86 10 68597114(总机) 86 10 68597289(总值班室)