近日,2025亚布力论坛第十一届创新年会在浙江杭州顺利开幕。在【主题演讲】环节
在亚布力论坛创新年会上,大家见证了人工智能蕴含的无限可能性。我相信,企业家们都在积极拥抱AI,力求让AI在手中释放出更多有趣的生命力与价值。
今年是人工智能爆火出圈的一年。特别是杭州的几家企业,凭借自身实力在世界舞台上展现了中国影响力,收获了良好反响。
人工智能的终极目标是运用科学技术,将人类历经数百年探索到的智能奥秘融入生产实践。因此,我们有必要从“智能究竟是什么”这一思考出发。
若将人工智能的发展过程划分为几个阶段,无论AI作为工具还是系统,都包含三个关键环节:
一、计算智能时代。早期,人工智能并非如此智能。例如,当年手机上的五子棋游戏里,有一个与玩家对战的人工智能,那个人工智能主要是由专家依靠经验编写出的“f”函数。
二、随着数据量的增加,人工智能开始进入感知智能阶段。此时,它能利用海量的图像、知识和积累的数据来拟合函数,不再依赖专家经验编写“f
三、人工智能逐步迈向认知智能阶段,开始发现对象之间的关系,并具备深度思考能力。
在人工智能发展过程中,人们发现,若为每个小任务单独构建函数,知识之间难以贯通,就无法处理更复杂的任务。大脑虽有脑区分布,但仍是完整整体,能整合各区域知识完成复杂智慧型任务。所以,要从感知智能升级到认知智能,就必须将各个判别型专用模型整合为通用模型,才能完成复杂的生成式任务。
从AI1.0到AI2.0,核心区别在于让AI以通用架构处理更复杂的生成式任务,实现从感知世界、认知世界到改变世界的跨越。
其中,我们不得不提及生成模型的“涌现”能力。随着模型参数量和训练量的增大,模型涌现出强大的算法性能和通用能力,这推动了整个生成式人工智能时代的发展。
基本上,从2012年开始,人工智能进入第三次热潮。2017年Transformer架构出现后,验证了通过规模增长持续获得收益的方式,此后人工智能呈现出每年都有重大突破的快节奏发展态势。
例如推理能力,当我们拥有大语言通用模型后,仍能区分条件反射与需反复思考的逻辑推理能力。引入强化学习后,从GPT - O1到DeepSeek R1,带有推理的模型能够处理超级复杂的任务。可以看出,整个人工智能的发展正从快思考向慢思考迈进,DeepSeek R1就是极具代表性的模型,它能展示完整的思维链过程。其成功,归根结底在于将有限的硬件发挥出无限的价值,因此软硬件协同一直是推动人工智能发展的重要因素。众所周知,人工智能有三大要素:除算法外,数据是支持算法成长的“燃料”,算力、芯片则是引擎。从这一视角审视人工智能发展的三次热潮,会发现每次热潮背后都有硬件因素的参与。第三次人工智能热潮,虽有许多算法创新,但也离不开底层硬件升级的支撑。如今Transformer、GPT模型能以每年翻10倍的量级发展,正是因为底层算力也以10倍的速度增长。可以说,整个软硬件系统是人工智能发展的坚实基础。
人工智能从算法层到底层硬件层之间有众多层次,当然,这些层次会随时代发展不断变化。例如,当大模型能以更通用的结构支持大量运算时,原本的中间层次就会融合。从系统设计视角看待优化问题时,首先要明确优化目标。人工智能系统的优化目标十分明确,即能否以更低的成本、更快的速度完成更多任务。我给出的目标公式很好理解:任务量除以能力就是速度,速度再与成本关联,就是总共消耗的资源。
在此情况下,软件层要解决的是硬件资源利用率问题,即能否让每一度电、每一个芯片都发挥最大价值,这需要众多技术体系来实现。简单来说,随着模型增大,软件优化工作目标也在变化。最初是AI模型时代,主要解决单个任务在小算力(如V100卡或推理卡)上的效率问题。但随着模型增大,使用资源达到百卡、千卡后,就面临调动众多专家完成任务的协调问题。如今,600多B的大模型即便用于推理,也需调动强大集群资源,优化问题从单卡的极致性能优化转变为多卡资源稳定性的协调以及任务的合理分配,这是人工智能软硬件体系发展过程中的重大变化。
谈到硬件优化,硬件单元设计有诸多可调整空间,核心是能否实现更高算力的硬件结构。
这张图在AI领域的软硬件领域极具意义。每条斜线黄金时代最右下角的能量效率最低点,到能量效率最高点,跨越了五条虚线,实现了五个数量级的效率提升。
这一领域的终极目标是通过存算一体实现像人脑一样高的能效。可以看到,上一个10年完成了这条斜线万倍的提升,这在任何领域都极为罕见。
目前我们仍处于早期阶段,更多还是使用GPU等通用架构兼容AI计算。我们能否在这个时代同样完成五个数量级的提升,需要共同探索适合人工智能时代的计算结构及计算软件体系。其中,评价指标从每焦耳能量完成多少次运算转变为生成多少Token,相当于将任务评价指标提升到更高层次,这为我们带来了更大的优化空间,令人十分振奋。
以上,是我以科学工作者的身份,和大家分享了如何通过良好的建模方式解决能量效率问题。但在实际工程体系中,并非简单的除法运算,还需考虑算力建设中的供需市场关系和服务质量因素。所以,在产业层面,要解决更为复杂的问题。
中国人工智能产业上下游相对分散,在产业维度面临着复杂的系统资源分配和应用创新加速问题。如何整合与协调调度这些分散资源,是中国人工智能产业未来发展必然要解决的难题。当前,中国已跻身世界第一梯队,必须探索出适合自身的发展道路。
我们将多年打造的软硬件体系置于中国市场环境中,致力于搭建一座“桥梁”,充分打通并混合不同芯片与模型,让系统资源和数据快速流通,协力实现全国算力体系的全面贯通。这是我们的历史使命,即让算力和人工智能如水电般,以标准化方式流入千行百业、千家万户,最终在中国市场体系内形成从模型到系统、再到芯片的全生态闭环,构建起体系的系统飞轮。
同时,人工智能最终会成为人机交互的接口并走向终端。终端对模型能力的要求和硬件资源储备条件存在冲突,因此更需实现软硬件的深度打通。我们将软件应用于终端,实现全栈式能力的打通与极致优化,无论文生文还是文生图,都能实现2 - 5倍的性能提升,且能在芯片终端完成本地计算。自研推理IP让人工智能快速且经济地运行在每个计算单元上,让所有设备都能加载人工智能能力,实现真正AI普惠。为此,我们正联合上下游伙伴,推动人工智能在云和端的协同式落地。
总而言之,我们殷切期望凭借自身十余年积累的软硬件贯通技术,构建起人工智能云端一体的完整产业生态。在云端,为千行百业赋能;在端侧,让技术走进千家万户。