国产大模型开源潮流来袭Transformer或被逐步取代

 公司新闻     |      2025-02-25 20:31:59    |      小编

  在2025全球开发者先锋大会(GDC)上,人工智能(AI)领域的一场变革正在悄然上演。本届大会在上海西岸艺术中心举行,汇聚了众多AI开发者与行业领军者,探讨了开源生态与大模型的最新发展趋势。特别是在国产大模型不断开源的过程中,传统的Transformer结构似乎正面临被逐步放弃的风险。

  在会议开幕式上,工业和信息化部副部长熊继军指出,开放的“生态圈”与服务体系正在逐步完善,强调“语料开放+模型开源”的重要性。与会公司的高管们也纷纷展示了最新的开源模型,包括商汤科技的LazyLLM框架和MiniMax的MiniMax-01模型,这些都代表了AI领域的一次重要技术迭代。尤其是MiniMax-01系列被认为是全球首个大规模应用线性注意力机制的商业级模型,从而打破了传统Transformer架构在某些领域的优势。

  值得注意的是,GDC现场的一位与会者,香港科技大学的沈向洋谈到,“DeepSeek让大家看到开源社区的胜利。把了不起的模型开源后,更多人得到机会,可以在这个模型上做更多了不起的事情。”这反映出开源不仅促进了技术的普及,更吸引了广泛的开发者参与。

  与此同时,MiniMax副总裁刘华表示,以Transformer架构为代表的稠密模型由于在长任务下的算力消耗高,正在被业界逐渐淘汰,MoE(Mixture of Experts)架构则成为新的共识。所谓MoE架构,其通过动态选择相应的专家处理特定任务,从而大大降低计算消耗,提高效率。可以预见的是,未来两至三年中,类似于GPT-3.5到GPT-4的技术突破可能还会频繁发生。

  在这场AI技术的变革中,开发者与实际应用场景的结合也愈发紧密。通过开源模型,许多来自教育、医疗、金融等不同行业的专业人员,已经成功应用AI生成广告视频或法律咨询。

  在会议期间,许多智能硬件产品也受到了广泛关注。杭州灵伴科技的AR眼镜——RokidGlasses引发了许多开发者的关注,采用了先进的AI感知算法,能够使用户在使用过程中极为便捷。

  智能硬件市场的思潮正在向“高拟人化”发展,上海交通大学的王琳教授提出了这种设备的一个新定义。他表示,这类硬件不再仅限于被动感知,而是具备了自主智能思考能力,能够在预判用户需求的基础上,做出更为高效的响应。这一过程可能会依赖于日益成熟的多模态大模型。

  参与会议的与会者普遍认为,提升的多模态大模型将在未来一年内可能与目前的语言大模型水平持平,且在使用门槛与成本上有望达到普通用户可接受的范围。智能硬件的普及与发展,与AI技术的成熟密不可分,尤其是底层架构的开源与共享,将成为推动这场革命的核心引擎。

  综上所述,开源大模型与AI智能硬件的迅速迭代,不仅为技术的普及提供了无限可能,更为各行业的应用带来了新的生机与活力。在这场变革中,对于开发者和普通用户而言,及时拥抱这些变化,将是进入更广阔未来的关键。

  易倍体育官方网站 Emc易倍体育

  解放周末!用AI写周报又被老板夸了!点击这里,一键生成周报总结,无脑直接抄 → →