光速光合合伙人蔡伟至今还对第一次去具身智能公司“自变量机器人”测试DEMO的场景记忆犹新。
仅仅是一个简单的指令:把杯子放到碟子上。听懂指令的机器人“发现”杯子被倒置了,它用仅有夹爪的机械臂把杯子先放正,然后准确地找到杯子把手的位置,最终拿起把手成功地放到碟子上,整个动作一气呵成。
“在看到机器人灵活性和智能程度涌现的那一刻,其实自己鸡皮疙瘩都起来了,一下子就能真实感受到未来巨大的可能性和潜力。”蔡伟语带兴奋地回忆起当时的情景。
成立不满一年,自变量机器人就推出了目前最大参数规模的端到端通用具身智能操作大模型WALL-A。在WALL-A模型的赋能下,自变量机器人仅用二指夹爪,就能完成拉拉链、叠衣服、浇花等复杂操作,数分钟级别的任务成功率达到了95%以上。
2024年,光速光合领投了自变量机器人的Pre-A++轮融资。不久前自变量机器人宣布完成了数亿元Pre-A+++轮融资,以及由美团战投领投、美团龙珠跟投的数亿元A轮融资。自成立起不到一年半时间内,公司已完成7轮融资,累计融资金额超10亿元。
蔡伟表示:“我们投资自变量机器人,是看重其在具身智能领域的领先技术布局和差异化竞争力。公司自主研发的端到端具身通用大模型在泛化性和智能程度上在国内处于领先身位。我们相信,随着具身智能成为下一代机器人革命的核心,自变量机器人有望凭借技术通用性、团队执行力和产业资源整合能力,成为全球赛道的重要参与者。”
通往具身智能大模型的路径有无数条,自变量机器人创始人兼CEO王潜相信,“端到端的一体化模型架构”最终能通向罗马。
王潜是“通用具身智能”的挑战者之一,他在机器人和大模型领域都有很深的积累。王潜2007年考入清华大学电子工程系,后获得生物医学工程系硕士学位。硕士期间,他发表论文,率先成为在神经网络中提出注意力(Attention)机制的研究学者之一,并与Google在该领域的首篇文章发表在同一会议。这些研究成果也成为后来Transformer架构中的关键。
硕士毕业后,王潜前往南加州大学读博,在全球顶级的机器人实验室,专注机器人学习、人机交互等相关领域的研究。
他很早就意识到,人形机器人要解决通用问题,最核心的是要解决AI问题。2016年,王潜开始研究端到端。后来,大(语言)模型的成果,为机器人的发展带来了全新视角,王潜决定自己创业。
“美国的优势在于软件层面,但机器人是一个软硬结合的产物,没有成熟的供应链环境是不可能做出来的。”于是,2023年王潜选择回国,在机器人供应链生态完整的深圳,创建了自变量机器人。
端到端具身智能大模型是一条孤独的路。在国内,鲜少有具身智能初创公司选择这一方案。而且,自变量还将所有的任务都在同一个模型中训练和实现操作。这种统一的机器人学习范式突破以往单一专有任务训练的模式,显著提高跨任务学习效率。
为此,王潜组建了一支在软件算法层面兼具“机器人 + 大模型”经验的团队,团队成员主要来自世界知名人工智能/机器人实验室及海内外顶级高校,研发人员占比超90%。
自变量机器人联合创始人兼CTO王昊,是大模型领域的专家。王昊是北京大学计算物理博士,在粤港澳大湾区数字经济研究院(IDEA研究院)期间担任封神榜大模型团队算法负责人。
两人一致认为,机器人会是大模型能在物理世界真正落地的领域。王潜回国创业后,王昊也很快加入了团队。“正确的战略选择和团队优势,不夸张地说,为我们节省了大概半年的时间。”王潜说道。
2024年4月,成立4个月的自变量机器人,发布了国内首个端到端具身智能底座大模型。经过数次迭代后,自变量机器人在同年10月发布了WALL-A模型。
基于大规模通用知识预训练与多任务学习机制,当前「WALL-A」模型在部分未见过的新任务场景中已展现出零样本泛化能力——广泛场景的零样本泛化是实现通用机器人的关键标志之一。
经过不足一年半的研发迭代,自变量机器人的模型已经和海外头部具身智能公司Physical Intelligence(PI)等,站在了同一水平线上,甚至在部分方面实现超越,比如在一些高级别的泛化性操作、操作复杂度等层面。
蔡伟认为,“在具身智能这个大赛道里最终能脱颖而出,除了考验企业的大模型能力之外,是否有更好的算法,能收集大规模、低成本的真实数据非常重要。大模型的泛化能力是由数据采集能力来决定的,数据积累到一定程度,对泛化能力和智能程度的提升会产生很大价值。”
据悉,自变量机器人构建了以模型驱动的数据闭环体系。公司自主研发了数十个数据处理模型和多代数据采集设备,用于实现数据质量的自动化控制与数据采集效率的全面提升。
同时,自变量机器人也在同步自研机器人本体,形成“软硬一体”的闭环能力。公司自主研发并持续优化适配多模态大模型控制的机器人本体,更好地满足开放环境中的精细操作和稳定运行需求。目前,自变量的机器人本体已在多步骤复杂任务场景中落地应用。
“我们最终的目标是直接面向终端消费者,让每个家庭都拥有自己的机器人保姆。”王潜说,不过,他估计人形机器人要在C端实现规模化突破性地落地,至少还要5-7年。
“我们今年将在多个功能性场景中做商业化落地,让机器人在开放性、随机性场景里自主完成各种复杂的操作。这看似一小步,实则是整个技术范式牵引产品范式转变的一大步。”王潜表示。
从布局宇树科技,到投资自变量机器人,光速光合在机器人赛道的投资正慢慢浮出水面。
“我们看到当下无论是在国内还是海外,优秀的大学、科研院所、科技公司都在研究具身智能机器人行业,当他们需要硬件载体时,都无一例外地选择用宇树的机器狗及人形机器人,他们的产品竞争力不仅在中国市场,在全球都是非常领先的。”光速光合合伙人朱嘉回忆去年对宇树科技的投资时说。
朱嘉指出,此外,团队还看到之前宇树的产品更多是以四足机器人的形态出现,但从去年开始,它的人形机器人产品,从第一代到第二代,快速迭代推向市场,公司的第二增长曲线开拓取得了优异的成绩,说明他们有很好地复制并快速做出成功产品的能力。
事实上,蔡伟一直在追踪具身智能行业的发展。最终能找到自变量机器人,蔡伟笑言这是一个偶然的契机,一次理发的经历让他“撞到”了这个项目。他回忆当时在理发的间隙看到一篇介绍自变量机器人做端对端大模型的文章,发现这正是自己非常看好的一个路线。就这样,还没理完发,蔡伟已通过作者联系上了王潜。
在蔡伟看来,具身智能未来的发展必定是以一个系统的形式存在,既有软件,也有硬件,且有很高的进入门槛。“未来可能是有多家企业在不同的细分场景积累不同的认知,行业会是一个百花齐放的局面。”他说。
“我们看好具身智能在一个通用的大脑下会不断衍生出更多具体的应用,不论是To B还是To C,催生更多瞄准某些垂直领域应用的机器人产品。它可以借助现有机器人的大脑,结合行业的需求定制针对特定行业的产品。”朱嘉表示,“产业一旦做大的话在其产业链上,不仅上游的核心零部件,还有与产业相配套的一些产品、技术都会有长足的发展机会和投资价值。”
技术的持续突破,正撬动一个千亿美元级市场。高盛预测,到2035年人形机器人市场规模将达1540亿美元,而自变量软硬同步迭代的通用具身机器人,将抢滩养老护理、家庭服务等增量市场,夺得先机。
“这是一条广阔的赛道,我们走在最合适的路上,并且一定能走到路的尽头。”王潜说。这条路径的尽头,或许正是人形机器人走进千家万户的时代。
声明:证券时报力求信息真实、准确,文章提及内容仅供参考,不构成实质性投资建议,据此操作风险自担
下载“证券时报”官方APP,或关注官方微信公众号,即可随时了解股市动态,洞察政策信息,把握财富机会。
深度丨“爬山神器”爆火,AI眼镜风靡……智能终端百花齐放,如何平衡“通用”与“好用”?