近期,硅谷的两条新闻引人注意:OpenAI以65亿美元的价格收购了前苹果硬件设计负责人Jony Ive的公司io,目标是为 OpenAI 打造一系列硬件产品;
OpenAI前CTO打造的90亿美元估值新公司Thinking Machines的首个产品疑似曝光,一台专为AI训练打造的“手动调参仪表盘”硬件。
软硬件结合的AI终端产品,一直是科技公司着力发展的方向,从苹果的Siri和百度的小度音箱开始,它就在发展。
但是那个时代,AI的“智力”还不足,不具备真正的理解能力和思考能力,也不能泛化;这就导致当时的智能设备,在与人的交互上,很“死板”。
大语言模型的发展,使得人工智能助理成为可能,而多模态的大语言模型,使得人机交互从GUI(键盘,鼠标,触摸)向多模态交互转变。
交互的变革会带来硬件载体的变革,科技公司们都在追求打造全新的终端,试图颠覆现有的以智能手机为代表的“传统”智能核心交互终端。
你可以想象得到,无论是大厂还是创业公司,看到这样的机会时,已经扑上去了;可惜的是,这第一波AI原生硬件产品被碰了一鼻子灰。
一些产品想从0发明一个硬件形态和硬件交互方式,结果导致市场渗透速度慢,用户的接受度较低。
例如AIPin,它没有真实的显示屏,而是采用激光墨水显示屏 (Laser Ink Display),交互方式是语音和手势,学习成本太高,这也导致这家融资了2.4亿美元的明星创业公司在2025年2月被惠普以1.16亿美元收购。
再看花了10年以上时间教育市场的VR/AR眼镜,根据IDC数据,2024年的出货量在600-700万,而智能手机的总出货量却是按亿级来计算的。
还有一些AI原生硬件瞄准的功能比较低频,例如抓拍、识别物体、同声传译等。这些功能,手机加上了AI能力以后,就可以完成,它们的软件体验还不一定比手机更好,用户没有冲动去单独为这些硬件终端再花一次钱。
另一个问题是,这些硬件的易用性较差,要么没有显示能力,要么显示效果差,还是那个问题,如果AI原生硬件体验不如有AI功能的手机好,那它的存在意义是什么?
硅谷的AI原生硬件创业公司,除了以上问题外,它们还面临供应链和成本的问题,以及这两个因素导致的高价格。
全球的消费电子供应链,主要集中在中国,尤其是珠三角,在这些地区已经形成了完善的产业集群。企业想要制造智能终端产品,能够以极低成本和高效率快速迭代。
反之,硅谷很难利用到这种产业链优势,这一方面导致它们在硬件上迭代相对缓慢,另一方面也导致它们不能以相对较低的价格销售产品。
当AI Pin的售价达到699美元,苹果Vision Pro达到3499美元时,你很难期望它们获得相对高的销量,而没有相对高的销量,作为全新形态的硬件,渗透率很难快速扩大。
就像硅谷的投资人Marc Andreessen所说,当宇树的机器狗售价500美元,波士顿动力的机器狗售价数万美元,而它们在性能上没有可感知的差距时,那么波士顿动力在市场上是竞争不过宇树的。
当第一批AI原生硬件碰了一鼻子灰后,第二波AI原生硬件似乎获得了相对更好的境遇。
由华人创业者打造的AI原生硬件plaude,据传去年营收7000万美元左右,它能够提供录音和AI转写、总结。
能够语音聊天的「小智 AI」开源项目,在3个月的时间里,基本靠用户DIY,接入设备增长了 20 万台。
可以看到,这些AI原生硬件相比没有明显应用场景的第一波硬件,是更专注的,其中有两款,都专注在会议的录音、转写、总结功能。这个场景的特点是,需求非常明确,用户愿意付费,而且正契合了大模型的语音和自然语言处理能力。
从一开始的为了AI硬件而AI硬件,打造一些有创新没场景的产品,到找到了应用场景,能创造价值,能够有用户和收入,AI原生硬件显然变得更加成熟。
除了会议转录类产品,目前可以看到的场景有教育,智能随身相机,医疗健康和个人陪伴。
例如,教育的有科大讯飞AI学习机、猿辅导小猿AI学习机、科大讯飞AI翻译笔、大疆RoboMaster教育机器人;个人陪伴的多是机器人,例如以色列的ElliQ,美国的Moxie,以及中国的X-ORIGIN-AI Yonbo(阿尔法公社对它进行了早期投资)。
有趣的是,相比ElliQ这样不能移动,也不是人形的机器人,Yonbo则是一个可爱的,可移动的机器人。
在医疗健康方面,情况稍有不同,这些医疗硬件大多需要侵入人体内部,例如BioLink Systems采用的是“数字药物+AI感知”的思路,开发能在体内运行、实时收集健康数据的可消化设备。BioLink的传感器小如药片,吞服后可在体内采集温度、酸碱度、电解质等关键生理数据,并通过AI分析提前预警问题。这一产品有望在慢病管理、术后恢复、精准用药等方向实现突破。
从硬件形态和交互方式上看,以上这些AI硬件,除了专注在医疗监控的以外,大多走得并不激进,学习机们的硬件形态还是平板,当然还有眼镜,耳机和相机;多模态的交互方式也多是相对成熟的语音。之所以出现这样的情况,还是为了降低用户的学习成本。
但是AI原生硬件继续发展,总会有完全替代智能手机和平板的一天,全新的多模态交互方式也会渐渐被人们接受。
在往这条道路上走的过程中,需要的是AI原生操作系统,需要AI原生硬件时代的iOS和安卓,因为AI模型对于计算和运行环境的要求与以往的软件程序都不相同。在计算上,AI模型可用云端、边缘甚至端侧的方式提供;而对AI能力的管理,就需要AI操作系统,无论它是闭源的,还是开源的。
在这方面,无论是创业公司,还是大厂,都在努力,例如Meta、Google以及OpenAI。
首先中国有全球最好的AI原生硬件产业链,而且不仅是消费电子产业链,例如各种手机,眼镜,耳机;还包括机器人产业链和智能汽车产业链;这两个产业链的能力(各种传感器,激光雷达,芯片,电池)都是可以迁移到AI原生硬件的。
其次,中国拥有足够强的模型和足够丰富的数据。中国有各种尺寸的开源大模型,可以用到端侧(Qwen 3 4B等),也可以云端提供(DeepSeek R1);还有针对机器人的各种VLA模型(车企也在研发VLA模型)。也有各个领域待挖掘的数据。这些技术基础和技术生态,可以让中国的AI原生硬件创业者,只需要专注在自己的应用场景里,将产品打磨好。
最后,中国有巨大的市场和丰富的应用场景。例如手机市场,根据Canalys的数据,2024年中国大陆市场的智能手机出货量约占全球的23.4%。华为,小米,OPPO,Vivo等品牌,以中国市场为基本盘,就能活得很好;当AI原生硬件日渐成熟,手机的用户转向AI硬件,这个市场将是巨大的。AI原生硬件已经有了企业,教育等基本盘,当它的能力越来越强,进入更多应用场景,也是可以预见的。
阿尔法公社已经完成对光帆科技、光智时空(Looki)、玄源科技(X-Origin-AI)、清智元视(Pixboom)等近十家AI原生硬件的初创公司,绝大多数为项目的首轮投资人,其中有数家已经完成新一轮融资,我们非常看好这个赛道华人团队的发展,并期待与更多赛道的初创团队交流合作。