什么人形机器人自主清洁家务 原来是遥控的
花149块钱,能买到什么级别的保洁服务?答:一个阿姨+一个工程师+一台重逾百公斤的人形机器人,上门服务三小时。这个配置放在58到家的订单页上,一度让人怀疑是不是系统 Bug,少打了一个零?
托马斯白就是带着“这不可能不是坑”的心态下的单。5月10日上午十点,门铃响了。门外站着三个人和一个机器人,货拉拉司机推着机器人,工程师背着工具包,阿姨系着围裙。
机器人背后挂着一台4K无线投屏设备,经5G路由把画面同步到几公里外的远程操作员屏幕上,大部分动作都是远程遥操完成的。
机器人卡机了两次,工程师上前调试重启;剩下的时间他的主要工作是站在机器人后面,盯着那颗红色急停按钮。
机器人过不了门槛,所以只负责客厅。为什么呢,因为这台人形只有上半身是人形,下半身双腿并在一起,是个可折叠的机械柱,而脚部更是直接变成了移动小车,那居民家里有门槛或者地面空间小于移动小车尺寸立刻就狗屁了。
三个小时里,它拎起倒地的书包、拉上拉链(夹了3次才成功)、把三个书包摞成一摞。叠了五六件衣服,每件耗时5到10分钟,叠完像揉过的报纸。茶几杂物归类丢进垃圾桶,餐桌杂物码成半桌,临走把门口的鞋摆齐。
阿姨则收拾厨房、厕所、卧室。托马斯白说,那位“附赠”的阿姨兢兢业业,这次体验的下限被她拉得很高。
https://pic1.imgdb.cn/item/6a09d07442582d261d246a21.jpg
总结来说,机器人负责表演,阿姨负责兜底,工程师负责盯着别出事。
这149元的服务,来自自变量机器人与58到家今年3月在深圳上线的合作项目。
这家成立两年多的公司,在过去半年里把阿里、美团、字节跳动、小米四家互联网大厂罕见地拉到了同一张投资名单上,是国内唯一同时拿到这四家投资的具身智能公司。仅2026开年的 A++轮,就融了10亿元。
四家大厂在这个赛道罕见地没有互相等着,而是一起向同一家公司砸钱。
前段时间,自变量发布了全球首个基于“世界统一模型”(World Unified Model,WUM)架构的具身基础模型 WALL-B。35天后,搭载 WALL-B的新一代机器人将首批进入真实家庭。
自变量 CEO王潜判断:“今天在全世界范围内,没有任何一台机器人可以在没有遥控操作的情况下,独立完成大部分日常家务。”
宇树科技创始人王兴兴也持类似看法:机器人在预设场景中成功率趋近100%,一旦场景变化或出现从未见过的事件,成功率断崖式下跌。他认为机器人做家务还需要3到5年。
也就是说,全行业的共识是——现在还不行。
而王昊在发布会上反复强调的另一件事是数据。“实验室里的数据是能用但低价值的‘糖水数据’,真实家庭的数据则是难采集但高价值的‘牛奶数据’。”
这句话解释了一切:为什么自变量执意在保洁阿姨身边部署一台动作迟缓、远程遥操、还会卡机的机器人。
不是为了让你家变干净。是为了让机器人变聪明。
最近,Figure发布了一段视频。两台 Figure03人形机器人在剪辑后的两分钟内完成了一整套卧室复位动作:开门,挂衣服,把耳机放回架子,合上一本书,把垃圾扔进脚踏垃圾桶,把椅子推回桌下,配合铺好一张床。
其中被反复转发的镜头是机器人单腿支撑、用另一只脚去踩垃圾桶的踏板。这个动作需要同时完成重心转移、脚踝精准控制和手部操作,是 loco-manipulation(移动操作)领域的硬骨头。
这套系统跑的是 Vision-Language-Action模型,名叫 Helix-02。
Helix-02采用“System0/1/2”三层架构:System2慢速推理目标和任务序列,System1以200Hz的速度将感知转化为全身关节指令,System0负责底层基础控制。这种分层设计让机器人在搬运易碎物品时能边走边保持稳定握持,甚至在双手被占用时,用臀部顶上抽屉、用脚抬起洗碗机的门。
Figure把过去十万余行手写的 C++控制代码替换成了一个端到端的“omni-model”,从像素直接算出力矩。按照 Figure官方的描述,这是单一学习神经网络在多人形机器人协同动作控制上的首次展示。
两台机器人之间没有共享规划器,没有消息通信,没有中央协调。它们各自带着摄像头,靠看对方的动作来推断对方意图。有点像两个人一起叠被单时,通过手的移动猜测对方下一步的拉扯方向。
Figure CEO Brett Adcock计划在2026年底把 Figure03送进“精选家庭”,目标售价2万美元以下,月租600美元。但他也承认,机器人在自己孩子附近时,他还是会“盯着”。
做机器人的人自己都不敢完全放手,这大概是对“家庭场景有多难”最诚实的注脚。
相比之下,波士顿动力按下了暂停键。Atlas明确聚焦工业场景,CEO Robert Playter预测人形机器人要5到10年后才能真正走进家庭:“急着进军家庭市场或许是一个策略上的误区。”
既然行业判断从3年到10年不等,为什么还要抢?
过去,机器人变强靠的是工程师写更好的代码。现在,靠的是吃进更多更好的数据。家庭场景不只是一个“应用市场”,而是一座数据矿。
a16z的分析指出,工厂里的任务是重复的、有边界的,而家庭里充满了“never before seen”的情况。这种长尾,过去是 bug,现在变成了 feature。
这就解释了149元三小时为什么不亏:
货拉拉运输、工程师工时、阿姨成本——账面上149元远低于成本。但每一户托马斯白家的三小时,都是无法在实验室复现的真实长尾数据;服务的下限由阿姨兜底,所以即便机器人卡机两次、衣服叠得像揉过的报纸,用户体验也不至于崩盘。
用户以为自己买了保洁服务,实际上,他们在给机器人当老师。而149元,是学费补贴。
https://pic1.imgdb.cn/item/6a09d07442582d261d246a21.jpg
页:
[1]