特斯拉机器人大转向:训练需求至少是汽车的10倍
时间:2025-09-08 12:28:13 阅读:
据《商业内幕》报道,特斯拉在自动驾驶技术上坚持使用知情内部人士告诉《商业内幕》,特斯拉已在6月底告知员工,公司未来将更加专注于通过纯视觉方案来推进Optimus人形机器人的训练。
此前,特斯拉使用内部人士称,特斯拉表示,放弃动作捕捉服和远程操作将使团队能够更快速地扩大数据收集规模。
这一调整标志着远程操作和动作捕捉是行业训练机器人时的标准做法。例如,知名机器人公司目前尚不清楚特斯拉未来是否会再次优先使用动作捕捉服和远程操作,或者是否利用数据在此前收集的信息基础上进行进一步训练。
人类与机器认知研究所的高级研究科学家罗伯特·格里芬对《商业内幕》表示,大量远程操作数据使机器人能够通过与环境的实际互动来学习。他表示,要教会机器人将数据转化为现实世界的动作并非易事。
“如果你只是使用数据,就没有这种直接交互体验。”他说道。
今年5月,特斯拉发布了一段,似乎显示Optimus机器人正在根据录像完成各种任务。
特斯拉负责Optimus硬件研发的总监康斯坦蒂诺斯·拉斯卡里斯似乎已经承认了这一新策略。今年5月,他在领英上发文称:“这听起来令人难以置信,但我们的机器人正在通过人类直接学习新任务!”
马斯克也在5月表示,知情内部人士称,在技术转型期间,特斯拉曾短暂停止Optimus团队的招聘。截至8月底,特斯拉的招聘页面仍列出了50多个与Optimus相关的职位。
知情人士表示,在6月底之前,特斯拉仍在远程操作Optimus,并通过动作捕捉服训练机器人。员工们需要花时间排查动作捕捉服和Optimus的问题,这限制了团队能够收集的数据量。
自训练方式转变以来,员工们开始专注于使用佛罗里达州立大学FAMU-FSU工程学院机器人实验室主任克里斯蒂安·胡比茨基表示,多角度拍摄可能帮助特斯拉采集更精细的细节,“比如关节和手指的位置”,并实现机器人的空间精准定位。他指出这些也可用于增强此前通过远程操作收集的数据集。
执行训练任务的工作人员会收到具体指令,特别是在手部动作方面需要确保动作尽可能接近人类形态。一名人士称,有些员工可能需花费数月时间重复执行同一个简单动作。
谢菲尔德大学机器人专家乔纳森·艾特肯告诉《商业内幕》,特斯拉很可能需要想办法教会Optimus使用可应用于多种任务的动作。
“在这种规模的操作中,他们必须建立通用动作库,否则逐个训练所有动作将耗费无穷的时间。”艾特肯表示。
他补充说,特斯拉可能会采用与Physical Intelligence公司类似的策略,后者向机器人输入海量示范数据,使其能够学习可转移技能并灵活应用,而非仅仅机械记忆单项任务的执行方式。
这一新策略与特斯拉训练其自动驾驶系统的方案一致。尽管其他自动驾驶公司使用激光雷达和雷达传感器来训练软件,特斯拉主要依赖多个摄像头。
特斯拉使用从数百万特斯拉车主收集的数据,这些车辆配备了八到九个摄像头。马斯克表示,不过,马斯克在1月份的财报电话会议上承认,“Optimus人形机器人的训练需求,可能最终至少是汽车所需的10倍。”
艾特肯表示:“这是非常符合特斯拉风格的机器人开发方式。没有其他公司在同等规模上尝试这样做。他们需要的数据量将与训练汽车所用的数据量相当。”
俄勒冈州立大学AI与机器人专家艾伦·费恩表示,对于特斯拉来说,训练Optimus将比开发自动驾驶汽车更加艰巨。
“驾驶只是单一任务。”费恩称。他表示,主要靠学习要求机器人理解中发生的情况,然后具备完成任务的技能,“有些技能可以通过观察学习,有些则需在模拟器或现实中进行物理实践”。
截至发稿,特斯拉尚未就此置评。
源自:凤凰网科技