8月9日,在国际机器人大会的讲演台上,宇树科技创始人王兴兴谈论到现在机器人运动操控范畴存在的RL Scaling Law问题,他以为现在的机器人在学习一项新的技能时,往往都是需求从头开始研讨以及教育。
而在未来愈加期望的是可以在原有的根底上去不断学习,使得他们的学习速度愈加快速以及作用更好。
整个具身智能职业在现在并没有人将强化学习的Scaling Law做好,所研讨的算力增加、数据堆积,并不能直接让机械手臂变得愈加灵活,或许让双足的机器人走得更稳。
实际上,问题并不在于咱们所供给的硬件、数据不行好,而是其“大脑进化”以及环境不断习惯,那么,面临具身智能Scaling Law缺失,咱们是否应该好像婴儿时的教育,让其不断测验,具有实在不断演化的才干,促进机器人界的"摩尔定律"诞生?
算力增加≠智能进化:具身智能的物理瓶颈困局
在现在的人工智能范畴,咱们逐步以为当咱们供给了更多的数据以及算力时,就可以支撑机器人具有更聪明的才干。
例如,ChatGPT的开展好像印证了这一点——给它更大的模型、更多的练习文本,它就能写出更流通的文章,回答更杂乱的问题。
咱们可以知道在虚拟ai范畴,数据是单一的,规则是清晰的,所以增加算力和数据就可以去提高虚拟ai的功能。
但当这样的方法放到机器人的身上,在它与实际国际交互的时分,咱们发现其实在作用往往就会遭到不同原料的冲突、空气阻力、物体形变等发生随机性影响,比方,运转中会被一些障碍物绊倒等。
哈佛大学的"机器蚂蚁"试验生动地展现了这个窘境。研讨人员给这个小机器人增加了10倍的运算才干,等待它能更好地习惯杂乱地势。
但成果令人绝望:它的环境习惯才干只提高了微乎其微的2%。问题不在于芯片不行强,而在于蚂蚁的机械腿无法像实在昆虫那样活络地感知和习惯地上改变。
所以,实际国际中很多的物理特性就让机器人在运转呈现了很多个"意外情况"。
而且,现在机器人在学习新的技能以及习惯新环境时,其芯片总是会需求较大的能耗。
这并不是经过技能的不断进化,然后削减能耗的消耗量可以处理的问题,而是应该去面临根本性的缺点:机器人还在用"蛮力核算"来对立物理规则。
这样的窘境提醒了一个深入的实际:在机器人范畴,单纯的算力增加就像给轿车装了微弱的引擎,却忘了咱们所要前行的路途是高低、坑洼的路途,它是否可以实时应对路况呢?
咱们愈加期望的是其可以像人类的生物体系相同,总是在原有的根底之上不断进化,去面临并处理受物理国际限制的窘境。
达尔文式进化:具身智能的身体习惯才智
实在智能的要害并不是在于它的“大脑”学习的东西是不是足够多,就比方在天然界中,章鱼没有脊椎动物那样会集的大脑,它的5亿神经元散布在触手中,却能让八条腕足各自独立抓取、勘探乃至"考虑"。
但是,这样的生物所表现的行为是不同于机器人的会集依托数据驱动的“大脑”智能形式,而是将身体自身也作为核算的一部分。
曩昔,机器人和AI的前进主要靠堆算力和数据,就像不断给核算机供给很多的常识,期望它变得愈加聪明。
但实际上的实际智能开展,无论是人类婴儿学步,仍是动物的精准捕猎,都依靠着咱们的身体与环境的实时互动。
所以咱们愈加需求它的身体有着的自己习惯才干——就像人类肌肉会在呈现突发情况时,自动发生必定的行为。
但是机器人需求习惯的是未在提早预设的情况下,依据指令以及环境改换,供给不同的情况和行为。
正如,王兴兴所提及期望当机器人处于一个新的环境时,可以自动去探究一些事物,来满意咱们所供给的指令,而不是咱们将一些详细的数据供给给它,只需求照做就行。
未来的打破点或许在于其“身体”和“大脑”的像天然生物相同一起进化,算法不再需求为每个纤细的环境情况进行不断地练习,而是像生物那样在互动中天然调整。****19汪小菲有没有桃色新闻36年日本桃色新闻23433;丘玻璃钢桃色新闻**
这条路尽管困难,但天然界的进化史傍边现已证明其可行性。从单细胞生物到人类,生命进化或许给咱们供给了较优方向。
未来的机器人或许需求向生物学习,开展出与物理国际调和同处的"身体智能"。
实在的打破,不是制作更精细的机械臂,而是创造出愈加具有生命力的机器人。
重塑衡量规范:具身智能需求拥抱"生存力"
关于具身智能来说,实在的检测历来不是重复完结某个固定使命,而是在改变中保持安稳。
现在的机器人缺少实在的抗干扰才智——不是防止犯错,而是犯错后快速批改的本事。
咱们总是笑着现在的机器人有着少许蠢笨的行为,乃至关于它们的动作称之为“老太行为”,但关于这样还需不断进化的具身智能来说,应该把"容错率"变成衡量智能的新规范。毕竟在实在国际里,安稳比精准更重要。
像在孩提时期,当咱们拿起保温杯时,不需求重新学习"抓握"这个动作——咱们知道它和马克杯相同都是圆柱形容器,只需微调力度,就可以相同的拿起这个东西。
但今日的机器人完美把握马克杯后,面临保温杯时又要从零开始练习。问题不在于它不行"聪明",而在于它缺少对"杯子"这个概念的实在了解。
这种"泛化才干"的缺失,露出了当前机器人学习的中心缺点:它们经过海量数据只能记住关于这个特定物体的抓取方法,却无法笼统出通用规则。
实在的打破或许需求让机器人像孩子相同,先了解"抓握"的实质(形状、分量、冲突力之间的联系),而不是死记硬背每个物体的数据。
当测评规范转向"生命力"而非"精准度",具身智能才干打破现在的天花板,迈向实在的实用化。
参考资料:
1.杭州ai之都— —王兴兴“迸裂”讲话:机器人的ChatGPT时间 行将到来丨王兴兴在2025国际机器人大会讲演实录(文字+视频)
2. 机器之心— — 机器人迈向ChatGPT时间!清华团队初次发现具身智能Scaling Laws
本文来自微信大众号“日晞视界”,作者:咸闲,修改:咸闲,36氪经授权发布。