kaiyun体育(中国)2026世界杯 三连发! 阿里发布首个具身大模子Qwen-Robot系列

大象新闻记者 李莉 张迪驰 6月16日,阿里巴巴发布千问具身智能大模子 Qwen-Robot 系列,包含 VLA 操作模子 Qwen-RobotManip、VLN 移动模子 Qwen-RobotNav 和天下模子 Qwen-RobotWorld三大模子。 云开体育2026世界杯中国官网入口 大象新闻记者注重到,这是千问大模子眷属首个竣工的具身智能模子系列。三个模子辩别为机器东说念主装上聪惠的手、认路的脚和会想考的大脑,既可单独部署,也能协同开动,让不同情势的机器东说念主迈向的确落地有了可靠的"...

kaiyun体育(中国)2026世界杯 三连发! 阿里发布首个具身大模子Qwen-Robot系列

大象新闻记者 李莉 张迪驰

6月16日,阿里巴巴发布千问具身智能大模子 Qwen-Robot 系列,包含 VLA 操作模子 Qwen-RobotManip、VLN 移动模子 Qwen-RobotNav 和天下模子 Qwen-RobotWorld三大模子。

云开体育2026世界杯中国官网入口

大象新闻记者注重到,这是千问大模子眷属首个竣工的具身智能模子系列。三个模子辩别为机器东说念主装上聪惠的手、认路的脚和会想考的大脑,既可单独部署,也能协同开动,让不同情势的机器东说念主迈向的确落地有了可靠的"通用底座"。

大说话模子(LLM)是在数字天下里对话和生成内容,而具身智能(Embodied Intelligence)则将这一智商延展到现什物理天下中。现时,公共具身智能行业正处于从“实验室研发”向“的确场景交易化”卓绝的临界点,能否在目生环境里听懂领导、自若施行,是这说念门槛的要道。Qwen-Robot通过三类要道的大模子贪图和教育,让模子能更好地听懂东说念主类当然说话、感知三维环境、了解物理规则,从而衔尾机器东说念主在的确天下中自主施行复杂操作和精确移动,甚而完成从未见过的任务。

VLA (Vision-Language-Action,视觉-说话-看成)模子是现时具身智能最中枢基础模子之一,它将视觉感知、说话显露和看成方案会通,让机器东说念主看得懂、能动手。传统VLA模子的核肉痛点是转移智商不及,换机器东说念主、换场景性能就下跌。让不同情势的机器东说念主能听懂一个模子衔尾,需要处罚看成息争和空间息争两个中枢问题,Qwen-RobotManip恰是从这两点切入。领先,Qwen-RobotManip 用一套 80 维的息争看成表征,为不同硬件界说了通用的"肢体说话",让机器东说念主习得基础物理规则与看成逻辑,看成不再是生硬师法。其次,Qwen-RobotManip 不再依赖繁琐的迷漫坐标计算,而是平直基于录像头画面中的相对位置操作,濒临环境变化时也能更快更准。搭载在不同的硬件中,Qwen-RobotManip只需数步反应即可自动适配,性能自若高效,像老司机坐进目生车辆,试几脚油门就能起程。

RoboChallenge真机多任务公共榜单,代号Lira的Qwen-RobotManip夺得第一

Qwen-RobotManip在卓绝38000小时的语料上完成了预教育。值得一提的是,区别于行业高度依赖异常自采数据的惯例旅途,模子全程仅基于开源数据教育,便获取了优异后果:在横跨30项的确天下任务、4个机器东说念主平台的三方真机测评 RoboChallenge Table30 v1 中,代号“Lira”和“Atlas”的两个版块 Qwen-RobotManip列前两名,kaiyun体育中国2026世界杯入口任务包括拧水龙头、插网线、双臂倒薯条等,官方细目其"基础任务自若、高难任务可打破"。

若是说 VLA 模子让机器东说念主能动手,那么 VLN(Vision-Language Navigation,视觉说话导航)模子,即是让机器东说念主能认路、会跑腿。Qwen-RobotNav 基于 Qwen-VL 构建,将说话领导导航、认识搜索、自动驾驶等五大任务族息争到合并个框架,遭逢复杂任务无需东说念主工切换模子。此前VLN模子由于挂牵战略拘束,时常堕入“记少迷途、记多繁芜”的逆境,为此,Qwen-RobotNav 立异推出任务自符合不雅察机制,凭证任务天长远换挂牵战略。Qwen-RoboNav 同期被贪图成一个通用接口,不错被表层模子调用,是业内少数原生营救多种智能体框架的 VLN 模子。它让机器东说念主的确作念到"边走、边看、边想考最好阶梯",也让导航智商从孤单模子升级为可被息争调用的用具,为竣工的具身智能体系统提供了要道一环。比如,对搭载该系统的宇树 Go2 四⾜机器⼈说“帮我找找不谨记放在哪的行李箱”,它不错自主考查的同期进行视觉推理,最终顺畅地完成寻物导航。

搭载Qwen-RobotNav的机器狗顺利完成寻物导航

会动手、能跑腿,机器东说念主要作念得准还得想得深,就像体操畅通员相通需要反复在“脑海”里演练看成,这依赖于具身智能界限的天下模子。Qwen-RobotWorld是千问对此的最新尝试,基于对物理规则的显露,可推理和模拟出下一个本领点机器东说念主的合理看成和情景,让机器东说念主在现实天下中可照本宣科般地行为。在执行欺诈中,Qwen-RobotWorld不仅能生成视频数据以教育模子,大幅缓解教育数据不及的贫穷,还能在施行为作前,匡助机器东说念主推演将来的看成轨迹,让操作更精确、更到位。

Qwen-Robot系列模子在具身智能评测中夺得多项SOTA

据了解kaiyun体育(中国)2026世界杯,Qwen-Robot 系列是千问大模子眷属从数字智能体迈向物沉默能体的焦躁一步。岂论是单独部署,仍是合座协同,在息争的当然说话领导下Qwen-Robot齐能展现一致的高性能,让一个好像去好多方位、作念好多事情、并料到自后果的物沉默能体成为可能。将来,这套“通用大脑”将搭载于更多情势的机器东说念主,使其在复杂现实中具备高度自主的感知、方案与长程施行智商。

开云体育

关于开云

开云新闻

开云直播

开云2026世界杯

开云体育app

kaiyun体育中国2026世界杯入口

电话:

邮箱:

QQ:

kaiyun体育中国2026世界杯入口

Copyright © 1998-2026 kaiyun体育中国2026世界杯入口™版权所有

技术支持:®开云体育 RSS地图 HTML地图

技术支持:®开云体育 RSS地图 HTML地图