- 0
- 0
- 0
分享
- 80+具身智能、“百镜大战”、卷应用的大模型…硬核科技亮相2025 WAIC
-
原创 昨天


从大模型到智能终端,从具身智能到AI+的突破……2025世界人工智能大会(简称“WAIC”)正在将人类对未来科技的想象转化为可触可感的现实图景。
具身智能,从实验室走向千行万业
机器人是2025WAIC的最大亮点之一。GGII数据显示,2025年上半年中国人形机器人行业融资事件达87起,已披露融资金额109亿元,远超去年全年规模。
相对于去年的机器人“十八罗汉”,今年有超80家具身智能相关企业参展,已启动上市辅导的宇树科技是最受关注的企业之一。
2025WAIC现场,宇树科技携人形机器人G1、四足机器人B2和Go2亮相,不仅如此,宇树科技带来了数场精彩绝伦的机器人格斗比赛。
现场,身高1.32米、重35公斤的G1机器人,在擂台上展现出令人惊叹的“武学造诣”。其搭载的29个高精度关节电机与智能平衡算法,让机器人能瞬间完成“直拳-勾拳-回旋踢”的三连击,甚至在被真人对手突袭绊倒后,仅用0.8秒便通过动态平衡系统完成“鲤鱼打挺”式起身。
但当机器人被围绳绊倒在台侧,仍需要工作人员辅助拖拽到相对开阔的地方再灵活地自行起身。这也引得现场观众接连爆发出无情大笑和喔唷喔唷的赞叹声。
为了让机器人们更好地展示“干活”的能力,本届WAIC特别设计了“WAIC里技能大舞台”。在这个“上海弄堂”,各家产品同台献技。
化身外卖小哥的银河通用Galbot;制作爆米花、调制各类冰镇饮料的擎朗智能XMAN-F1,剥鹌鹑蛋的云百生全自主AI超显微手术机器人,打架子鼓的智平方机器人AlphaBot;能满足人们“想吃不想动”需求的穹彻智能机器人……
银河通用Galbot机器人基于团队自研端到端具身大模型GroceryVLA全天候开展商超运营工作。

Galbot之所以能在如此复杂环境中完成稳定作业,核心在于其背后的端到端具身大模型——GroceryVLA。GroceryVLA模型突破传统“视觉+轨迹规划”分离设计,能够在几乎无空隙、货架紧密且SKU众多的真实场景中自主识别商品并稳定抓取,无需路径规划即可灵活高效操作,标志着端到端大模型驱动的闭环控制已具备商用能力。

在城市服务领域,银河通用自研模型跨本体部署,实现了机器狗形态的垃圾捡拾与巡检能力。观众可以在展区内随意投掷水瓶等物品,物品的位置和姿态完全随机,机器狗能够自主精准识别目标物,并迅速将其抓起,充分展现了系统对复杂动态环境的高度适应性和精准操作能力。
智平方的通用智能机器人AlphaBot(爱宝)系列凭借一个硬件形态和一个基座大模型Alpha Brain,在展会现场真正上演了多场景、多任务的“技能秀”——打冰淇淋/咖啡/饮料、2X2码垛、打架子鼓。

一个机器人在多场景作业,三场演示的背后,智平方自主研发的端到端具身大模型Alpha Brain是关键。GOVLA作为Alpha Brain的核心技术,不同于传统机器人分模块控制的方式,它通过统一的模型架构,将多模态信息整合处理,实现了从感知到动作的“端到端闭环控制”。
GOVLA大模型让爱宝拥有全域行动和全身协同能力,突破了传统机器人“固定工位”的局限,以及从简单任务到长程复杂任务的推理能力。而且,GOVLA大模型快慢系统融合的创新设计,有效解决了复杂推理与快速行动难以兼得的难题,让爱宝机器人能够实现即想即动零延迟。
擎朗智能持续开发并正式推出全球首个针对服务业的岗位化垂域模型ProS,通过结合通用大模型提供跨场景基础能力,XMAN-F1机器人实现了从单一任务执行到全场景服务闭环的跨越,可实现餐厅、酒店、零售等细分领域的标准化服务闭环,可胜任餐食制作、配餐收台、房间整理等岗位标准化操作。

在展会现场,XMAN-F1展示了爆米花制作技能,并根据顾客需求调制各类冰镇饮料,包括雪碧、可乐、是否加冰等多种选择。
云百生的全自主AI超显微手术机器人,在现场演示“壳剥落膜不破”的精细操控能力。

这款专为高风险、高精度手术设计的机器人,以10微米至亚微米级操作精度(为现有手术机器人的10倍、人工操作的100倍),直击神经外科、心脏外科、眼科等领域的临床痛点。
现场工作人员介绍,做一些缝合和切除手术时,不能伤害软组织,类似的过程就如同剥鸡蛋不能破坏鸡蛋里的那层膜一样。这款机器人是在香港科技大学上海产教融合中心孵化的,核心的电机、传感器、运动控制、视觉系统都是国产的,未来上市后价格是进口产品的十分之一。
非夕携手穹彻将双臂移动力控机器人平台AICO-2与穹彻具身大脑结合起来,使AICO-2能够自主完成冰柜开关、手工舀挖冰淇淋并放置、清洗挖勺等连续的复杂任务。

穹彻智能把“想吃不想动”写进程序,具身大脑驱动双臂机器人能够自主打开冰柜、精准挖舀冰淇淋球、均匀撒落小料、轻柔关闭冰柜,还不忘即时冲洗挖勺。
穹彻与海尔联合研发的家庭机器人也将在展会现场自主完成收拾衣物、洗衣、烘衣、清理地面杂物、摆放拖鞋等动作。
智元机器人在写书法、击鼓、舞龙,希夕智能机械臂会按照现场客户需求穿配关东煮串……相比去年,2025WAIC展示出了机器人的实用性,它们能做的人类行为、能落地的应用场景愈发丰富。
AI眼镜,迭代人机交互模式
在生成式AI技术驱动下,智能眼镜正被视为移动终端的革新方向,本届WAIC展会中多家企业推出新品,呈现差异化定位——部分聚焦全场景通用能力,另一些则深耕工业辅助、实时翻译等专业领域。
阿里巴巴在人工智能终端产业发展论坛上首次亮相了其首款自研AI眼镜。

据悉,该款AI眼镜已完成产品开发,预计将在年内正式发布。它将深度融合阿里及支付宝生态,具备通义千问大模型的能力,搭载夸克最新的 AI 搜索和问答技术,还支持高德地图导航、淘宝比价、支付宝扫码支付、飞猪行程提醒等功能。阿里方面称,这款眼镜将成为“人类的第二双眼与耳”,是下一代人机交互的“感官中枢”。
团队与高德联合开发了适配眼镜的近眼显示系统,在导航场景中,可实现骑行、步行过程中的精准指引;而视觉问答、学习办公等能力的原生适配,也意味着这不再是只能拍照、听音乐的“玩具型设备”,而是一款真正意义上的随身AI超级助理。
中国电信天翼AI正式发布了首款智能穿戴设备——天翼AI智能眼镜。
作为"第一视角智能伙伴",其以38克超轻半框设计搭载高通AR1芯片与1200万像素镜头,通过天翼星辰大模型实现全场景智能交互。
解放双手操控: 动动嘴“小辰小辰,拍照/录像”或轻触镜腿,即可定格精彩瞬间;
AI视野优化: 拍摄画面更符合人眼观察,智能识别物体、文字、Logo;
随身饮食分析师: 食物一扫,即可得到食物的成分、热量、营养建议等;
智慧文旅导览: 走进博物馆,眼镜可识别展品并提供专业讲解(已打通多家博物馆数据库,持续扩展中);
全能语音助手: 免手操作打电话、发短信、查天气、听音乐、问百科...
跨语言沟通: 中英实时互译,手机录入英语,眼镜播放中文译文。
李未可AI眼镜在本届展会推出City(商务)、City Air(23g无框)、View(旅拍)三款新品。
三款眼镜均拥有AI随时译、AI随身记、AI随地游及AI随心听四大原生AI功能,其中AI随时译、AI随身记是产品的核心卖点。
三款新品的AI随时译支持近180种语言,覆盖了英语、西班牙语、阿拉伯语、印度等几大语系的不同国家口音,同时精耕小语种,如越南语、印尼语等,尤其覆盖了一带一路、中东等重点国家的语言需求。
AI随身记则针对商务人群的需求,不仅能随时记录会谈、大会内容并声称纪要,同时能实现手机、电脑的多端同步进行编辑导出等。
AI大模型,从“卷参数”到“卷应用”
在展会现场,各家大模型厂商与科技公司竞相展示前沿成果——AI正以智能助手形态深度赋能,全面渗透日常生活、职场、学习、文旅等多元领域。
蚂蚁集团最新发布的AI健康应用“AQ”,基于蚂蚁的医疗大模型,能提供健康科普、就诊咨询、报告解读、健康档案等AI功能。

观众可以现场对AQ进行现场提问或上传体检报告,AQ就能快速给出诊断建议,还可以一键接入AI诊室深度问询,同时对接线上挂号或线下医院资源。最新数据显示,自去年9月在支付宝小程序试运行、今年6月推出独立App以来,AQ累计服务用户数已超1亿人次。“AQ”入选本届大会的“SAIL奖”TOP30 和“镇馆之宝”两项大奖。
展区现场,观众还可体验“探一下”AI视觉搜索支持万物识别与图生图、图生视频;“AI出行助手”囊括全国公交、地铁、打车、订机票酒店、景点讲解等,用户一句话即可定制全行程;智能眼镜“看一下支付”,支付便捷更安全;“百宝箱”一站式智能体开发平台,集成主流大模型与插件服务,支持开发者和企业快速定制智能体应用……
当AI大模型能理解行业术语、处理复杂决策并协同完成系统性任务,传统工作模式被重构,人机协作进入 “共生共创” 的新阶段。
展会现场,蜜度以“AI for Easy Work 让工作更轻松”为主题,连续发布三款AI新品——校对通多模态内容校对智能体、模力通AI公文写作助手、V助手2.0舆情分析智能体。
三款产品分别聚焦内容审校、公文写作、舆情分析场景,为现场观众带来“一句话,让AI轻松搞定工作”的全新体验。
百度慧播星发布新一代数字人技术NOVA,该技术曾支撑罗永浩数字人直播间创下5500万GMV,预计将于10月向全行业开放。

依托文心大模型4.5的大师级剧本模式,NOVA能生成优质脚本并驱动多模态协同,让数字人在直播间实现形神音容的高度匹配;其搭载的AI大脑可实时接收直播数据并自主决策,调度多智能体完成问答互动,并结合热点输出风格化内容;NOVA的高效复刻能力仅需10分钟真人样本,就能完成声情动作复刻,实现声音、动作与氛围的精准匹配。
AI智能助手正打破传统教育的 “批量生产” 模式,通过理解学习行为、适配认知节奏、可视化知识体系,让教育真正实现 “因材施教”。
有道AI答疑笔SpaceOne深度融合了DeepSeek-R1推理模型与有道自研的“子曰”教育大模型,将AI能力与教育场景、知识库优势结合,高效解决学生“难题答疑辅导”这一高频、刚需的学习痛点。
得益于DeepSeek-R1推理模型的强大逻辑思维链,有道AI答疑笔超越了单纯呈现标准答案的浅层解题能力,能够将解题过程如同老师书写草稿般进行可视化拆解,清晰呈现思路逻辑,不遗漏任何细节,帮助学生真正理解“为什么”和“怎么做”,有效攻克学习难点。
在硬件设计上,有道AI答疑笔也匠心独具:首创滑动机身,配备获德国莱茵护眼认证的4.4英寸全面屏,提升竖屏效率;3.6厘米宽的隐藏式超大滑动笔头拓宽扫描视窗;800万像素AI摄像头支持扫描、拍照等多种信息录入方式,结合语音问答,带来高效、便捷、护眼的全新学习体验。
当AI助手成为文化的 “转译者” 与 “连接者”,文旅体验不再局限于空间在场,而是通过数字技术实现历史与当下、传统与现代的深度对话。
合合信息旗下扫描全能王推出了以“大尺寸扫描”功能为代表的“无限扫描”技术,现场展示了如何用AI对《坤舆万国全图》《汉宫春晓图》等超大、超长的画作进行高清扫描和无痕拼接,让人人成为文化的守护者。

观众可以上下、左右滑动拍摄视频,AI在“观看”视频后,理解图像、文字特征并挑选出合适的局部图像,优化图像质量,拼接形成一张高清、美观的“收藏级”大图。基于AI对图像的理解,扫描全能王还可智能识别《坤舆万国全图》中的山河疆域、神奇动物等元素,当观众点击指定区域时,就能了解400多年前的人们对世界的认知,实现“让文物说话,让历史发声”的数字化体验。
针对过去大尺寸图像拍摄存在的“广角镜头畸变”“清晰完整难两全”“图像越拼越歪”等困境,扫描全能王创新性地提出了“多行、多列视频拍摄”形式。即使拍摄过程中出现了轻微手抖、角度倾斜等问题,无限扫描也能够在全局性地理解所有“碎片”的内容和联系后,实现每一块“拼图”的精准复位。为了保证成像质量,无限扫描还应用了AI智能高清算法,对图像进行分区优化和光影均衡化处理,确保整张图像清晰度提升、光影过渡自然。
目前看来,厂商们不再停留于"为AI而AI"的噱头,而是聚焦真实需求——企业更关注如何让产品成为用户可感知、可依赖的"助手",而非炫技式创新,最终推动智能穿戴设备从"未来概念"走向"日常必需"。
-
* 文章为作者独立观点,不代表数艺网立场转载须知
- 本文由 文化科技融合汇 授权 数艺网 发表,并经数艺网编辑。转载此文章请在文章开头和结尾标注“作者”、“来源:数艺网” 并附上本页链接: 本站部分文字及图片来源于网络,如侵犯到您的权益,请及时告知,我们将及时处理或删除。