北京海淀发布导航大模型 机器人能在复杂环境中自主导航
北京海淀发布导航大模型 机器人能在复杂环境中自主导航
北京海淀发布导航大模型 机器人能在复杂环境中自主导航6月1日,北京海淀科技企业银河通用(tōngyòng)推出(tuīchū)自主研发导航大模型TrackVLA,标志着机器人在复杂动态(dòngtài)环境中的自主导航跟随能力迈入了新的阶段。
北京青年报记者了解到,这款具备纯视觉环境感知、语言指令驱动、可自主推理及零样本泛化能力的具身大模型,让(ràng)机器人从(cóng)科幻电影中(zhōng)的想象逐渐走进现实生活。
TrackVLA的核心在于其“端到(duāndào)端”的设计理念,即模型能够直接从“看到的图像”和“听到的指令”中(zhōng)推理出“怎么走”,无需人为拆分多个步骤。这一(zhèyī)特性使得TrackVLA在处理复杂导航任务时表现出色,无需提前构建环境地图,即可在不同环境中实现自主(zìzhǔ)导航。即便是面对未见过的商场、电梯、游乐区等场景,TrackVLA也能依靠内嵌(nèiqiàn)的环境理解知识实现“现学(xiànxué)现走”。
在(zài)具体功能上,TrackVLA展现了八大核心能力。它(tā)能够准确理解自然语言指令,实现目标(mùbiāo)的识别与跟踪;在人流密集的环境中,也能准确识别并长时自主跟随目标;若目标走出视野,它能通过空间智能和大模型推理能力重新找回目标;同时(tóngshí),TrackVLA还能在不(bù)依赖额外采集训练数据的情况下,直接(zhíjiē)部署在陌生环境中实现长时稳定自主跟随。此外,它还具备灵活避障、适应复杂场景等特点。通过App,用户还可以实现远程(yuǎnchéng)可视守护,实时掌握家人动态。
值得一提的是,TrackVLA不仅稳定跟随人类(rénlèi),还能泛化至任意移动目标,如机器狗跟随路上(lùshàng)偶遇的动物狗狗,这一能力是训练时并未教授的,展现了其(qí)强大的泛化能力。
银河通用相关负责人表示,TrackVLA的(de)推出不仅是前沿技术的突破,更是推进“通用具身智能(zhìnéng)机器人”落地过程中的重要一步(yībù)。未来,TrackVLA将赋能不同(bùtóng)形态的机器人本体,打造更加多样化的产业生态和社会服务。
文/北京青年报记者(jìzhě) 王斌

6月1日,北京海淀科技企业银河通用(tōngyòng)推出(tuīchū)自主研发导航大模型TrackVLA,标志着机器人在复杂动态(dòngtài)环境中的自主导航跟随能力迈入了新的阶段。

北京青年报记者了解到,这款具备纯视觉环境感知、语言指令驱动、可自主推理及零样本泛化能力的具身大模型,让(ràng)机器人从(cóng)科幻电影中(zhōng)的想象逐渐走进现实生活。
TrackVLA的核心在于其“端到(duāndào)端”的设计理念,即模型能够直接从“看到的图像”和“听到的指令”中(zhōng)推理出“怎么走”,无需人为拆分多个步骤。这一(zhèyī)特性使得TrackVLA在处理复杂导航任务时表现出色,无需提前构建环境地图,即可在不同环境中实现自主(zìzhǔ)导航。即便是面对未见过的商场、电梯、游乐区等场景,TrackVLA也能依靠内嵌(nèiqiàn)的环境理解知识实现“现学(xiànxué)现走”。
在(zài)具体功能上,TrackVLA展现了八大核心能力。它(tā)能够准确理解自然语言指令,实现目标(mùbiāo)的识别与跟踪;在人流密集的环境中,也能准确识别并长时自主跟随目标;若目标走出视野,它能通过空间智能和大模型推理能力重新找回目标;同时(tóngshí),TrackVLA还能在不(bù)依赖额外采集训练数据的情况下,直接(zhíjiē)部署在陌生环境中实现长时稳定自主跟随。此外,它还具备灵活避障、适应复杂场景等特点。通过App,用户还可以实现远程(yuǎnchéng)可视守护,实时掌握家人动态。
值得一提的是,TrackVLA不仅稳定跟随人类(rénlèi),还能泛化至任意移动目标,如机器狗跟随路上(lùshàng)偶遇的动物狗狗,这一能力是训练时并未教授的,展现了其(qí)强大的泛化能力。
银河通用相关负责人表示,TrackVLA的(de)推出不仅是前沿技术的突破,更是推进“通用具身智能(zhìnéng)机器人”落地过程中的重要一步(yībù)。未来,TrackVLA将赋能不同(bùtóng)形态的机器人本体,打造更加多样化的产业生态和社会服务。
文/北京青年报记者(jìzhě) 王斌

相关推荐
评论列表
暂无评论,快抢沙发吧~
你 发表评论:
欢迎