Robot Utility Models(RUMs) 是一种由纽约大学、Hello Robot 和 Meta 研究人员开发的机器人框架,它能够训练出在没有进一步微调的情况下,能够直接适应新环境和对象的机器人策略。
RUMs 通过结合多模态学习和自我批评机制,提升了机器人在新环境中的自主性和适应性。该框架的主要功能包括零样本部署、多模态行为生成模型以及自我批评和重试机制。RUMs 的工作原理涉及数据收集、模型训练、自我批评和零样本部署。
通过大规模、多样化的任务特定数据集训练,RUMs 具备数据驱动和泛化能力,并能够通过多模态语言模型(mLLM)提供实时反馈,以检测和纠正执行中的错误。具体应用场景包括家庭自动化、仓库管理和服务机器人等。其他相关的机器人学习和技术,如 TRANSIC、Vid2Robot、GeFF 系统、伯克利分校的机器人双手协同拧瓶盖研究、MOSAIC 系统、UMI 框架、ICRT 模型、Sapiens 模型家族、UniT 触觉表示学习方法、DeepMind 的机器人乒乓球系统、DAAG 以及 Theia 视觉基础模型。|
项目主页:https://robotutilitymodels.comGitHub:https://github.com/haritheja-e/robot-utility-models
\
网友回复
如何编写一个chrome插件实现多线程高速下载大文件?
cdn版本的vue在网页中出现typeerror错误无法找到错误代码位置怎么办?
pywebview能否使用webrtc远程控制共享桌面和摄像头?
pywebview6.0如何让窗体接受拖拽文件获取真实的文件路径?
如何在linux系统中同时能安装运行apk的安卓应用?
python有没有离线验证码识别ocr库?
各家的ai图生视频及文生视频的api价格谁最便宜?
openai、gemini、qwen3-vl、Doubao-Seed-1.6在ui截图视觉定位这款哪家更强更准?
如何在linux上创建一个沙箱隔离的目录让python使用?
pywebview如何使用浏览器自带语音识别与webspeech 的api?