Robot Utility Models(RUMs) 是一种由纽约大学、Hello Robot 和 Meta 研究人员开发的机器人框架,它能够训练出在没有进一步微调的情况下,能够直接适应新环境和对象的机器人策略。

RUMs 通过结合多模态学习和自我批评机制,提升了机器人在新环境中的自主性和适应性。该框架的主要功能包括零样本部署、多模态行为生成模型以及自我批评和重试机制。RUMs 的工作原理涉及数据收集、模型训练、自我批评和零样本部署。
通过大规模、多样化的任务特定数据集训练,RUMs 具备数据驱动和泛化能力,并能够通过多模态语言模型(mLLM)提供实时反馈,以检测和纠正执行中的错误。具体应用场景包括家庭自动化、仓库管理和服务机器人等。其他相关的机器人学习和技术,如 TRANSIC、Vid2Robot、GeFF 系统、伯克利分校的机器人双手协同拧瓶盖研究、MOSAIC 系统、UMI 框架、ICRT 模型、Sapiens 模型家族、UniT 触觉表示学习方法、DeepMind 的机器人乒乓球系统、DAAG 以及 Theia 视觉基础模型。|
项目主页:https://robotutilitymodels.comGitHub:https://github.com/haritheja-e/robot-utility-models
\
网友回复
有没有不依赖embedding向量的RAG技术?
有没有支持实时打断语音通话并后台帮你执行任何的ai模型?
开源ai大模型文件格式GGUF、MLX、Safetensors、 ONNX 有什么区别?
出海挣钱支付收款PayPal、Wise 、PingPong、Stripe如何选择?
如何实现类似google的图片隐形水印添加和识别技术?
linux上如何运行任意windows程序?
ai能写出比黑客还厉害的零日漏洞等攻击工具攻击任意软件系统工程?
js如何获取浏览器的音频上下文指纹、Canvas指纹、WebGL渲染特征?
为啥ai开始抛弃markdown文本,重新偏好html文本了?
网站有没有办法鉴别访问请求是由ai操控chrome-devtools-mcp发出的?


