目前国内的机器人其实都是内置的动作指令,然后通过gpt大模型进行交互调用,没没法做到低延迟实时与大模型交互,比如折衣服,都是事先训练好的一套动作指令,当接收到折衣服指令的时候,机器人开始按照预定的轨迹来操作手臂,这套指令中包含视觉识别与定位,走路也是经过传感器获取数据经过内置的动作算法保持稳定,也就是虽然内置了大模型,但是大模型只是负责规划指令的操作顺序,无法接入动作指令的执行过程,如果像人类一样实时操作,那么还需要很长的时间要走。
降低大模型的延迟是后面ai急需解决的一个问题。
现在的人形机器人其实也只是拥有一个人类的外壳而已,如果像人类一样动作娴熟还有很长的时间要走。
网友回复
gpt-image2能直接将图片转成分层透明的psd设计文件?
claude code、codex、gemini cli如何切换国内大模型使用?
蒸馏最强ai大模型是中小ai模型低成本升级的最好通道?
arena.ai上为啥没有最新的claude4.7及gpt5.5呢?
ai大模型公司为啥开始大量招聘文科生了?
cloudflared如何在低版本centos6或7上安装?
bfwsoa框架如何开启异步缓存与异步任务模式?
selenium如何获取网页js加载渲染后的真实dom结构?
go编写的Eino与python编写的langchain如何选择?
LangChain如何编写多个agent协同工作的代码?


