回答-BFW问答

1、智谱AI的“AutoGLM”：它能够模拟人类操作手机和网页的AI智能体。

2、Anthropic的“Computer Use”：这是一个AI智能体产品，它能够接收指令后，AI亲自接管设备，包括点击、输入等交互功能。例如，它能够完成“填写公司表格数据”的任务，通过查找数据、搜索信息并输入表格。

3、微软的OmniParser：这是一个基于纯视觉的GUI屏幕解析工具，能够自主操作，如在交付给它一个收集素食餐厅的任务时，OmniParser通过解析界面元素，在网页中定位到“餐厅”字样，并完成勾选。