目前端对端的自动驾驶技术正在研发,端对端的数字人估计也有公司在研发,但是这个参数估计是巨大,成本也是巨大,烧钱的很,看看哪个大公司能搞定,一般ai研究的方向比较垂直,比如语音识别、tts、图片驱动、文本回答等,但是一个完全兼具听说读写类似真人的ai数字人目前只能通过传统的技术叠加,比如逻辑处理是文本ai大模型,说话是语音模型,听是语音识别模型,人物动起来又是另外一个模型,几个模型串联在一起形成一个ai数字人,这就有了延迟问题,不能跟真人媲美,但是我认为端对端的数字人技术也是未来的趋势,就是端对端的自动驾驶技术一样。