+
95
-

回答

llama.cpp这个项目可将大模型量化成不同的大小让不同设备上都能运行大模型。

https://github.com/ggerganov/llama.cpp

800_auto

网友回复

我知道答案,我要回答