+
34
-

为什么主流大模型架构都在用MoE,而不是传统的Dense?

为什么主流大模型架构都在用MoE,而不是传统的Dense?


网友回复

我知道答案,我要回答