+
95
-

大语言模型如何切割成专业垂直领域的小语言模型低成本离线运行?

大语言模型如何切割成专业垂直领域的小语言模型低成本离线运行?


网友回复

+
15
-

大语言模型切割成小语言模型,可以采取以下几种方式:

1. 根据领域的数据集进行微调。收集对应领域的数据集,使用这些数据对大语言模型进行微调,得到一个适用于该领域的小语言模型。这种方式简单有效,但需要高质量对领域数据集。

2. 根据种子词选择相关参数。从大语言模型中选择与种子词相关的一部分参数,固定其他参数,得到一个小语言模型。这种方式非常低成本,但生成的小语言模型质量可能较差。

3. 根据层级结构选择部分层。大语言模型通常由Transformer ...

点击查看剩余70%

我知道答案,我要回答