大类有三大类:
GPT-3 一系列可以理解和生成自然语言的模型。
codex 一系列可以理解和生成代码的模型,包括将自然语言转换为代码。
Embedings 一组可以理解和使用Embedings的模型。Embedings是一种特殊的数据表示格式,机器学习模型和算法可以轻松利用。Embedings是一段文本语义含义的信息密集表示。目前,我们为不同的功能提供了三个Embedings模型系列:相似性、文本搜索和代码搜索。
每个大类系列都有一系列型号,这些型号通过功能进一步区分。这些功能通常由名称标识,这些名称的字母顺序通常表示给定模型系列中该模型的相对功能和成本。例如,GPT-3 模型使用诸如 Ada、Babbage、Curie 和 Davinci 之类的名称来表示相对能力和成本。Davinci 比Curie更有能力(成本更高),而Curie又比Babbage更有能力(成本更高),依此类推。注意:任何可以由像Ada这样能力较弱的模型执行的任务都可以由像Curie或Davinci这样能力更强的模型执行。
命名约定
OpenAI 的模型名称通常对应于以下标准命名约定:{family}-{capability}[-{input-type}]-{identifier}
旧版本的 GPT-3 模型可用,命名为 、、 和 。这些较旧的模型不遵循标准命名约定,它们主要用于微调。有关详细信息,请参阅了解如何为应用程序自定义模型。adababbagecuriedavinci
GPT-3 型号
GPT-3 模型可以理解和生成自然语言。该服务提供四种模型功能,每种功能都具有不同的功率和速度水平,适用于不同的任务。Davinci 是最有能力的模型,而艾达是最快的。以下列表表示最新版本的 GPT-3 模型,按功能增加排序。
text-ada-001
text-babbage-001
text-curie-001text-davinci-002
虽然Davinci 是最有能力的,但其他型号提供了显着的速度优势。我们的建议是让用户在实验时从Davinci开始,因为它将产生最好的结果并验证我们的服务可以提供的价值。一旦原型正常工作,您就可以优化模型选择,为您的应用程序提供最佳的延迟/性能平衡。Davinci
Davinci是最有能力的模型,可以执行其他模型可以执行的任何任务,通常只需较少的指令。对于需要深入了解内容的应用程序,例如针对特定受众的摘要和创意内容生成,Davinci 会产生最佳结果。Davinci 提供的增强功能需要更多的计算资源,因此 Davinci 的成本更高,而且速度不如其他模型快。Davinci 擅长的另一个领域是理解文本的意图。Davinci 擅长解决多种逻辑问题,解释人物动机。Davinci 已经能够解决一些涉及因果关系的最具挑战性的人工智能问题。
用于:复杂的意图,因果关系,受众摘要
Curie
Curie很强大,但速度很快。虽然Davinci 在分析复杂文本方面更强,但Curie能够完成许多细微的任务,如情感分类和总结。Curie还擅长回答问题和执行问答,并作为一般服务聊天机器人。用于:语言翻译、复杂分类、文本情绪、摘要
Babbage
Babbage可以执行简单的任务,比如简单的分类。在语义搜索方面,它还能够对文档与搜索查询的匹配程度进行排名。用于:中等分类、语义搜索分类
Ada
Ada 通常是最快的模型,可以执行解析文本、地址更正和某些不需要太多细微差别的分类任务等任务。Ada 的性能通常可以通过提供更多上下文来提高。用于:解析文本、简单分类、地址更正、关键字
Codex 模型
Codex 模型是我们的基本 GPT-3 模型的后代,可以理解和生成代码。他们的训练数据包含自然语言和来自GitHub的数十亿行公共代码。他们最擅长Python,精通十几种语言,包括C#,JavaScript,Go,Perl,PHP,Ruby,Swift,TypeScript,SQL甚至Shell。以下列表表示最新版本的 Codex 模型,按功能递增排序。
code-cushman-001
code-davinci-002
Davinci
与 GPT-3 类似,Davinci 是功能最强大的 Codex 模型,可以执行其他模型可以执行的任何任务,通常指令较少。对于需要深入了解内容的应用,Davinci 可产生最佳效果。这些增加的功能需要更多的计算资源,因此Davinci的成本更高,而且不如其他模型快。Cushman
Cushman功能强大,但速度很快。虽然Davinci在分析复杂任务方面更强大,但Cushman是许多代码生成任务的有能力的模型。Cushman通常也比Davinci跑得更快,更便宜。Embedings模型
目前,我们为不同的功能提供了三个Embedings模型系列:相似
文本搜索
代码搜索
每个系列都包含一系列功能的型号。以下列表指示服务根据模型功能返回的数值向量的长度:Ada:1024尺寸
Babbage:2048尺寸
Curie:4096尺寸
Davinci :12288尺寸
Davinci 是最有能力的,但比其他型号更慢、更昂贵。Ada的能力最差,但速度更快,更便宜。相似性Embedings
这些模型擅长捕获两段或多段文本之间的语义相似性。使用案例 模型
聚类、回归、异常检测、可视化 text-similarity-ada-001
text-similarity-babbage-001
text-similarity-curie-001
text-similarity-davinci-001
文本搜索Embedings
这些模型有助于衡量长文档是否与短搜索查询相关。此系列支持两种输入类型:用于Embedings要检索的文档,以及 ,用于Embedings搜索查询。docquery使用案例 模型
搜索、上下文相关性、信息检索 text-search-ada-doc-001text-search-ada-query-001
text-search-babbage-doc-001
text-search-babbage-query-001
text-search-curie-doc-001
text-search-curie-query-001
text-search-davinci-doc-001
text-search-davinci-query-001
代码搜索Embedings
与文本搜索Embedings模型类似,此系列支持两种输入类型:用于Embedings要检索的代码片段,以及 ,用于Embedings自然语言搜索查询。codetext使用案例 模型
代码搜索和相关性 code-search-ada-code-001
code-search-ada-text-001code-search-babbage-code-001
code-search-babbage-text-001
使用我们的Embedings模型时,请记住它们的局限性和风险。
网友回复