对话模型和补全模型区别
对话模型和补全模型区别
什么是对话模型、补全模型
什么是 Completion
最基本地说,文本模型是一个经过训练的大型数学模型,旨在完成一项单一任务:预测下一个 token 或字符。这个过程被称为 completion,在您的旅程中您会经常遇到这个术语。
例如,当使用 completion 文本模型 gpt-3.5-turbo-instruct 时,您可以向模型提供初始提示:
A long time ago, there were three princesses in a distant kingdom:
什么是 Chat Completion
Chat Completions API
聊天补全 API
为了使文本模型在代码和应用程序中发挥作用,而不仅仅是生成任意的创意信息,模型需要经过预训练,以特定的格式返回数据。
通常,使用文本模型感觉像是一种聊天体验:你以某种角色提问,你会得到一个答案,就像来自另一个角色的人的回答一样。考虑到这一点,模型提供商训练他们的模型,并用一些元数据(例如角色)来提供他们最初的训练数据。这使得模型能够以某种格式做出响应,并用于许多复杂的应用程序。
例如,模型训练数据可能如下所示:
USER: What's the color of the sky?
ASSISTANT: The color of the sky can vary depending on several factors, but it is most commonly perceived as blue during the daytime.
USER: What was the theme we discussed in the previous sentence?
ASSISTANT: The theme of the previous sentence centered around the color of the sky.
上述数据以类似聊天的对话形式编写。训练数据集包含大量此类对话,在训练过程中,模型学习单词和字符之间的关系,使其能够以相同的可预测格式返回它们。
在生成数据后,一个子系统会解析这些信息,并以易于你的代码处理的格式返回,例如以下 JSON: