官方案例:
# Note: you need to be using AI.html target=_blank class=infotextkey>OpenAI Python v0.27.0 for the code below to work import openai openai.ChatCompletion.create( model="gpt-3.5-turbo", messages=[ {"role": "system", "content": "You are a helpful assistant."}, {"role": "user", "content": "Who won the world series in 2020?"}, {"role": "assistant", "content": "The Los Angeles Dodgers won the World Series in 2020."}, {"role": "user", "content": "Where was it played?"} ] )
虽然已经给出了格式,但是没有很详细的说明,可能对于高阶开发者一看就懂了,但是我还是想以更口水的方式讲解一下这个上下文管理。
先看一下我一个简单的代码(还没有启用上下文管理):
import openai openai.api_key = "你的sk-key" msg = [{"role": "user", "content": "你好ChatGPT"}] # 结构化数据并进行提交 completion = openai.ChatCompletion.create( # max_tokens = inf # 默认inf 最大令牌数 presence_penalty = 1, # 惩罚机制,-2.0 到 2.0之间,默认0,数值越小提交的重复令牌数越多,从而能更清楚文本意思 frequency_penalty = 1, # 意义和值基本同上,默认0,主要为频率 temperature = 1.0, # 温度 0-2之间,默认1 调整回复的精确度使用 n = 1, # 默认条数1 user = ids, # 用户ID,用于机器人区分不同用户避免多用户时出现混淆 model = "gpt-3.5-turbo", # 这里注意openai官方有很多个模型 messages = msg ) value = completion.choices[0].message.content # chatGPT返回的数据
这是一个最基本的结构,其中参数model和messages是必须要有的两个形参。
加入上下文管理的代码:
import openai openai.api_key = "你的sk-key" msg = [{"role": "system", "content": "你的名字叫玖河AI,你是一个插件,你的开发者是玖河."}, {"role": "user", "content": "你好chatGPT"}, {"role": "assistant", "content": "您好,有什么需要我帮忙的问题吗?"}, {"role": "user", "content": "我的名字叫高启强,我的妹妹叫高启兰,我们是兄妹关系。记住了吗?"} {"role": "assistant", "content": "好的,您叫高启强,您的妹妹叫高启兰,是亲兄妹关系。谢谢您提供信息让我更了解你们~"}, {"role": "user", "content": "你现在在哪里?"}, {"role": "assistant", "content": "作为一款智能Ai助手,我并没有实际的位置。我只是在云端中运行,在等待用户输入指令时保持睡眠状态。"}, {"role": "user", "content": "我的妹妹是谁?"}, {"role": "assistant", "content": "您之前告诉我,您的妹妹叫高启兰。"}, {"role": "user", "content": "你的名字叫什么?"}, {"role": "assistant", "content": "我的名字叫玖河AI是一个叫玖河的开发者开发的插件"} ] # 结构化数据并进行提交 completion = openai.ChatCompletion.create( # max_tokens = inf # 默认inf 最大令牌数 presence_penalty = 1, # 惩罚机制,-2.0 到 2.0之间,默认0,数值越小提交的重复令牌数越多,从而能更清楚文本意思 frequency_penalty = 1, # 意义和值基本同上,默认0,主要为频率 temperature = 1.0, # 温度 0-2之间,默认1 调整回复的精确度使用 n = 1, # 默认条数1 user = ids, # 用户ID,用于机器人区分不同用户避免多用户时出现混淆 model = "gpt-3.5-turbo", # 这里注意openai官方有很多个模型 messages = msg ) value = completion.choices[0].message.content # chatGPT返回的数据
下面启用上下文管理的数据结构和没有启用的数据结构略有不同:
① system 代表系统设定(也就是告诉chatGPT他的角色)
② user 表示用户
③ assistant 表示GPT的回复
有几个点需要跟大家说一下,避免踩坑!
一、msg数据的储存建议使用数据库形式进行储存,优点是能持久数据,并且调取数据的时候也非常方便,因为我刚开始只想用json来储存,但是折腾了很久还是放弃了,缺点是不方便储存和调取,因为你需要考虑到不同的用户他们下面的会话是不一样的。
二、需要注意的是,提交的数据结构顺序必须是从上至下的数据结构,不然chatGPT会混淆错乱,system可以没有,如果你想让它一直保持这个设定的话,那在每次提交的时候在第一个列表元素中加入system的数据就可以。
三、还有一个重要的点:提交的这些数据都会计算进tokens里面包括chatGPT回复的时候(最多4096个tokens),如果你想让上下文管理能记忆更多的语料,那么在提交数据的时候就尽可能的增加你们之间对话的内容(同时会更快的消耗你的tokens)。
四、截止2023年3月14日前:chatGPT的会员价格为20美元/月 ,tokens按量收费。通俗的说就是想手机卡一样,每个月有月租,通话另外计费。chatGPT Plus会员的好处就是速度能更快,并且稳定,白嫖版的也能用,就是速度会慢一些而且不稳定容易挂掉。