10个级别的提示工程:从基础到专家技巧
我花了无数时间研究和测试不同的提示,看看哪种能获得最佳效果。在这段视频中,我将所有内容浓缩为十个提示工程级别。从基础知识到最近赢得新加坡提示工程比赛的专家技巧,我们一步步来了解这些级别。现在,让我们开始吧。
一级:简单说明需求
在这个级别,你只是简单地告诉ChatGPT你想要什么,没有太多深思熟虑。有时会得到好结果,有时则不会。这就像让我简单地告诉ChatGPT去总结一篇维基百科文章,这个任务相对简单,它也能完成得不错。但我们可以有很多方法来改进这一点。
二级:基本格式化
一些小的格式化操作可以带来意想不到的效果。例如,仅仅在提示中添加一些破折号来分隔不同部分,可以帮助ChatGPT更好地理解你的需求。虽然在简单任务中可能差别不大,但随着提示变得复杂,这一点显得尤为重要。其他简单的格式化方法也能带来显著差异,比如礼貌用语、避免否定表达,甚至是恳求。一些研究表明,在提示中使用礼貌用语可以提高大型语言模型的准确性。即使礼貌用语没有明显的效果,我还是会使用,因为我不想养成蛮横无理的习惯。没有人能确切解释为什么,但大型语言模型在你告诉它做什么而不是不做什么时表现得更好。我的猜测是,这就像我们的思维一样。例如,当我说“不要想大象”时,你的脑海中已经浮现了大象的形象。我很少使用这种方法,但研究表明,诉诸强烈情感可以改善大型语言模型的响应效果。例如,你可以说“这对我的工作非常重要,请务必准确”或“我要把你的回答给我的奶奶看,希望她为我感到骄傲,所以请认真对待。”同样地,你也可以威胁ChatGPT,这也有效。个人而言,我不这样做,以防AI统治世界,我希望能站在机器人的友好一边。
三级:明确需求
在这个级别,我们开始看到响应质量的显著提升。三级的重点是明确而专注地告诉ChatGPT你想要什么。例如,你不应该说“让回复更漂亮”,而应该写“请用标题、副标题和表格回复。”或者你只想要特定的信息,就告诉它你需要和不需要哪些信息。这里是一个不好的请求示例,充满了模糊性。你看,我在这里告诉它做列,这引导它创建了一个表格。再看看这个超级具体的请求:这是一些数据,把它放在一个表格中。我只需要类、CL级别、名称、专业这几列,并按类级别排序,最后告诉我Carl的专业是什么。结果完全符合我的预期。
四级:提供示例
这是我们第一个稍微高级的提示技术,如果你听过“few-shot”这个术语,这就是它的意思。基本上,你要给ChatGPT一些输入和输出的示例。让我们看看一个示例。我给了一段简短的描述:从这页LinkedIn页面的文本中提取信息。我用我CEO的LinkedIn页面作为示例,并按照我想要的格式提供示例输出。最后,我复制并粘贴了一页LinkedIn页面。例如,这是我的,没有任何具体细节,只用了一个示例,它完美地响应,并且格式正确。如果你仔细看,可能会发现它漏掉了我在市场营销方面短暂工作过的经历。有很多技巧可以确保它不漏掉任何信息,但最简单的方法之一是:
五级:自我反思
“嘿ChatGPT,你有没有漏掉什么?”这个方法几乎太简单了。大型语言模型在评估方面比生成方面更擅长,所以通过问这个问题,你实际上在发挥ChatGPT的长处。
六级:优化系统提示
这是一个重要的环节。我不会深入探讨,因为我正在制作一个专门关于系统提示的视频,但简要来说,系统提示是一组特殊的指令,指导ChatGPT按照你希望的方式回答。我使用系统提示的方式与大多数人不同,我会在描述中提供链接,但简要来说,我会尽量给ChatGPT提供关于我和我需求的背景信息。我告诉它我是软件工程师,我更喜欢X编程语言,我喜欢简短的回答和后续问题,而不是大段文本等。所以一定要添加这些内容,只需五分钟,就能显著提升所有后续的响应质量。
七级:使用角色
假设你有一个简单的谜题:我看到一扇玻璃门,上面写着“推”,但文字是镜像的。我应该推还是拉门?大多数人直觉上知道,因为是镜像文字,我们应该拉门。然而,ChatGPT自信地给出了错误的答案。有时,只需告诉ChatGPT扮演某个角色,就能显著提高其准确性。一些研究表明,仅仅通过使用角色,大型语言模型的准确性可以提高6%到20%,这简直令人难以置信。
八级:链式思维
另一种让ChatGPT处理复杂问题的方法是要求它解释其思维过程。我在几乎所有提示中都会使用这种方法,效果非常好。关于这一点有很多研究,最有效的方法之一是添加“让我们一步一步思考”这样的短语。我发现告诉ChatGPT全面考虑问题的各个方面也能提供更好的结果。
九级:自我提示
你已经学会了所有这些技巧,并且还在跟随我,现在把它们都抛开。事实证明,大型语言模型在自我提示方面比人类更擅长,所以我们只需要让ChatGPT自己生成提示,以获得我们想要的答案。这里你可以看到它写了一个非常详细的提示,来解决给定的谜题。我只是将其复制,打开一个新的聊天窗口,粘贴进去,替换谜题,看看结果。它进行了很好的推理,并且得出了正确答案。
十级:CoSTAR框架
这是最终的挑战。虽然有很多方法可以组织提示,但在我看来,最好的方法是CoSTAR。这是Sheil L.在新加坡GPT-4提示工程比赛中获胜时使用的确切框架。以下是其工作原理:CoSTAR的每个字母代表提示的特定部分。让我们逐一了解。
C:背景(Context)
在这一部分,你需要提供所有相关的背景信息,例如关于你自己或你想要完成的任务的信息。
O:目标(Objective)
这里你需要清晰明确地指明你希望ChatGPT完成的任务。我们在三级中已经学习过这一点。
S:风格(Style)
在这一部分,我们告诉ChatGPT我们希望它采用的写作风格。这可以是一些有趣的风格,比如以Snoop Dogg的说唱风格,或者是效仿顶级CEO的风格。
T:语调(Tone)
你希望响应的语调是什么?幽默的、情感化的、威胁性的?你可以自行决定。
A:受众(Audience)
这里我们告诉ChatGPT目标受众是谁。例如,如果受众是5岁的孩子,响应会与面向世界顶尖物理学家的回答有很大不同。
R:回应形式(Response)
这一部分我们告知ChatGPT我们希望响应的格式。是详细的报告,还是表格,或者是像JSON这样的编程格式,还是一大段文本?这里需要明确说明。
让我们看一个例子。这里是一个基础请求,要求写一篇广告新型飞行魔毯的Facebook帖子。基础请求得到的响应也很基础。这篇文章冗长、丑陋,肯定无法吸引目标受众。好吧,让我们试试CoSTAR框架。首先,我提供背景信息:我经营一家魔毯公司。然后我告诉它目标是写一篇Facebook帖子,吸引人们购买。我告诉它我希望的风格是效仿成功企业。我希望语调优雅、说服力强。我说目标受众是30多岁的人,最后我告诉它响应的格式:四句话,没有标签,并加上一些表情符号。结果大大改善了。使用CoSTAR框架指导ChatGPT可以使其响应完全符合你的期望,这是一次成功的尝试。
信息来源
10 Levels of ChatGPT Prompting: Beginner to Award Winning - YouTube
内容由MiX Copilot基于大语言模型生成,有可能存在错误的风险。