ChatGPT进阶:提示工程入门
C1 认识ChatGPT
Chat Generative Pre-trained Transformer
Generative生成式:通过计算大量数据中的概率分布,从分布中生成新的数据
Pre-trained预训练:在训练特定任务的模型之前,先在大量的数据上进行训练,以学习一些基础的、通用的特征或模式
Transformer变换器:一种深度学习模型,它使用自注意力机制来处理序列数据
语言模型可以理解为一种预测下一个token的统计模型
大语言模型的“涌现”能力:由低层次的简单交互产生的高层次的复杂行为,“量变引起质变”
- 例如蚁群作为整体,彼此相互作用时产生的复杂行为
“幻觉”现象:一本正经地胡说八道
C2 人机共舞的艺术:提示工程简介
两个概念
提示prompt:用户向人工智能提供的输入信息,这些信息通常包含关键词、问题或指令,旨在引导人工智能生成与用户期望相符的回应。
提示工程Prompt Engineering:通过精心设计、优化输入信息(提示),来引导人工智能生成高质量、准确、有针对性的回应。
Let’s think step by step
- 仅仅在GPT-3发送的指令前加这句话,便将GPT-3在一个数学题库上的正确率从17.7%提升到了78.7%
与人工智能合作
建立合作关系
对齐:确保智能体的目标、行为和决策与人类价值观、意图和期望保持一致
拆解、标准化、流程化地用AI改造工作
复杂问题简单化
简单问题标准化
标准问题流程化
C3 使用ChatGPT的基础技巧
使用文本分隔符分割指令和上下文
- 上下文可能是非常长的信息,使用分隔符###或“”可以让ChatGPT抓住重点
使用标记语言标记输入格式
使用“**”加粗文本
这种方法有效是因为我们使用的其实是标记语言:Markdown语法,是一种“指示标签”
列项
有序列表使用 “1 2 3”
无序列表使用 “-”
量化要求
- 将任务和要求转化为可度量和可比较的指标,最好是明确的数字
不要说“不要做什么”,要说“要做什么”
利用ChatGPT“接龙”的特性引导下一步动作
多轮对话
保持与ChatGPT的对话主题的连贯性
在不同的ChatGPT对话中讨论不同的事情
使用ChatGPT插件
- 安装插件就像是给这个机器人提供了一个工具箱,这个工具箱里面有各种工具,可以用来获取实时信息,执行具体操作,等等
C4 使用ChatGPT完成自然语言处理任务
什么是自然语言处理任务
研究如何让计算机理解、生成和处理人类语言
了解自然语言处理任务就等于阅读了这套语言系统的功能说明书
文本摘要
从较长的文本中提取关键信息,生成简短的摘要
用于会议记录,新闻,学术论文,电子邮件
读论文,做会议记录,分析会议的关键要素,总结会议要素,
文本纠错
- 自动检测和纠正文本中的拼写错误
情感分析
分析文本中的情感倾向
应用于金融市场分析,人力资源管理,品牌声誉管理,客户服务改进
命名实体识别
从文本中识别出特定类别的实体
使用实体识别,我们可以快速、大量地提取出真正关键的信息,免去阅读大量文本的困扰。
机器翻译
- 中译英
关键词提取,从文本中识别主题
- 用于学术研究,内容创作,市场分析,社交媒体分析
问题回答
用ChatGPT学习知识
如何减少ChatGPT的“幻觉”
希望ChatGPT提供理论依据时
- 提示结尾加一句:“提到的理论需要有权威来源,是学术界的共识”
希望ChatGPT引用论文时
- 添加“引用的论文可以在GoogleScholar上找到”
生成式任务
让计算机根据给定的上下文生成具有一定意义和连贯性的文本
使用背景、ChatGPT的角色、目标和关键结果这四个要素来设计提示
用于写深度评论文章,选题,深入挖掘选题论点,选择适合的写作风格,写出文章内容
C5 使用BROKE框架设计ChatGPT提示
ChatGPT与使用者的关系就像领导与员工一样
【目标明确,沟通顺畅,反馈与调整,培训与提升】
- 使用者需要对ChatGPT进行引导和管理,以获得更高效、更准确的工作成果
BROKE框架
【B for Background, R for Role, O for Objectives, K for KeyResults, E for Evolve】
B 阐述背景:说明背景,为ChatGPT提供充足的信息
要弄清楚问题背景到底是什么,也很费精力,如果不想太费精力,这部分也可以交给ChatGPT
给ChatGPT尽可能多的原始信息
用符合直觉与经验的方式设计问题背景
(1) 任务的宏观背景
(2) 任务的微观场景
(3) 相关知识或信息
(4) 提问者的角色和立场
R 定义角色:给ChatGPT定义角色
有助于建立一个稳定且具象化的形象,并告诉ChatGPT角色的职责所在,让ChatGPT与用户之间的互动更加顺畅
设计角色的框架
明确角色定位
界定角色功能
设定互动规则
O 定义目标:希望ChatGPT能够实现什么目标
- 清晰明确,目标导向,适度的范围和难度,保持目标简洁
K 定义关键结果:我们想要什么结果
- 同上
E 试验并调整,改进:改进提示,改进答案或重新生成
改进背景、角色、目标与增加/修改关键结果
Regenerate
C6 使用ChatGPT的进阶技巧
分而治之 Divide and Conquer
分解 Divide:将原问题分解为若干个较小的、相互独立的子问题
解决 Conquer:如果子问题比较难,可以将子问题分解为更简单的问题,直到可以轻松解决
合并 Combine:将子问题的解组合成原问题的解
上下文学习 In-Context Learning
- 参数量较大的大语言模型可以在不改变模型参数的情况下,只靠输入的内容就可以学到新的规律
链式思维 Chain-of-Thought
模型将一个复杂的问题分解成一条思考路径,然后依次解决每个步骤,最终得出问题的答案
咒语1:让我们一步一步思考 Let’s think step by step
咒语2:让我们逐步来解决这个问题,以确保我们得到正确的答案 Let’s work this out in a step by step way to be sure we have the right answer
自一致性 Self-Consistency
- 使用链式思维提示来引导大语言模型生成推理过程
- 多次重复生成答案,让ChatGPT从不同的思考路径得出结论
- 通过“投票”选择最可靠的答案
知识生成提示
在问ChatGPT问题之前,可以先要求它生成一些问题相关的知识,从而获得更好的回答表现→论文《Generated knowledge prompting for commonsense reasoning》
生成知识
整合知识和问题
C7 如何用ChatGPT进行创新
心理学家评价创造力
发散思维:对某一问题产生不寻常想法的能力
聚合思维:整合不同来源的信息,从而解决问题的能力
组合式创新
GPT-4模型与搜索引擎
ChatGPT和编程助手
ChatGPT调用机器人
ChatGPT+领域知识
+心理学,设计更容易被填写的问卷
+逻辑学,用谓词逻辑提取文字中的命题
+管理学+心理学+社会学,用多领域理论优化管理策略
管理学、社会学与心理学是研究组织行为和个体行为的三大重要学科,非常适合在管理中发挥作用
借助ChatGPT使用管理学、社会学与心理学理论和知识来优化管理策略,并解决实际的管理问题
分析管理会议维度,得出团队管理方向
分析小组员工流失的原因
ChatGPT+工具
+Mermaid,用ChatGPT画时序图
ChatGPT+其他AI工具
+MusicLM生成音乐
+runawayGEN生成视频
+Midjourney生成图像
第一步:了解作图流程
- 要获得可控且高质量的作图结果,我们需要一套固定流程。即便我们不是设计专业,没有绘图经验,但我们可以问问ChatGPT
第二步:解决“文学作品的复杂性”问题,确定作图流程
Midjourney官方提供了质量非常高的教程,包括:“Cla-rinet’s Troubleshooting Midjourney TextPrompts”
(1) 理解文本内容,把握主题、氛围和故事情节
(2) 根据文本内容,选择合适的艺术风格和技术
(3) 设计构图和视觉元素:规划插图的构图和视觉元素
(4) 根据分析,填写模板中的前三个元素
(5) 写出Midjourney prompt
第三步:解决“有截止日期的知识”问题,帮助ChatGPT理解Midjourney prompt
- 贴教程或“上下文学习法”
第四步:根据分析,组装各个部分并写出提示
用ChatGPT做数据分析
C8 基于ChatGPT进行开发
ChatGPT API:利用ChatGPT制作自己的应用
LangChain:大语言模型开发框架
C9 ChatGPT的替代品们
Claude:ChatGPT的孪生姐妹
微软投资的OpenAI
谷歌投资的Anthropic
PaLM2:来自谷歌的实力对手
- PaLM2可以整合谷歌全家桶办公软件
HuggingChat:“抱抱脸”聊天机器人
ChatGLM:来自清华大学的语言模型
- 由清华大学推出,是一个具有问答、多轮对话和代码生成功能的中英双语模型,并针对中文进行了优化
Alpaca&Vicuna:语言模型之羊驼家族
- 其基础是Meta的模型,目前主要是为了学术研究而开发的,但不允许商用
其他大语言模型
文心一言:百度的聊天机器人
讯飞星火:科大讯飞的聊天机器人
通义千问:阿里巴巴的聊天机器人
总结
这篇读书笔记系统地介绍了ChatGPT的基本原理、提示工程的核心理念及其实践方法,从入门技巧到进阶策略, 涵盖了如何通过结构化提示(如BROKE框架)、链式思维和自一致性等方式提升模型输出的质量与可靠性。 同时,书中还探讨了ChatGPT在自然语言处理、创新应用、数据分析和跨学科结合等领域的潜力,并对各类替代品和开发工具进行了比较。 整体来看,这本书既是对提示工程的实用指南,也是对人机协作未来可能性的启发,强调了通过合理设计提示,可以极大拓展ChatGPT的价值与应用场景。