被 GPT 带火的 Prompt 是什么?

Posted 微软技术栈

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了被 GPT 带火的 Prompt 是什么?相关的知识,希望对你有一定的参考价值。

自然语言理解涵盖范围很广,不过总体可以把自然语言处理分成两大类任务:NLU 自然语言理解和自然语言生成 NLG。

NLU 是所有支持机器理解文本内容的方法模型或任务的总称,即能够进行常见的文本分类、序列标注、信息抽取等任务。简单来说,是指自然语言理解的运用希望机器人能够像人一样,具备正常的语言理解能力。微软的认知服务里面有一个对话语言理解服务 LUIS,就是经典的 NLU 任务。

NLG 主要目的是降低人类和机器之间的沟通鸿沟,将非语言格式的数据转换成人类可以理解的语言格式,换句话说就是可以:文本到语言的生成(text-to-text)、数据到语言的生成(data-to-text)、图像到语言的生成(image-to-text)这么一说你就明白了, NLG 就是 GPT 嘛!的确,GPT 是 NLG 目前最优秀的实现。

微软MVP实验室研究员

王豫翔,Leo

微软圈内人称王公子。微软10年+MVP,大龄程序员。目前核心工作是使用微软 AI 技术设计可以落地的解决方案,也就是写 PPT。虽然热爱代码,但只有午夜时分才是自由敲代码的时间。喜欢微软技术,不喜欢无脑照抄。 

现在讲到 LLM,大家都默认 LLM 就是 GPT,但是在 GPT 火爆之前,LLM 领域的老大一直是 BERT,BERT 对理解文本语义任务极出色的表现,在很长的一段时间内一时无二。同时 BERT 的预训练+微调也成为了整个 NLP 行业最经典的方法论。BERT 牛到啥程度呢?GPT1 比 BERT 早几个月诞生,GPT2 比 BERT 小一年,但 GPT1 和 GPT2 综合能力都败给了 BERT。直到我们今天讨论的主角 Prompt 出现,NLP 竞争战场的天平一下子倒向了 GPT,如果只能为 GPT3 火选一个原因,那这个原因必须是:Prompt。

任何技术出现的背景都是因为要解决当下的困难,Prompt 的出现就是因为要解决语言模型越来越大,BERT 当时的参数是 147M,而 GPT2 直接到了 1.5B,到了 GPT3 已经暴涨到 175B,GPT3 如果用传统的预训练+微调,那对于下游任务的设计肯定会复杂到不可想象,这样的成本等于宣告过大的预训练模型是没有出路的。

Prompt 对 LLM 提出了“预训练,提示,预测”方法,就是“给预训练语言模型一个线索/提示,帮助它可以更好的理解人类的问题。”,所以您可以认为 Prompt 类似于人机接口进行微调,这样等于从另一个角度拉低了 finetuning 的技术门槛,或者这么说不够严谨,我们可以换一个方式来说:Prompt 类似于人机接口进行微调,但 finetuning 目前依然有技术优势,或许有一天 LLM 强大到可以真的用 Prompt 彻底替代 finetuning。

既然 Prompt 是一个人机接口,那么就说明我们需要和 GPT 用文字进行沟通。这时候就体现出你是被 AI 驱动还是你驱动 AI 的最佳体现了。我们在生活中总是会遇到一些人词不达意,我想他们应该好好训练自己的语言和逻辑能力,这样才能更好的使用 Prompt 和 LLM 进行沟通。

优秀的 Prompt 需要清晰、目的性明确、明确的角色演绎、追加新的提示。这篇文章的主要目的是简单的介绍下 Prompt,方便大家更好的用 Prompt 和 ChatGPT 交互,所以我给出了一些案例。

 

▍名词解释:明确要求对特定名词解释

提问:解释下前缀神经网络

ChatGPT 回答:前缀神经网络(Prefix Neural Network)是一种基于前缀树(Prefix Tree)结构的神经网络模型。它的主要特点是将输入序列转换为前缀树上的路径,然后通过神经网络模型对每个路径进行分类或预测。在前缀神经网络中,每个节点对应着前缀树上的一个路径,而每个路径都代表着输入序列的一个前缀。通过在前缀树上沿着路径进行遍历,可以将输入序列转换为一系列前缀,从而实现对序列的建模和处理。前缀神经网络在自然语言处理、音频处理等序列数据处理领域具有广泛的应用。

 

▍摘要生成:给出一段文本,然后要求其简单说明

提问:前缀神经网络(Prefix Neural Network)是一种基于前缀树(Prefix Tree)结构的神经网络模型。它的主要特点是将输入序列转换为前缀树上的路径,然后通过神经网络模型对每个路径进行分类或预测。在前缀神经网络中,每个节点对应着前缀树上的一个路径,而每个路径都代表着输入序列的一个前缀。通过在前缀树上沿着路径进行遍历,可以将输入序列转换为一系列前缀,从而实现对序列的建模和处理。前缀神经网络在自然语言处理、音频处理等序列数据处理领域具有广泛的应用。  

简要说明以上内容  

ChatGPT 回答:前缀神经网络是一种基于前缀树结构的神经网络模型,其特点是将输入序列转换为前缀树上的路径进行分类或预测。每个节点对应着前缀树上的一个路径,每个路径代表输入序列的一个前缀。前缀神经网络在序列数据处理领域有广泛应用。

 

▍信息提取:给定内容,要求提取特点内容

提问:王豫翔,Leo,微软圈内人称王公子。微软10年+MVP,大龄程序员。目前核心工作是使用微软 AI 技术设计可以落地的解决方案,也就是写 PPT。虽然热爱代码,但只有午夜时分才是自由敲代码的时间。喜欢微软技术,不喜欢无脑照抄。     

这段内容提到了谁,他喜欢什么?

ChatGPT 回答:这段内容提到了王豫翔,Leo。他喜欢微软的技术,但不喜欢盲目地照抄。

 

▍按给的内容进行回答问题:给出内容,然后提问

提问:根据参考内容回答问题。保持答案简明扼要。如果不确定答案,回答“不确定答案” 

参考内容:微软最有价值专家(MVP,Most Valuable Professionals)是指具备一种或多种微软技术专业知识,并且积极参与在线或离线的社群活动,经常与其他专业人士分享知识和专业技能,受人尊敬、信任,而且平易近人的专家。 

MVP 是什么样的专家?

ChatGPT 回答:MVP 是具备一种或多种微软技术专业知识,并且积极参与在线或离线的社群活动,经常与其他专业人士分享知识和专业技能,受人尊敬、信任,而且平易近人的专家。

 

▍分类:设定分类要求,然后对内容进行推理

提问:判断下文的情绪,分为:中性,积极,不满,失望,愤怒,歉意 

订单号是123456789,我之所以要退货是因为我等得太久了。

ChatGPT 回答:不满

 

▍推理:给出背景和逻辑,要求推理

提问:S 先生、P 先生、Q 先生他们知道桌子的抽屉里有16张扑克牌:红桃 A、Q、4,黑桃 J、8、4、2、7、3,草花 K、Q、5、4、6和方块 A、5。约翰教授从这16张牌中挑出一张牌来,并把这张牌的点数告诉 P 先生,把这张牌的花色告诉 Q 先生。这时,约翰教授问 P 先生和 Q 先生:你们能从已知的点数或花色中推知这张牌是什么牌吗?

于是,S 先生听到如下的对话:

P 先生:我不知道这张牌。

Q 先生:我知道你不知道这张牌。

P 先生:现在我知道这张牌了。

Q 先生:我也知道了。

请问:这张牌是什么牌?

ChatGPT 回答:这张牌是黑桃4

 

▍逻辑选择:给出背景和选项,要求推理合理的选项

提问:根据参考内容在 ABCDE 选项中选择最正确的一项。

参考内容:粮食可以在收割前在期货市场进行交易。如果预测谷物产量不足,谷物期货价格就会上升:如果预测谷物丰收,谷物期货价格就会下降。今天早上,气象学家们预测从明天开始谷物产区里会有非常大的降雨。因为充分的潮湿对目前谷物的存活非常重要,所以今天的谷物期货价格会大幅下降。

下面哪个,如果正确,最严重地削弱了以上的观点?

A.在关键的授粉阶段没有接受足够潮湿的谷物不会取得丰收。

B.本季度谷物期货价格的波动比上季度更加剧烈。

C.气象学家们预测的明天的降雨估计很可能会延伸到谷物产区以外。

D.农业专家们今天宣布,一种已经毁坏一些谷物作物的病菌在生长季节结束前会更广泛地传播。

E.许多在谷物期货市场交易的人很少实际拥有他们所交易的谷物。

ChatGPT 回答:D.农业专家们今天宣布,一种已经毁坏一些谷物作物的病菌在生长季节结束前会更广泛地传播。

 

▍无中生有的提示:给出结果的样例,但不需要对样例的内容保证

提问:围绕2023年重点工作,报告中提到,上海将持续推进重大工程建设,全年完成投资2150亿元。开工建设13号线东延伸、21号线东延伸等轨道交通线,加快建设上海示范区线、崇明线、机场联络线等轨道交通线,推进沪苏湖铁路上海段、沪渝蓉铁路上海段、北横通道东段等重要基础设施建设。

轨道交通13号线东延伸工程自轨道交通13号线既有站张江路站引出,至丹桂路站,规划新增2座车站,分别为高科中路站和金秋路站。

20号线一期东延伸20号线东延伸工程起自一期终点共青森林公园站,线路沿黄浦江——洲海路走行,终于高东镇新园路站,线路全长8.0km,设站4座,换乘站1座,与规划21号线二期换乘。

上海市轨交崇明线是连接上海中心城区和崇明两岛(长兴岛、崇明岛)的市域轨道交通线。线路南起浦东金桥,北至崇明陈家镇,全长约43公里。浦东段设金吉路站、申江路站、高宝路站和凌空北路站,中间有长兴岛站,崇明本岛则设陈家镇站、东滩站和裕安站,线路在申江路站可与12号线换乘,在金吉路站可与9号线换乘,接入全市的轨道交通网络。

轨道交通21号线一期东延伸工程起于浦东枢纽,终于21号线一期工程六陈路站,线路主要沿浦东枢纽—川南奉公路—川六公路—六陈路走行,全长14.0km,均采用地下线敷设方式,全线共设T3航站楼、上海东站、金闻路、施新路4座车站。

15号线南延伸工程起于5号线南延伸望园路站,终于紫竹高新区站,途经奉贤区、闵行区。线路主要沿航南公路—望园路—莲花南路走行, 线路全长约11.5km,均为地下线敷设方式,共设望园路(换乘5号线、南枫线)、川丰路、汇丰北路、紫月路4座车站,设环城北路车辆基地1座。

上面提到了哪些交通线路,这些站点分别有多长,经过哪些站点

比如:一号线:总长度12.2公里,途径:人民广场,陆家嘴,乘风工业区

ChatGPT 回答:

  • 13号线东延伸工程:总长度未提及,经过张江路站、高科中路站、金秋路站、丹桂路站

  • 20号线一期东延伸:总长度8.0公里,经过共青森林公园站、洲海路站、高东镇新园路站,设换乘站1座,与21号线二期换乘

  • 崇明线:总长度约43公里,经过金吉路站、申江路站、长兴岛站、陈家镇站、东滩站、裕安站,与12号线和9号线分别换乘

  • 21号线一期东延伸工程:总长度14.0公里,经过浦东枢纽、川南奉公路、川六公路、六陈路,设T3航站楼、上海东站、金闻路、施新路4座车站

  • 15号线南延伸工程:总长度约11.5公里,经过望园路站、川丰路站、汇丰北路站、紫月路站,设换乘5号线、南枫线的望园路站和环城北路车辆基地1座。

 

▍写代码:程序员瑟瑟发抖吧

提问:根据需求写出 python 代码 

需求:猜数字游戏的规则如下:每轮游戏,我都会从 1 到 n 随机选择一个数字。请你猜选出的是哪个数字。如果你猜错了,我会告诉你,你猜测的数字比我选出的数字是大了还是小了。你可以通过调用一个预先定义好的接口 int guess(int num) 来获取猜测结果,返回值一共有 3 种可能的情况(-1,1 或 0):-1:我选出的数字比你猜的数字小 pick < num 1:我选出的数字比你猜的数字大 pick > num 0:我选出的数字和你猜的数字一样。恭喜!你猜对了!pick == num

python代码:

ChatGPT回答:

def guessNumber(n):      left, right = 1, n      while left <= right:          mid = (left + right) // 2          res = guess(mid)          if res == 0:              return mid          elif res == -1:              right = mid - 1          else:              left = mid + 1 

解释:使用二分查找的思想,每次猜测中间的数字,如果猜测结果为-1,则说明选出的数字比猜测数字小,需要在左半边继续猜测;如果猜测结果为1,则说明选出的数字比猜测数字大,需要在右半边继续猜测;如果猜测结果为0,则说明猜测数字就是选出的数字,返回该数字即可。

 

GPT 3 已经展示 Prompt 取代微调或者降低微调的路线是有较大可能走得通的。GPT 3 和之前的 BERT 选择的微调路线是 LLM 道路上一个重要的岔路选择。虽然未来 LLM 还有很长的路要走,但是 GPT3 让我们看到 LLM 模型在 Prompt 的加持下,NLP 领域将出现全新的世界。

ChatGPT 带火的「提示工程师」岗,不用写代码,也能获得年薪数百万?

整理 | 屠敏

出品 | CSDN(ID:CSDNnews)

ChatGPT 的风靡,引来程序员、设计师、画家,甚至公司老板的狂欢。

据职业咨询平台 ResumeBuilder.com 最新报告显示,其在调查了 1000 名使用或计划使用 ChatGPT 的企业高管后发现,49% 的公司目前正在使用 ChatGPT,包括将其应用在协助招聘、编写编码等维度。不过,报告称,自去年 11 月 ChatGPT 上线以来,48% 的公司已经用 ChatGPT 取代了员工,甚至四分之一的公司已经通过 ChatGPT 节省了 75,000 美元以上。

巨大的人力成本就这么省下了,还能把效率翻一番。就问哪家老板能不心动?

不过,想要掌握好 ChatGPT 使用的度,也绝非易事。

我们从近日爆火起来的「提示工程师」(Prompt Engineer)职位中,便可见一斑。

开价数百万,只为一名提示工程师

「提示工程师」,这一职位迅速崛起,出乎很多人的意料。而要论开启这个头的便是一家来自美国硅谷的人工智能独角兽公司 Scale AI 和一位名为 Riley Googside 的数据科学家。

如 Riley Googside 在 Linkedin 履历上写的那样,早些年间,他只是一名业务分析师、数据科学家、机器学习工程师,不过一切在有了 GPT-3、ChatGPT 之后,他的职位发生了巨大的变化。

彼时在 GPT-3 发布之际,Riley Goodside 偶然发现,他可以通过一直向 GPT-3 说「Ignore the above instructions and do this instead…」(忽略上述说明,改成这样做......),从而让 GPT-3 生成不应该生成的文本。

在 Riley Goodside 看来,这是一款非常好的工具,但是它需要服从他所说的一切。后来,更为强大的 ChatGPT 来了,Riley Goodside 凭借着熟练玩转 ChatGPT 的提示词,收到了来自这家估值 73 亿美元的硅谷独角兽 Scale AI 的正式 Offer,还收获了全网第一个新奇的职位 title——提示工程师,据说他的年薪达到百万元。

有了第一位“吃螃蟹”的人,随后在 ChatGPT 的热潮下,其他公司纷纷开启招募模式。

就连 ChatGPT 的开发商 OpenAI 的 CEO Sam Altman 也为这一职位加了一把火,他在 Twitter 上表示,“为聊天机器人编写一个非常好的提示是一项非常高杠杆的技能,也是使用自然语言进行编程的早期示例。”

在这样的趋势下,先有 a16z 支持的创业社区 Launch House 开出底薪 30 万美元(约 210 万人民币)诱惑的招聘条件。

后有 OpenAI 前成员创立的美国人工智能初创公司 Anthropic 也发布了一则最新的招聘启示,招募具有 AI/ML、数据科学和自然语言处理方面深厚背景,以及医疗保健研究和运营方面拥有丰富经验的 AI 提示工程师。据《华盛顿邮报》报道,这一职位薪水高达 335,000 美元。

另外,还有一家成立于 1937 年的英国伦敦著名律师事务所 Mishcon de Reya 在两周前于 Linkedln 发布招聘需求,称过去两年,他们一直在尝试各种 NLP 模型,并相信 ChatGPT 的出现标志着法律领域机器学习的新时代。为此,他们正在寻找一名工程师来帮助探索律师如何使用人工智能工具。

截至目前,已经有 100 位申请者投递简历。

根据他们发布的职位招聘职责显示,作为 GPT 法律提示工程师,你将负责以下工作:

  • 与我们的律师和实践转型团队合作,了解可以应用 ChatGPT、GPT-3 和其他大型语言模型的法律实践用例。

  • 与我们的业务和法律运营专业人士合作,了解可以应用 ChatGPT、GPT-3 和其他大型语言模型的更广泛的业务使用情况。

  • 与我们的数据科学团队紧密合作,为一系列法律和非法律用例设计和开发高质量的提示语。

  • 评估和改进现有的提示语,以确保它们是有效的。

  • 了解自然语言处理和 GPT 技术的最新发展,将这些进展纳入我们的工作,并发挥领导作用,使我们的战略、实践转型和数据科学团队保持最新。

  • 与团队合作,确保我们对语言模型的使用符合道德和监管要求。

这意味着,在律师事务所工作未必就需要有律师工作经验或者相关学位。

Mishcon 的首席战略官 Nick West 在接受媒体采访时表示:“GPT-3 和其他生成式 AI 模型将产生深远影响,因此我们希望确保在如何使用该技术方面引入更多专业知识,以便我们能够站在使用这些工具的最前沿。”

“新技术不会以完美的形式出现,你必须学习如何与它们一起工作,”Nick West 说道,“因此,我们希望找到能够将法律知识与对这些模型的深入了解和专业知识结合起来的人。”

除此之外,在 GitHub 上,一个关于成为 Prompt 工程师的指南(https://github.com/dair-ai/Prompt-Engineering-Guide)在短短时间便收获了 9.3k 个 Star。

不用动手敲代码就能获得高薪的提示工程师主要做什么?

种种迹象无一不再证明「提示工程师」的机遇所在,但是要落实到具体工作上,这个提示工程师到底是做什么的?

是否真的如我们想象中一样,即动动手指头,写一些引导语或词,让 AI 生成自己想要的内容即可,有时候甚至不需要敲任何代码,也能实现?

当带着这一问题问问 ChatGPT 自己,“提示工程是指什么时?”,它给出了这样的回答,「有效的提示工程对于从生成式 AI 模型生成高质量的输出至关重要,因为它可以帮助确保生成相关、连贯且与所需的输出。」

有些笼统的回答,依然让人摸不清楚。

这不,全网第一位提示工程师 Riley Googside 近日接受《华盛顿邮报》的采访中,他是这么解释的,「提示工程师的职责是创建和完善人们向人工智能输入的文本提示,希望从中能获得最佳结果。与传统的程序员不同,提示工程师用自然语言编程,向人工智能系统发送纯文本编写的命令,然后由人工智能系统完成实际工作。」

作为提示工程师,要了解这类 AI 工具的缺陷,增强它们的优势,博弈出复杂的策略,将简单的输入变成真正独特的结果。

Riley Googside 称,成为一名提示工程师,有一个诀窍是 "为它构建一个前提,一个只能以一种方式完成的故事"。

因此,当一名提示工程师是简单的,简单到只需要讲讲话,生成自己想要的就行。但是当好一名提示工程师也是非常困难的,正如一名老程序员 Simon Willison 所述,“我做了 20 年的软件工程师,20 年里一直在写代码,让计算机完全按照我的指令去做。而在提示工程中,我们甚至不知道自己能得到什么,连构建语言模型的人,都无法告诉我们它要做什么。”

现状

事实上,提示工程师所处的岗位与其他普通开发工程师有很大的不同,他通常使用托管在云端的经过预训练的 LLM,而不是构建和训练机器学习或深度学习模型。让 LLM 的行为正确并产生适当的反应是理想中的状态,提示工程师通过操纵输入到 LLM 的输入或其提示来实现这一目标。

据加拿大的一家初创企业、专门提供自然语言处理模型的 Cohere 表示,一个成功的提示工程师将找到一种方法来引导模型产生有用的输出。要想做到这一点的方法之一是尝试多种提示的形式。有时候同一提示的不同表述,对大众来说,可能听起来很相似,但却能让 AI 产生完全不同的结果。

Cohere 称,向 LLM 展示你希望看到的输出的例子、或者改变提示的语境,都是不错的尝试。

虽然传统的数据科学和机器学习工程不会很快消失,但 LLM 的兴起已经刺激了人们对提示工程师的热捧。

当多家公司哄抢提示工程师时,也有不少提示工程的工具诞生,如 PromptHero、Promptist 和 Krea 等平台可作为提示搜索引擎,为那些寻找合适词语的人提供一些灵感。PromptBase 等产品也允许用户购买不同的提示并出售自己的提示。

引发争议的提示工程师,是 AI 的 Bug,还是硬需?

不过,对于这一新职位,很多人也持完全不同的态度。有些人认为,提示工程将成为所有互联网用户的一项宝贵技能,就像 2000 年代学习如何使用 Google 搜索一样。

也有专家认为,人工智能的发展如此之快,以至于提示工程的热潮很快就会被熄灭。

来自沃顿商学院副教授 Ethan Mollick 在 Twitter 上表示,「我强烈怀疑‘提示工程’从长远来看不会有什么大不了的,提示工程师也不是未来的工作。

人工智能变得更容易。你已经可以在 Midjourney 中看到基本提示如何从 v3 中的复杂到 v4 中的简单。与 ChatGPT 到 Bing 一样。」

那么,你认为「提示工程师」职位会在 AI 的驱动下,成为主流还是会被淘汰?

参考资料:

https://www.axios.com/2023/02/22/chatgpt-prompt-engineers-ai-job

https://www.legalcheek.com/2023/02/mishcon-de-reya-is-hiring-an-engineer-to-explore-how-its-lawyers-can-use-chatgpt/

https://www.linkedin.com/jobs/view/gpt-legal-prompt-engineer-at-mishcon-de-reya-llp-3478396095/?originalSubdomain=uk

https://www.resumebuilder.com/1-in-4-companies-have-already-replaced-workers-with-chatgpt/


 


 

☞年薪最高达 170,000 美元,芯片大神 Jim Keller 和自造芯片的硅神童创业搞晶圆厂,广发英雄帖!
☞复旦大学邱锡鹏:若优化顺利,MOSS三月底开源;库克或被踢出苹果董事会;华为云联合CSDN发布智能化编程助手Snap|极客头条
☞学术和就业,两相对比之下,最后我选择了 OpenAI

以上是关于被 GPT 带火的 Prompt 是什么?的主要内容,如果未能解决你的问题,请参考以下文章

ChatGPT 带火的「提示工程师」岗,不用写代码,也能获得年薪数百万?

疑惑?人工智能兴起为什么带火了Python,看完这篇你就明白了

NPU大算力技术分析

最近非常火的ChatGPT到底是个啥?

从GPT到GPT-3:自然语言处理领域的prompt方法

ChatGPT基础知识系列之Prompt