ChatGPT 是什么?干嘛用的?

Posted 技术能量站

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了ChatGPT 是什么?干嘛用的?相关的知识,希望对你有一定的参考价值。

最近,一款人工智能聊天应用ChatGPT引起了马斯克的关注,他表达了对ChatGPT的肯定,认为“我们离强大到危险的AI不远了”、“厉害的吓人”。这款应用一经推出,立刻引起了大家的兴趣,用户不仅抛出无厘头问题,还有比较专业性的问题,ChatGPT都能给出准确的回答。

什么是ChatGPT?

ChatGPT是OpenAI开发的一种大型预训练语言模型,基于Transformer架构,可以用于生成类似人类的文本响应,可用于创建能与用户进行对话的聊天机器人,可用于客户服务,提供有用的信息或只是为了好玩。

ChatGPT使用方法和注意事项:

  • 支持中文和英文,都可以问
  • 它不是Siri这种机器人,他是一种生产力的工具
  • 要把它当作真实的人来对话,可以让它改进
  • 支持上下文多轮对话,放心大胆的问
  • 每次回答的字数有应该有限制,可以使用“继续问”等来追问,它会继续写
  • AI届已经进入新的范式,学会提问题会越来越重要

ChatGPT工作原理

官网介绍可以看到,ChatGPT与InstructGPT是同源的模型。那么接下来我们来看下什么是InstructGPT。从字面上来看,顾名思义,它就是指令式的GPT,“which is trained to follow an instruction in a prompt and provide a detailed response”。接下来我们来看下InstructGPT论文
从该图可以看出,InstructGPT是基于GPT-3模型训练出来的,具体步骤如下:

  1. 从GPT-3的输入语句数据集中采样部分输入,基于这些输入,采用人工标注完成希望得到输出结果与行为,然后利用这些标注数据进行GPT-3有监督的训练。该模型即作为指令式GPT的冷启动模型。
  2. 在采样的输入语句中,进行前向推理获得多个模型输出结果,通过人工标注进行这些输出结果的排序打标。最终这些标注数据用来训练reward反馈模型。
  3. 采样新的输入语句,policy策略网络生成输出结果,然后通过reward反馈模型计算反馈,该反馈回过头来作用于policy策略网络。以此反复,这里就是标准的reinforcement learning强化学习的训练框架了。

所以总结起来ChatGPT(对话GPT)其实就是InstructGPT(指令式GPT)的同源模型,然后指令式GPT就是基于GPT-3,先通过人工标注方式训练出强化学习的冷启动模型与reward反馈模型,最后通过强化学习的方式学习出对话友好型的ChatGPT模型。如下是论文中相应对话友好型的定量结果(其中PPO-ptx曲线就是InstructGPT模型),可以看到在回答友好型上InstructGPT是远超原始GPT的:

ChatGPT怎么用?

比如说就有网友被误开了一份停车罚款,又不会写解释信,于是直接“请来”ChatGPT帮忙。

你可以在文本框中,输入“请帮我写一封停车罚款解释信”

然后,你就可以得到这样的回复:


尊敬的主管:

您好!

我是XXX,最近收到了一张停车罚款罚单,罚款金额为200元。我想提出申诉,因为我并不是违反了停车规定。

事情是这样子的,上周我去市区做生意,因为停车位不够,我只好在停车场外停车,但是当时的情况非常紧张,我不得不等待一段时间才能找到合适的停车位,而在此期间,停车管理人员就给我发了一张罚单,罚款200元。

我相信您一定能够理解我当时处于特殊情况,并未故意违反规定,因此,我希望您能够考虑我的申诉,允许我免交这笔罚款,我万分感谢您。

谢谢!

此致

敬礼

XXX


ChatGPT玩法大盘点

ChatGPT是一款实用性功能强大的聊天机器人,可以实现简单的语言翻译,以及翻译润色等功能,它还可以创建Excel表格,只需输入所需的表格尺寸即可快速生成。

你只需要输入如下指令:我想让你扮演一个基于文本的Excel。您将只回复我基于文本的10行Excel表,其中行号和单元格字母作为列(A到L)。第一列标题应为空,以引用行号。我将告诉您在单元格中写入什么内容,您将只以文本形式回复excel表的结果,而不会回复其他内容。不要写解释。我会给你们写公式,你们执行公式你们只能用文字回复Excel 表格的结果。首先,回答我一个空白表。

然后,你就可以获得一个表格了。

ChatGPT甚至能被当作javascript控制台或者linux终端。你还可以让它充当免费的旅游指南,想去哪里玩直接问ChatGPT,有什么要求也可以尽管提。

ChatGPT体验方法

Chat GPT体验还是很不错的。因为OpenAI的服务器在国外,国内在使用网站时又有诸多的不便,包括网络连接和语言。目前也在网上有很多的教程教给大家利用俄罗斯或者土耳其等中转方法连接官网,在此不再赘述。

  • ChatGPT地址:https://chat.openai.com/(需要国外手机号注册)
  • ChatGPT中文小程序体验地址:点击打开( 无需注册 )

国内自己懒得折腾的小伙伴们,也可以用这个网站来抢先体验一下,界面比较简洁方便,直连网速也不慢,基本可以满足大家的使用需求。

  • 国内网站:https://gpt4.cc

笔者给大家介绍些大神建设好的比较方便的方法来体验一下。

1. VSCode 插件

熟悉编程的人几乎都用过VSCode这个万能神器,丰富的插件和几乎支持任何语言的编辑器让人爱不释手,最近几天国内某编程大牛开发了一个ChatGPT的插件供大家使用,12月6号刚刚上线,到现在已经有6W+的下载量,笔者体验一番,直接惊呼其强大:

直接对于ChatGPT提问:相当于连接到官方的Web网页进行交互式访问,省去连接苦恼。

优化、测试和解释这段代码:可以帮助程序员的快速发现代码的问题或者添加注释理解代码等。

并且作者还在和网友互动回复中说,自己写ChatGPT的插件也是通过和对方讨论了好多波才写出来的。

笔者也对ChatGPT的代码能力进行了测试,我问他帮我实现一个轮播图的html连带CSS和JS的代码,也能轻松写出像模像样的来,但是经过测试并不能顺利执行,还需要进行下修改和优化才可以运行,不过相比于手写可以说方便了80%之多。

写在最后

人工智能的发展日新月异,最新的OpenAI也着实让人眼前一亮,就连笔者在构建这篇文章时也着实获得了不小的收获。想必在网站另一端的你也按捺不住想尝试的意愿,但是还不能100%代替某些人工,当然在完全替代的那一天我们的社会光景又是什么样的呢?

笔者在构思这篇文章也采取了偷懒照搬的方式,你们阅读时看出来了吗?

相关材料

  1. 研究性材料:https://arxiv.org/pdf/2203.02155.pdf
  2. 研究报告:https://arxiv.org/abs/2203.02155
  3. https://new.qq.com/rain/a/20221214A06TCN00

以上是关于ChatGPT 是什么?干嘛用的?的主要内容,如果未能解决你的问题,请参考以下文章

MYSQL 是啥干嘛用的?

android sdk是啥意思?干嘛用的

SNMP UCD-SNMP-MIB是干嘛用的呢?

VPS是干嘛用的?有哪些知名牌子?与云服务器有什么区别?

VPS是干嘛用的?有哪些知名牌子?与云服务器有什么区别?

jenkins干嘛用的