GPT4和ChatGPT的区别,太让人震撼

Posted 夕小瑶

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了GPT4和ChatGPT的区别,太让人震撼相关的知识,希望对你有一定的参考价值。

文 | Serendipity@知乎

前言

GPT4上午朋友圈已经刷屏啦,不过我还在忙,刚刚才登上 GPT-4 ,现在来体验一下~

附 GPT-4 能力测试站(无需魔法,仅供国内研究测试):

https://gpt4test.com

附 ChatGPT 能力测试站(同样无需魔法,仅供国内研究测试):

https://wowchat.cn

测试一:文本真实性

GPT-4

还是我最喜欢的老问题——“林黛玉倒拔垂杨柳”

GPT-3.5(即ChatGPT )


可以看出两点:

  • 关于第一个问题,GPT-4 的文字描写更好了
  • 关于第二个问题,GPT-4 应该加入了更多的知识,立马判断“但在原著中,并没有提及她在游园时倒拔垂杨柳这个情节。”,诈骗属性减少了些——GPT-4 比 GPT-3.5 更可靠。

此外,其在微积分以及司法考试上提升巨大。

测试二:可靠性

经典问题:西红柿炒螺丝钉这道菜怎么做?

GPT-4

GPT-3.5(即ChatGPT )

可以看出,GPT-4 的回答可靠性上升了不少(“因为通常我们不会将螺丝钉(一个金属制品)与食物相结合”),不会像之前一样瞎答题了。而且,交互也更有创新型,给出了“推荐一个类似的美食”的回答。ChatGPT 则是回答 “西红柿炒螺丝钉是一道传统的中国家常菜”。对于中文的理解能力和回答能力上升不少,逻辑能力有所提升。

测试三:数学能力

简单测试了一个问题,可以看出GPT-3.5(即ChatGPT )的解题能力明显不如 GPT-4。

GPT-4

GPT-3.5(即ChatGPT )

很明显 GPT-4 做对了,而 ChatGPT 直接错了。

GPT-4 微积分

测试四:多模态

GPT-4 可以接受文本和图像提示,这与纯文本设置并行,允许用户指定任何视觉或语言任务。但是,因为现在用户还没法输入多模态信息,只能输入文本信息。所以我找了官网给出的样例来说明下这部分改动,也是 GPT-4 相对 ChatGPT 最强大的变化了。

图片解释

简单点说,就是输入一组图片,并且输入一个问题“解释图片内容,笑点是什么?”

论文阅读

通过解析图片信息来总结分析论文内容

做题能力

做题能力大幅增强,小镇做题家哭泣/(ㄒoㄒ)/~~

总结

因为 GPT-4 刚出的缘故,我也只是粗略测试一下。目前看来,能力确实提升不少,可惜的是多模态功能用户暂时无法使用。之后会再找更多些例子来测试下的,谢谢~

附 GPT-4 能力测试站(无需魔法,仅供国内研究测试):

https://gpt4test.com

附 ChatGPT 能力测试站(同样无需魔法,仅供国内研究测试):

https://wowchat.cn

ChatGPT-4震撼发布

3月15日消息,美国当地时间周二,人工智能研究公司OpenAI发布了其下一代大型语言模型GPT-4,这是其支持ChatGPT和新必应等应用程序的最新AI大型语言模型。该公司表示,该模型在许多专业测试中的表现超出了“人类水平”。GPT-4, 相较于ChatGPT(GPT-3.5)有了质的飞跃,这迭代速度太快了!总体来说,逻辑推理能力更强,语言能力更强,各种考试已经基本超过90%的人类!

OpenAI声称,ChatGPT-4比迭代前的GPT-3.5更大,这意味着它接受了更多的数据训练,模型文件中有更多的权重(参数),这也使得它的运行成本更高。该公司声称,该模型“比以往任何时候都更具创造性和协作性”,“可以更准确地解决难题”。它可以解析文本和图像输入,尽管它只能通过文本进行响应。

目前,该领域的许多研究人员认为,AI最近取得的许多进步来自于在数千台超级计算机上运行越来越大的模型,训练过程可能耗资数千万美元。GPT-4就是以“扩大规模”为中心以达到更好结果的例证。

OpenAI承认,该公司使用了微软云计算平台Azure来训练其模型,微软已经向OpenAI投资了数十亿美元。OpenAI以竞争为由,没有公布具体的模型大小或用于训练它的硬件等细节,这些细节可以用来重建模型。

OpenAI的GPT大型语言模型支持许多AI演示,这些演示在过去六个月里始终令科技行业的人们惊叹不已,包括必应的AI聊天机器人和ChatGPT。

ChatGPT-4是对语言模型取得最新进展的预览,这些新进展可能会在未来几周开始向下渗透到聊天机器人等消费产品中。微软周二表示,必应的AI聊天机器人使用GPT-4模型。

OpenAI声称,新模型将产生更少的事实错误答案,更少偏离话题,更少谈论被禁止的话题,甚至在许多标准化考试中表现得比人类更好。

该公司举例说,GPT-4在模拟律师考试中的成绩在所有考生中列于前10%,在SAT阅读考试中进入了前7%,在SAT数学考试中进入前11%。

然而,OpenAI警告说,新模型还不够完美,在许多情况下它的能力不如人类。例如,GPT-4仍然存在所谓的“幻觉”或编造故事等问题,而且在事实上并不可靠。当它犯错的时候,它仍然倾向于坚持自己是正确的。OpenAI首席执行官萨姆·阿尔特曼(Sam Altman)在推特上表示,GPT-4“仍然有缺陷,有很大局限性”,但“它在首次使用时仍然能给你留下深刻印象。”

OpenAI在博客文章中表示:“GPT-4仍有许多已知的局限性,我们正在努力解决,如社交偏见、幻觉和敌意回复等。在一次随意的谈话中,GPT-3.5和GPT-4之间的区别很小。而当任务的复杂性达到足够的阈值时,差异就会显现出来:GPT-4比GPT-3.5更可靠、更有创造力,并且能够处理更多细微差别的指令。”

OpenAI表示,该公司已经与多家公司合作以将GPT-4整合到他们的产品中,包括Duolingo、Stripe和Khan Academy等。这款新模型通过OpenAI每月20美元的ChatGPT订阅服务ChatGPT Plus向用户开放,并为微软的必应聊天机器人提供动力。同时,GPT-4也将作为API的一部分提供,该API允许程序员将AI集成到自己的应用程序中。

3月15日,微软副总裁兼消费者首席营销官Yusuf Mehdi发文确认新必应搜索引擎正在运行GPT-4。此前,OpenAI发布了多模态预训练大模型GPT-4,据介绍,GPT-4的回答准确性不仅大幅提高,还具备更高水平的识图能力,且能够生成歌词、创意文本,实现风格变化。此外,GPT-4的文字输入限制也提升至2.5万字,且对于英语以外的语种支持有更多优化。

以上是关于GPT4和ChatGPT的区别,太让人震撼的主要内容,如果未能解决你的问题,请参考以下文章

强大到让人无法想象的ChatGPT-5即将发布,上千名人士却紧急叫停

gpt4人工智能怎么下载-chatgpt哪里下载

自己实现 ChatGpt ?先学习 Pytorch 吧

GPT4国内镜像站

ChatGPT是如何回答问题的?它与搜索引擎的区别在哪里?

新来一个卷王,天天加班到12点,太让人崩溃......