生成式 AI:百度“文心一言”对标 ChatGPT?什么技术趋势促使 ChatGPT 火爆全网?

Posted 白鹿第一帅

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了生成式 AI:百度“文心一言”对标 ChatGPT?什么技术趋势促使 ChatGPT 火爆全网?相关的知识,希望对你有一定的参考价值。

文章目录


前言

2023 年 3 月 27 日,百度文心一言正式发布,李彦宏开场即言,百度是首个做出可以对标 ChatGPT 的产品的大厂,作为“国产版 ChatGPT”、百度全新一代知识增强大语言模型,文心大模型家族的新成员,能够与人对话互动,回答问题,协助创作,高效便捷地帮助人们获取信息、知识和灵感。在 2022 年 11 月 30 日 美国 OpenAI 研发的聊天机器人程序 ChatGPT 一经发布,就瞬间爆火全网,作为人工智能技术驱动的自然语言处理工具,它能够通过理解和学习人类的语言来进行对话,还能根据聊天的上下文进行互动,“真正”像人类一样来聊天交流,随着不同版本的迭代和更新,我们可以看到众多使用者甚至能在其帮助下完成撰写邮件、视频脚本、文案、翻译、代码,写论文等任务。百度文心一言能否与 ChatGPT “掰掰手腕”,在二者的背后又是什么技术趋势促使其火爆全网呢?本文我们一探究竟。


一、生成式 AI 的发展和现状

1.1、什么是生成式 AI?

生成式 AI(Generative AI) 是指计算机通过机器学习从现有数据中学习一个对象(物品、产品或任务)的要素,进而生成一个全新的、原创的、真实的、与原来内容相似的对象。作为重要的战略技术,在 2025 年 10+% 的数据将由 AI 创造

1.2、生成式 AI 的发展趋势

根据 Gartner《2021 年预测:人工智能对人类和社会的影响》 中预测:

  • 至 2023 年将有 20% 的内容被生成式 AI 所创建。
  • 至 2025 年,生成式 AI 产生的数据将占有所有数据的 10%,而今天这个比例不到 1%。

对于生成式 AI 的发展趋势预测,具体如下图所示:

1.3、AI 生成内容的业务场景和分类

在不含 AI 生成代码的情况下,AI 生成内容的业务场景和分类已经囊括众多的技术领域,AIGC 技术场景具体如下图所示:

二、生成式 AI 从分析领域到创作领域

2.1、 降低内容创作门槛,增加 UGC 用户群体

  • AIGC 能够代替人工完成声音录制、图像渲染等工作,使更多人员能够参与到高价值的内容创作流程中。预计这一效果在 2B 结构化内容生成的领域非常明显,个别场景会出现 2C 服务。跨模态生成成为未来重点。

2.2、提升创作及反馈效率,铺垫线上实时互动

  • AI 同样提升了内容的反馈生成速度,对于实时交互内容有重大意义,具有将线下和真人的快速交互迁移到线上的可能,也即令 AI 承担真人的社交、创作、协作功能,可能会出现新的潜在场景(如社交类和探索类游戏等)。我们在 Game AI 板块所提及的 AIbot 实时玩家教学在一定程度上提供了一种互动的新形式,交互教育/交互探索游戏虚拟陪伴场景值得期待。
  • 目前来看,内容消费者变得更容易将现实情感需求投射在虚拟世界中,预计会产生许多深入实时的互动需求,市场规模可观。

2.3、基于海量数据激发创意认知、提升内容生产多样性

  • 相较于人类艺术家,AI 能够接触借鉴更多的数据,在基于 prompt 进行内容生成后 AI 创作的内容会有更多的二次创造空间和自由度。例如,生成算法能基于特定条件或完全随机的生成现实中不存在的形状、色彩搭配、图案或结构等,赋予内容创作更多可能,产生“超现实感”及“未来感”,推动艺术创新。

2.4、模态元素二次拆解组合,改变内容生产逻辑及形式

  • 通过语音克隆、编曲风格提取等手段,AIGC 能够将原客体所对应的不同模态信息进行拆解,例如演讲者的面部形象、声音、演讲内容等。在重新组合之后,能够完成过往受到条件限制无法完成的工作。例如路人的声音 + 专业的播音逻辑、更符合特定审美的面部等,打破真人/真实场景在要素组合上具有的局限性。

2.5、AI 系统或数据库联动,实现高度个性化/高频优化

  • 在与特定的数据库(例如实时更新的客户数据、市场反馈数据、特定主题下的历史统计数据)或 AI 系统进行联动后(如个性化推荐系统等),AIGC 能够在更为精准的未来预测/个性化预测基础上调整其生成内容。
  • 例如,根据、根据所处渠道风格调整生成内容、参考历史数据优化生成内容等。该价值在内容用户习惯调整内容营销文本营销领域有重大意义

三、生成式 AI 改变内容创作和分发范式

3.1、当前与未来设计工作流程对比

  • 当前概念设计师工作流程:接到需求→搜集参考(图库)→构思出图→和甲方沟通修改。
  • 未来设计工作流程:创意→AI→创意。

3.2、AI 文生图存在最大的问题是什么?

AI 创作能力在未来短时间内的进步速度,也将取决于各行各业收集和训练行业优质数据的工作。

开发人员使用 AI 生成宠物小精灵,在初期使用“写实”数据集后发现运行效果不理想,重新使用 26 张新数据集训练 20 分钟,我们根据二者之间的对比,可以看到 AI 学习和生成效果是非常棒的,具体如下图所示:


AI 目前最大的问题不是“不够聪明”,而是“书读得太少"。 在 AI 新范式下创作,要考虑什么样的内容更利于 AI 学习和 AI 生成使用。

如果我们将艺术家关键词对生成图像的贡献视为艺术家本/的贡献,我们从原理上就可以为艺术家的创意价值定价了

3.3、AI 从底层改变了哪些游戏规则?

今天的 AI 从底层改变了游戏规则,接下来会看到以下变化:

  • 不会画画的人用 AI 生产高质量视觉作品。
  • 互联网上难以估量的图像数据被重新组织起来,围绕模型训练和数据标注出现新的生意。
  • 图片版权名存实亡,参与建立 AI 数据集成为艺术家的主要收益。
  • 传统图像处理软件、3D 建模软件被围绕 AI 范式建立的新工具取代。

四、为何生成式 AI 迅速爆发和突破?

4.1、大模型突破瓶颈

根据英特尔(Intel)创始人之一戈登·摩尔(Gordon Moore)提出的 “摩尔定律”:当价格不变时,集成电路上可容纳的晶体管数目,约每隔18个月便会增加一倍,性能也将提升一倍。换言之,每一美元所能买到的电脑性能,将每隔 18 个月翻两倍以上

而现在由于高效数据、高效算力、高效模型、高效知识需求的增长,摩尔定律原来中的 2 倍将增长至现在的 10 倍,具体如下图所示:


在 “The blessings of scale”中,根据趋势我们可以明确得知:同等条件下,随着模型参数量的增加,更大的模型会带来更好的结果,且目前的趋势并未饱和,故目前阶段大模型的投资依然会增加以获得更高的效益,具体如下图所示:

4.2、多模态融合打破边界

多模态融合打破边界,模型越来越大,模型走向行业,模型走向融合,具体如下表所示:

大模型趋势内容
模型越来越大探索极限,目前到 5000 亿仍然保持线性增长。越来越接近人脑神经元连接数,甚至超过。
例:OpenAl GPT-3(175B) 、谷歌 PaLM(540B)
模型走向行业在通用预训练大校型(L0)的基础上,在行业数据上更新训练后,适用于行业特征拍取的模型族(L1)。
例:煤矿模型,电力大模型,药物分子大模型等。商汤:INTFRN 系统(初学者-专家-通才);百度:行业大模型。
模型走向融合未来 2~3 年,视觉和语言大模型统一到多模态大模型,架构上也实现基本统一。各种校态大模型进行充分融合。
例:文本 + 视觉,语音 + 文本,文本 + 视频等 OpenAI DALL*E/E2;谷歌 Imagen;微软 GLIP 等。

五、生成式 AI 技术趋势分析

生成式 AI 技术的发展更趋向于:可控、高精度更快、更好、更便宜

可控高精度重建成为技术突破口,带来了超乎想象的结果,得益于 Diffusion model、语言大模型、跨模特大模型、Nerf 等技术的突破,具体如下图所示:

六、生成式 AI 无法产生创意的基本元素

生成式 AI,可控生成于机器而言,是不同语义的重组,于人而言,就是创意!在绘画领域,AIGC 是将绘画的三要素(构图、纹理、着色)进行重组从而产生创意。但是他并不能真的产生创意的基本元素,举例具体如下图所示:


图像生成,反事实是创意,但是对于语言生成,反事实却是灾难,可谓“恐怖如斯”,具体如下图所示:


总结

百度文心一言发布,股价盘中跌超 10%,也看到很多小伙伴们在试用文心一言后发出的吐槽,基于 Generative AI 的发展不是一朝一夕,这个问题的本质也并不是仅在文心一言中存在的,而 ChatGPT 确实在自然语言理解、自然语言处理等方面有进步的地方,同时,在算法、数据、算力上推进了有效结合。而面对 ChatGPT 的热潮,我们应有的态度正如科技部部长王志刚说所说,我们国家对于任何一个新的技术,包括 AI 技术出来以后,在伦理方面都采取了一些相应的措施,对科学技术发展趋利避害,让“利”更好地发挥出来。


我是白鹿,一个不懈奋斗的程序猿。望本文能对你有所裨益,欢迎大家的一键三连!若有其他问题、建议或者补充可以留言在文章下方,感谢大家的支持!

百度文心一言对标 ChatGPT,你怎么看?


何为文心?“文”就是我们中华语言文字中的文,“心”是希望该语言模型可以用心的去理解语言,用心的去服务用户。

在近期全球陷入 ChatGPT 技术狂欢的同时,中国也有了对标 ChatGPT 的大预言模型。随着百度文心一言发布会的召开,我认真了观看了整个过程。作为一款百度十几年研发投入积累所得的产品,作为“中国版 ChatGPT”,我对它有着浓厚的兴趣,且第一时间申请了体验资格,参与到测试当中。

文心一言 VS ChatGPT

最近在网上经常性的看到这么一张图片,就是将文心一言与 ChatGPT 进行对比,而且差距显而易见。此外在某些站点也可以看到文心一言被“群嘲”。


近期全球陷入 ChatGPT 技术狂欢,ChatGPT 作为 OpenAI 开发的人工智能语言模型,由文本生成对话的训练数据驱动,与其他人工智能技术相比,ChatGPT 可以生成更为自然、流畅的语言回答,这确实是它最大的优势之一。而有人就将此优势拿去对比国内新发布的文心一言,矛头直指文心一言的种种不成熟。但我们可能忽略了一点,每个人工智能技术都有其独特的优势和适用场景。比如 AlphaGo 围棋机器学习模型可能在下棋方面表现出色,而像“聊天机器人”这样的技术则更适合于帮助人们进行自然的对话交流。因此将 ChatGPT 与其他人工智能技术进行比较可能需要考虑到多个因素,而不仅仅是它们的语言生成能力。

如果说非要以己之长比其之短,那么在中文与中华文化的理解上,ChatGPT 与文心一言就没得比,相信有很多人在中文语境下体验 ChatGPT 时也体会到过它“人工智障”的时候吧,那这又怎么说?

其实我想说的是每个语言模型都有自己的优势和适用环境,它们的设计目标是一致的,都是为了辅助人、帮助人、为人类提供更好的服务。所以在看待文心一言的问题上,我们不能仅仅将关注焦点聚集在在文心一言的瑕疵和不成熟上,而是应当站在更加长远且更加全面的角度来看待它。

接受不完美 期待进步

很喜欢李彦宏董事长在发布会上讲的那句话:“我们在使用的过程中有时候会感受到惊喜,有时候可能也会发现明显的错误,但有一点是可以肯定的,它的进步速度会非常快。”他本人也指出自己在体验过程当中,文心一言的能力不能叫做完美。

其实没有哪一个技术、哪一款产品是完美的,更何况这是第一代版本,它的发布则可以获得用户的反馈,迭代速度会加快,能力也会不断的成长与提升。即使有不完美,从现在的发展情况来看,文心一言也是国内互联网大厂中唯一成熟的产品,靠文心一言百度就已经证明了其在人工智能领域、在互联网行业当中的地位。

里程碑意义

随着文心一言语言模型的发布,无疑会对国内科技产业的发展产生带动作用,诸多同类型商业化产品也将会出现。其次在发布会上也提到,文心一言是百度十几年的研发投入积累、持续精耕的产物,这体现着百度在 AI 上的长期坚持。

在我看来,文心一言在国内人工智能领域具有里程碑式的意义,这不仅在于技术水平,更在于人工智能发展理念、对待 AI 的理念。当我们能够认识到这一层,就会发现仅仅去关注文心一言产品本身、仅仅拿它与同类型产品相比较就有点舍本求末了。借用网上的一句话:无需完美,已然具备里程碑意义!

文心一言初体验

文心一言的能力定位主要在于五个方面:文学创作、商业文案创作、数理逻辑推算、中文理解、多模态生成。

✔ 文学创作

从哲学角度续写《流浪地球》,文心一言提出了一些可能的思考方向,且提醒用户注意遵循小说的创作原则和规范。体现出文心一言的总结分析和推理能力,这是基于 5500 亿事实数据训练才得以保证事实性问题的准确性。

✔ 商业文案创作

如果说文学创作体现的是总结分析能力,那么商业文案的创作则是其理解表达、创新创意能力的展现。这种能力我们是没有办法专门去教语言模型的,正如“读书破万卷”,想要“满腹经纶、学识渊博”也得是在大量学习的基础之上,AI 语言模型基于的知识量更是不计其数。

✔ 数理逻辑推算

根据发布会的介绍来看,文心一言大模型训练数据包含万亿级的网页数据、数十亿搜索数据和图片数据、百亿级的语音日均调用数据,以及 5500 亿事实知识积累。所以在梳理逻辑推算方面,它给出答案的同时还能够做到对解题思路的一步步推理。

✔ 中文理解

作为植根于中国市场的语言模型,它对于中文和中华文化的理解能力也是相当高,相较于在中文语境下的 ChatGPT 有时会出现“人工智障”式的表现,文心一言则不会产生类似问题,毕竟百度对于中文语言的处理还是有明显优势的,对于国人的适用性来说,文心一言绝对优于 ChatGPT。


✔ 多模态生成

其多模态主要包括根据文字需求生成图片、创意性的回答图片内容、用语言讲解、生成视频四个方面。但语言和视频这块还不太完善,支持的类型也比较少,体验较差。期待进一步完善。


此外我也对 IT 相关的代码生成、疑难解答等进行了相应的测试​,体验良好。

写在最后

综合测试下来,根据以上表现可以说文心一言具备了很多近似人类的理解能力,如表达理解、逻辑推理等,而且它的准确性和流畅性可以说接近人类。其次就是对中文和中国文化的理解,对于我们中国使用场景来说,绝对是优于 ChatGPT 的。当然在使用的过程中难免会感受到些许不足之处,但是我们应该给予的是期待,而不是冷嘲热讽。期待文心一言的飞速进步和完善。

以上是关于生成式 AI:百度“文心一言”对标 ChatGPT?什么技术趋势促使 ChatGPT 火爆全网?的主要内容,如果未能解决你的问题,请参考以下文章

文心一言正式对标GPT-4,是青铜还是王者?

中国版的ChatGPT,你最看好谁?

文心一言 vs GPT-4实测!

生成式AI“暴走”,BAT兵戎相见?

摸着OpenAI过河,百度文心一言能否“重拳出击”?

站上风口,文心一言任重道远