ChatGPT will not replace programmers, but Search Engines should be worriedChatGPT 不会取代程序员,但搜索引擎应该担心

Just the facts, ma’am 只是事实

Search is about knowledge, not web content搜索是关于知识,而不是网络内容

ChatGPT and Search Engines are an unfair comparison for nowChatGPT 和搜索引擎目前是不公平的比较

为什么 ChatGPT 不会很快取代人类?

ChatGPT 的缺点




ChatGPT will not replace programmers, but Search Engines should be worried
ChatGPT 不会取代程序员,但搜索引擎应该担心

Friday, December 23rd, 2022 at 12:19 pm
2022 年 12 月 23 日星期五中午 12:19

Unless you’ve lived under a rock, you probably heard of ChatGPTOpenAI wunderkind chat bot that seemingly gives answers to any problem you throw at it. Of course people fed it with lots of programming questions and it yielded great results. This, once again, sparked a big discussion if “AI” could replace developers. I don’t know, maybe we are too socially awkward to be around or it may be that in times of recession jobs that get paid a lot more than others are targeted – who knows?
除非你生活在岩石下,否则你可能听说过 ChatGPT,OpenAI wunderkind 聊天机器人似乎可以回答你提出的任何问题。当然,人们向它提出了很多编程问题,它产生了很好的结果。这再次引发了“人工智能”是否可以取代开发人员的大讨论。我不知道,也许我们在社交上太尴尬了,或者可能是在经济衰退时期,薪水比其他人高得多的工作成为目标——谁知道呢?

In any case, a trained ML model giving good programming answers isn’t something that confuses me – programming by definition is a logical process that can be reversed. Although, looking at 25 years of code in my career shows that humans can do a lot to not make code understandable.
无论如何,一个训练有素的 ML 模型给出了良好的编程答案并没有让我感到困惑——根据定义编程是一个可以逆转的逻辑过程。虽然,回顾我职业生涯中 25 年的代码表明,人类可以做很多事情来让代码变得难以理解。

Just the facts, ma’am 只是事实

What ChatGPT really does well is give us the right amount of information for our questions. So if I ask it “how do I change a car battery” I get instructions how to do that in a few paragraphs. I do not get five ads for car batteries, a YouTube video of ten minutes where the first three are about not forgetting to like and subscribe and a list of outdated instructions that the search engine favoured because they are older.
ChatGPT 真正擅长的是为我们的问题提供适量的信息。因此,如果我问它“我该如何更换汽车电池”,我会在几段中得到如何操作的说明。我没有收到五个汽车电池广告,一个十分钟的 YouTube 视频,其中前三个是关于不要忘记喜欢和订阅的,以及搜索引擎青睐的过时说明列表,因为它们较旧。

I wrote about my disappointment in search engines these days some time ago, in my The web starts on page four post, and it seems to me that the meteoric rise of ChatGPT is the swift kick in the backside that the search market needs.
我前段时间在我的 The web starts on page four post 中写了我对搜索引擎的失望,在我看来,ChatGPT 的迅速崛起是搜索市场需要的快速反击。

Search is about knowledge, not web content

Search has long ago moved away from “find this web site, I will click through to find the information I need” to “tell me what x is”, and there was an interesting period in time where search engine companies optimised for that use case. When I worked in Yahoo we came up with Yahoo Answers, and the idea was to deliver human answers to human framed questions rather than keywords and flags. And it turned into hot garbage really quickly due to gaming of the platform and not enough resources in moderating it. The same often happened to Quora or the unfortunately named Expertsexchange.
搜索早已从“找到这个网站,我会点击找到我需要的信息”转变为“告诉我 x 是什么”,并且有一个有趣的时期,搜索引擎公司针对该用例进行了优化.当我在雅虎工作时,我们想出了 Yahoo Answers,其想法是为人类提出的问题提供人类答案,而不是关键字和标志。由于平台的游戏性和没有足够的资源来调节它,它很快就变成了热垃圾。同样的事情经常发生在 Quora 或不幸命名为 Expertsexchange 上。

Search engines now do a great job in scraping sites to extract the most relevant content. Turned out that giving people a meta description field just leads them to spam it with keywords rather than a human readable synopsis. That’s why there is a lot of content intelligence in search bots and their databases already. Often you do get already in the description what you want.

ChatGPT and Search Engines are an unfair comparison for now
ChatGPT 和搜索引擎目前是不公平的比较

ChatGPT is now the amazing new and cool, clean thing that only gives you what you want. Google was exactly the same when it was a search box instead of a huge editorial content driven site with a search box. ChatGPT also has no monetisation model yet – and my guess is that soon it will get ads plastered over it once it moved away from the experimental stage.
ChatGPT 现在是令人惊叹的全新、酷炫、干净的东西,只为您提供您想要的东西。当谷歌是一个搜索框而不是一个带有搜索框的巨大的编辑内容驱动网站时,它是完全一样的。 ChatGPT 还没有货币化模型——我猜它一旦离开实验阶段,很快就会在上面贴上广告。

Now, how come the big companies of the web that put AI on their flags for years didn’t release ChatGPT? The answer is legal repercussions. OpenAI plays it safe by calling everything a preview, beta and experiment. If ChatGPT tells me how to build a bomb using household items, that is a different thing than if it showed up in a Google or Bing result.
现在,多年来将 AI 置于其旗帜下的网络大公司为何不发布 ChatGPT?答案是法律后果。 OpenAI 通过将所有内容称为预览版、测试版和实验来确保安全。如果 ChatGPT 告诉我如何使用家居用品制造炸弹,这与它出现在 Google 或 Bing 结果中是两码事。

The other issue is attribution. Many people put content on the web to be found and to make some money. That’s OK, and search engines are a big driver of that model. If a ChatBot scraped your content and shows it without you getting any benefit from it, this could lead to a lot less content being published. Microsoft or Google showing content without attribution is a big no-no and has resulted in quite a few court cases, so that is something that needs fixing.
另一个问题是归因。许多人将内容放在网上以供查找和赚钱。没关系,搜索引擎是该模型的重要驱动力。如果 ChatBot 抓取了您的内容并在您没有​​从中获得任何好处的情况下显示它,这可能会导致发布的内容少得多。微软或谷歌在没有署名的情况下展示内容是一个很大的禁忌,并导致了相当多的法庭案件,所以这是需要解决的问题。

ChatGPT has the benefit of being an academic exercise, the others are established corporations people love to sue. Working in the moderation team of a search engine isn’t fun. It gives you a glimpse into the depths of human darkness and it is playing whack-a-mole with automated content sites and upload bots. That’s why search engines will always be seemingly slower than “live” systems like ChatGPT. With good reason – you do not want to see what content moderators have to see.
ChatGPT 的好处是它是一项学术活动,其他的都是人们喜欢起诉的老牌公司。在搜索引擎的审核团队工作并不好玩。它让您瞥见人类黑暗的深处,它正在与自动化内容网站和上传机器人玩打地鼠游戏。这就是为什么搜索引擎看起来总是比 ChatGPT 这样的“实时”系统慢。有充分的理由——您不想看到内容版主必须看到的内容。

The other big issue, of course, is relevance. ChatGPT returns content with the eloquence and arrogance of a CEO at a press conference regardless of it being true or utter nonsense. We need to find a way to fix that issue. Younger me would have told you that the “wisdom of the masses”, f.e. people downvoting wrong results would fix that. But Brexit, Trump, QAnon and anything related to Russia the last 6 years made me realise that the wisdom of the masses is a fragile thing, easily confused by surveys, Facebook games and reposts.
当然,另一个大问题是相关性。 ChatGPT无论是真还是胡说八道,都以CEO在发布会上的口才和傲慢来回馈内容。我们需要找到解决该问题的方法。年轻的我会告诉你“大众的智慧”,f.e。人们对错误的结果投反对票会解决这个问题。但英国退欧、特朗普、QAnon 以及过去 6 年与俄罗斯有关的任何事情都让我意识到,大众的智慧是脆弱的,很容易被调查、Facebook 游戏和转发所混淆。

No, for ChatGPT to become something the Googles and Microsofts of this world can use and match, it needs to get a relevance filter, and I am pretty sure that in both companies people are already firing on all cylinders getting this done.
不,要让 ChatGPT 成为这个世界上的谷歌和微软可以使用和匹配的东西,它需要一个相关性过滤器,而且我很确定在这两家公司中,人们已经在全力以赴地完成这项工作。

I am looking forward to what this all means to the search engine market. Probably good news.

为什么 ChatGPT 不会很快取代人类?

在过去的几周里,互联网上充斥着对 AI 编写工具的热议,其中一款特别火爆:ChatGPT。不难看出原因。ChatGPT 是 OpenAI 的高级聊天机器人工具,它也给了我们 DALL·E 2。它可能是一个聊天机器人,但它可以以惊人的准确度响应请求,生成论文、故事、诗歌甚至软件代码和讲座等书面作品笔记。与更基本的编写 AI 工具不同,ChatGPT 通常会产生出奇的好写的作品,而且似乎经过了很好的研究。

普遍的反应既兴奋又怀疑。与最近围绕 AI 艺术的争论类似,作家担心他们的工作可能会被取代,而企业则想知道如何利用它来谋取利益。然而,许多专家对目前的广泛采用持谨慎态度。虽然它是一个有趣的工具,但它远​​非完美,当然也不能替代人类。 

在接受 CNN 采访时,技术研究和咨询公司 Gartner 的副总裁伯恩·埃利奥特 (Bern Elliot) 将当前版本的 ChatGPT 描述为不过是一种室内把戏:



ChatGPT 的缺点

AI 散文可能读起来出奇地好,但写作的重要元素——包括准确性、人的细微差别和对主题的真正洞察力——还不完全存在。重要的是要记住,人工智能是根据你输入的关键词给你答案——它无法以人类的方式真正理解这些词。这导致它提供的答案中存在常见的怪癖。 

例如,ZDNET 的技术编辑 June Wan要求 ChatGPT 撰写iPhone 14 Pro 的评论。Wan 总体上对评论的撰写方式印象深刻,提供了完整的介绍到结论的文章,​​通过对产品的分析以及它可能如何影响用户体验来支持其主张。然而,除此之外,所提供的信息并不总是完全准确的。Wan 认为这是因为 AI 无法区分来源是否可靠。 

“它不知道它提取的数据是真还是假,尤其是在更复杂的情况下,比如需要描述特定的 iPhone 型号时。”

另一个主要问题是它提取的数据已经过时——AI最近的训练数据来自 2021 年。不用说,从那时起,世界发生了很多变化。 

这正是法律研究和数据公司 LexisNexis 的副总裁 Min Chen 告诉 CNN 的原因,他们不会很快使用 ChatGPT 进行严肃的法律研究。Chen 认为它不够可靠:“在某些情况下,ChatGPT 会给出一个非常冗长的答案,似乎有道理,但答案不是事实。”

除了可靠性和准确性之外,尽管 Chat GPT 可以写得很好,但它产生的内容并不是很吸引人或很有趣,这可能是因为它在重复它在 Internet 上找到的内容。成为一名作家的一个关键部分是能够批判性地思考一个话题并形成自己的论点。这不是 ChatGPT 可以做到的。 

Wordable 首席执行官布拉德史密斯告诉福布斯:

“除非 AI 基本上是在自动抄袭已经在这个主题上的其他内容,否则它无法比较这样的替代方案,也无法提供关于为什么一个论点可能合法或不合法的额外背景。”


还有偏见的问题。许多用户透露了 ChatGPT 提供种族主义或性别歧视回应的实例。在 Twitter 线程中,计算认知科学家 Steven Piantadosi分享了该工具在给它特定提示时给出的一些令人不安的答案,例如一个 Python 程序,可以根据种族和性别对谁将成为最佳科学家进行排名Mozilla 的研究员Abeba Birhane分享了由 ChatGPT 生成的带有性别歧视的歌词:




OpenAI 承认这偶尔会成为一个问题,并希望其审核 API 和用户反馈能够及时解决该问题。

企业使用编写 AI 的想法也引发了道德问题,尤其是当您不告知用户和客户他们正在处理的内容时。据 Vice 报道,心理健康非营利组织 Koko 在透露它尝试使用 ChatGPT 来帮助对寻求咨询服务的高危人群做出反应后遭到抨击。该公司报告称,AI 回复的评分高于人类回复,并帮助将回复率降低了 50%。然而,当人们发现他们一直在与 AI 而不是人打交道时,他们会感到“被模拟的同理心所困扰”。

专家批评了该实验,指出了许多危险信号,包括缺乏用户的知情同意。华盛顿大学语言学教授 Emily M. Bender 告诉 Vice,由于缺乏同理心和对处于危机中的人的处境的真正理解,将人工智能用于心理健康服务有很大的潜在危害。如果 AI 恰好提出有害建议,问责制问题也会受到质疑。


虽然 ChatGPT 目前可能不是日常专业用途的理想选择(尤其是在某些领域),但它可能会随着时间的推移而改进,尽管对于它是否足以取代真正的作家尚无定论。如果您有兴趣了解该工具的开发方式,OpenAI 已经为一个名为 ChatGPT Professional 的付费实验版本打开了候补名单

