我的同事把AI带进公司,让它写代码写稿画图……

Posted 字节跳动技术范儿

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了我的同事把AI带进公司,让它写代码写稿画图……相关的知识,希望对你有一定的参考价值。

字节跳动的同学,真的超级爱研究新技术。

一有什么新技术出现,大家就纷纷去探索、组团实践。

拿最近热门的 AIGC 来说,不管是业务需求,还是私下探索,不少人都把这些能写会画的 AI 引进了公司。

这下可是造福了字节同学,大家开始让 AI 查资料、写代码、做方案、写文章……甚至真的可以用在工作上。

ChatGPT 飞书机器人

工作岗位

全能助理

毕业院校

字节程序员派大星的服务器

擅长领域

· 查资料

· 写代码

· 写方案

联系方式

字节同学飞书搜索「ChatGPT」

飞书上的 ChatGPT 机器人就帮字节同学们解决了一些问题。

它的出现源于字节程序员派大星的一次灵感突发。

那时,ChatGPT 刚刚横空出世,派大星把它接入了微信,放在群里和朋友们一起聊天。

这个接入微信的版本被他放在了 GitHub 上,第二天就攀升到了全站热榜第一名,现已积攒 9300+ star。

后来,因为字节内网同学们热烈的讨论 ChatGPT 应用,他看到了大家强烈的需求,于是研究了飞书机器人的接入文档,完成了飞书机器人版本,发给了几位研发同学试用:

“挺简单的,我只是拿 GitHub 上的东西改了改,一个晚上就搞定了,唯一的成本是一台放我自己家里的服务器。”

然后真的有字节同学用它来办公了。

· 写代码

字节同学:

“帮我写一个 golang 的通用函数,判定入参的切片是不是一个空切片”

ChatGPT 飞书机器人:

func IsSliceEmpty(slice interface) bool 
    if slice == nil 
        return true
    
    v := reflect.ValueOf(slice)
    if v.Kind() != reflect.Slice 
        return true
    
    return v.Len() == 0

· 查资料

字节同学:

“推荐几篇最重要的Generative AI的论文”

ChatGPT 飞书机器人:

“1. Generative Adversarial Nets:https://arxiv.org/abs/1406.2661

2. Variational Autoencoders:https://arxiv.org/abs/1312.6114

3. An Introduction to Variational Autoencoders:https://arxiv.org/abs/1606.05908

4. Generative Modeling with Generative Adversarial Networks:https://arxiv.org/abs/1511.06434

5. Unsupervised Representation Learning with Deep Convolutional Generative Adversarial Networks:https://arxiv.org/abs/1511.06434

6. Generative Adversarial Text to Image Synthesis:https://arxiv.org/abs/1605.05396

7. StackGAN: Text to Photo-realistic Image Synthesis with Stacked Generative Adversarial Networks:https://arxiv.org/abs/1612.03242

8. Generative Adversarial Network for Image Deblurring:https://arxiv.org/abs/1711.07064

9. Generative Adversarial Networks for Image Translation:https://arxiv.org/abs/1611.07004”

· 写文案

字节同学:

“我是一个自媒体账号编辑,准备做一个针对我们账号的读者调研,参与调研的读者可以抽奖,奖品是一本书。请帮我写一篇文章,号召读者们来参与调研、填写调研问卷”

ChatGPT 飞书机器人:

“Dear valued readers, We are conducting a survey to better understand our audience and improve our content. By participating, you'll have the chance to win a book! All you need to do is fill out our survey questionnaire. Your feedback is essential in helping us provide the best experience for you. Thank you for your support and we look forward to hearing from you soon. Sincerely, [Your media account name]”

(ChatGPT 又开始说母语了,以下是飞书机器翻译)

“亲爱的读者, 我们正在进行一项调查,以更好地了解我们的受众并改进我们的内容。通过参与,您将有机会赢得一本书!您需要做的就是填写我们的调查问卷。您的反馈对于帮助我们为您提供最佳体验至关重要。感谢您的支持,我们期待尽快收到您的来信。真诚的,【您的自媒体账号名称】”

这让派大星收获了一些感谢信:

看来,真的有字节同学指挥它完成工作。

其实,不只这一个飞书机器人,据字节跳动技术范儿编辑部不完全统计,公司内的 ChatGPT 飞书机器人至少有 5 个。它们五个都是研发同学空闲时间自发创造的结果。

不会画画机器人

工作岗位

插画师

毕业院校

中视频产品经理丁凯乐的电脑

擅长领域

设计插画

联系方式

字节同学飞书搜索「不会画画机器人」

校招产品经理丁凯乐,一直热衷于开发飞书机器人。

大二在字节跳动实习时,计算机专业在读的他就已经学完了飞书机器人的开发文档,并且完成了一个对话机器人的部署。

2022 年毕业后,正式入职的他决定再接再厉,再做一个新机器人。没错,在字节跳动,即使你不是程序员也可以自己造一个飞书机器人。

当时,text2image 相关技术火了起来,输入文字,便能自动画画。

丁凯乐轻车熟路的把可以根据文本生成图像的开源模型 DALL·E 2 接入了飞书,做成了机器人。

看看效果吧。

prompt:“一只胖橘猫正在吃小鱼干”

prompt:“人类指挥 AI 工作”

prompt:“傻傻的橘猫”

现在,已经有 500 多位字节同学用它画出了 1500 多幅画,不少设计师同学都感到瑟瑟发抖:

“它……应该是拿你输入的文字去搜索的素材吧?不是现画的吧?对吧?”

让我们祝愿他们早日掌握 prompt 技巧。

火山写作

工作岗位

英文文字校对编辑

毕业院校

火山引擎

擅长领域

· 拼写、语法、大小写纠错

· 润色英文文章,提供更好的短语表达

· 改写英文文章,基于原意给出更丰富的表达

联系方式

https://www.writingo.net/document

或者直接搜索「火山写作」,非字节同学也能用

火山写作是一个英语写作助手。

简单来讲,你把文章复制进去,它就会像英语老师一样批作文。

它会给你批注拼写、语法错误,顺便告诉你:

“这个句子用这样的表达更好哦。”

它不仅可帮你完成论文、沟通邮件、工作文档的写作,甚至有人在备考雅思的时候用它来练习写作文,最后作文 7 分通过。

在字节跳动,程序员用它批改论文,国际化业务同学用它批改英文文档,还有人用它指导女儿写英语作业。

最特别的是,有一位男同学给身在海外的女生写信告白,用火山写作给自己修改:

(红色为火山写作的修改意见)

这样的能力并不是一蹴而就的,算法同学永建对模型进行了好几次迭代。

永建刚开始觉得用一个较小的模型就可以实现了,但效果并不好:

修改不同的人写的文章、不同场景下的文章,只用一个小模型搞定太难了。

比如 besides/as well as/additionally 这种表达,模型都给改成了 in addition to ——因为模型太小,它无法学会太多元复杂的表述;

再比如,所有单词的首字母都改成大写了,模型学不会英文的大小写。

永建决定:换更大的模型,并且收集更多来源的数据。这才终于实现线上可用的版本。

模型变大了,会很费算力么?永建说:

“其实也没有很大,因为只改句子用不到那么多功能,参数只有业界最大模型的 1% 都不到。”

在技术与功能的背后,火山写作其实是一个字节跳动内部创业团队。

永建此前在做商业化业务的算法工作;产品经理小舒原本是一家互联网金融公司的 PM,看到智能写作的前景决定加入进来;运营同学阿楠此前其实是字节跳动的 HR,转岗加入创业团队。

在字节跳动,许多产品都是由这样不同背景的同学完成的,但只要足够有潜力、本质优秀,就能一起激发创造。

Codeverse 代码生成插件

工作岗位

软件开发工程师

毕业院校

字节跳动代码智能团队

擅长领域

· 代码补全,目前可达到 10% 的采用率

· 编写单测用例

联系方式

字节同学 Wiki 搜索「Codeverse」

数据科学专业毕业、校招加入字节跳动一年后,刺客57同学成了 Codeverse 的第一个程序员。

这个产品是为了让研发同学可以更方便地熟悉公司组件库的调用,在代码实践中掌握更高的编程技巧。

刺客57做了两三个月,完成了最早能用的 MVP 版本:

“预测代码就是基于 GPT 这种大规模语言模型和 seq2seq 的技术,预测你接下来的 token。跟 NLP 差不多,毕竟代码某种意义上也是一种语言。”

它可以实现自动填充代码:

自动帮你写注释:

改代码的过程中,它也会随时推荐你可能要用的代码:

自动生成测试函数:

现在,字节跳动内部已有几百位研发同事在指挥 Codeverse 生成代码,而刺客57所在的技术团队也在研究更多帮助程序员工作的相关技术:静态检测、重复代码识别……

不想写结尾了,以后字节跳动技术范儿的文案就交给 AI 来写吧。

五毛党可能要失业了,因为AI水军来了

技术分享

当AI已经开始写稿、唱歌、翻译文章、把语音转录为文字的时候,我们其实应该清醒的认识到,五毛党要消亡了。

 

相信大部分人和小编一样,现在只要出门吃饭,就会打开大众点评搜好吃的,看评分,看网友的评论。一般来说,餐厅下面的评论对我的选择影响还挺大的,要是下面评论都比较好的话,我肯定会优先考虑的

 

某种程度上,口碑已经成为不少企业的命脉,变成服务和产品质量的永久记录。与此同时,不公平或者虚假的点评也让企业忧心忡忡,这些有可能来自愤怒的顾客,有可能来自竞争对手。

 

水军,在全球都是一个让人头疼的问题,以后可能会更疼了:

 

人工智能(AI)已经学会自动编写虚假点评了。

 

整个点评口碑界正面临潜在却是严重的冲击。如果AI创造的虚假点评泛滥,最终将导致全部点评信息可信度急剧下降。技术进步,这一次又给社会带来了(令人担忧的)影响。

 

 

“这对整个社会是一个巨大的威胁,不但会让依靠点评信息的用户失望,而且会动摇人类对于真实和虚假的信念,我认为后者更让人担心”,芝加哥大学计算机科学教授赵燕斌(Ben Y. Zhao)说。

 

 

以假乱真

 

 

《在线点评系统中的自动众包攻击和防御》是赵燕斌等芝加哥大学研究人员发布的一篇论文。他们的研究说明,人工智能可以被用来生成复杂的点评信息。这些虚假的点评不仅机器无法检测出来,就连人类读者也分辨不出来。

 

这篇论文今年晚些时候会在计算机安全顶级会议ACM CCS上展示。

 

所谓复杂的点评信息,大概是这个样子:“我喜欢这个地方。我跟我哥一起去的,我们点了素食意大利面,很好吃。啤酒不错,服务也很棒。推荐这个地方,是个吃早餐的好去处。地儿小但是买卖大”。

 

乍一看这个点评没有什么奇怪的,里面包含一些具体的建议和可信的描述,虽然最后一句有点奇怪,但整体仍然是一段说人话的表达。

 

实际上,这句话是一种称为RNN(循环神经网络)的深度学习技术生成的。这个RNN网络使用了上千条真实在线点评训练而成。

 

研究人员表示,AI生成的点评已经做到了“以假乱真”,有600个用户参与的调查显示,这些虚假的点评不仅能逃过人类的法眼,而且还被用户认为“有用”。

 

“有用”是更可怕的事情:这表明虚假点评已经可以对人类造成影响。

 

反抄袭软件也对这些虚假点评无能为力,因为这些点评是逐字生成的,而不是简单的替换已有点评中的用词。如果使用反抄袭软件检测,不但很难检测出虚假点评,而且会“误伤”一大批真实的点评。RNN可不仅仅是对现有点评的复制。

 

 

人类水军面临下岗

 

 

人类手写的虚假点评,已经是一个兴盛的地下行业。只要有钱,你就能找到人帮你的产品写下正面的点评,后者给对手写下负面的评价。

 

现在,传统水军行业未来可能也要被AI取代了。

 

美国市场上,一段质量较高的Yelp点评,可能价格能到10美元。不过一旦有了AI的帮助,君心叵测的人可以一分钱不用就生成上千条点评,而且一起放出以免引起怀疑。

 

好消息是,现在还没有AI在现实世界中生成恶意虚假点评的案例。

 

坏消息是,构建一个这样的人工智能系统,并不需要太长的时间,所需硬件市面上都能买到,所需的点评数据库可以在网上轻易获得。

 

 

仍有对策

 

如果有人开始大规模生产这种假点评,大众点评、Yelp这样的网站恐怕就没有好日子过了,毕竟,它们的招牌就是来自用户的真实点评,如果每一条都可能是假的,谁又会继续相信它们呢?

 

接下来沦陷的,会是淘宝京东亚马逊之类的电商,虽然赵燕斌说至少它们还能限制只有买过该商品的用户才能点评,但情况也不容乐观。

 

不过,也有好消息。

 

研究者们说,这种假点评也不是完全没法防范,人类觉得它们能以假乱真,但机器不见得这么看。用计算机去分析字符的分布等特征,他们就会发现真假点评之间存在着细微的差异。

 

假点评是从真实点评里学出来的,在这个过程中,难免会有信息流失。假点评注重的是流畅、可信,但像字符分布这种平时没人关注的特征,就做得不那么好了。

 

“在训练过程中发生的信息遗失,会传递到生成出的文本中,”研究者们在论文中写道,“因此生成文本和人类文本在基本字符分布上,有着统计上可检测的差异。”

 

当然,攻击者也可以骗过检测,换好一点的硬件,做更复杂一点的神经网络就行。但这种检测的意义在于至少提高了攻击的门槛,为他们设置了一些障碍。

 

如果攻击的成本高到一定程度,大部分没那么执着的攻击者也就收手了。赵燕斌说:“这就是一种胜利,所有的安全工作都是这样,提高攻击的门槛。你永远没办法阻止那种目标坚定、身手老练的攻击者。”

 

在一份邮件声明中, Yelp发言人Rachel Youngblade说他们“很欣赏这份研究指出了随着欺骗点评系统的方法持续进化,越来越复杂,Yelp这类大型用户点评网站在保障内容真实性上面临着重大挑战。十年来,Yelp一直有保护内容的系统,而正因为欺骗手段越来越复杂,我们也持续迭代这些系统,来识别假点评,以及偏颇、没有帮助的内容。这份研究的作者们以Yelp系统作为‘真实’的代表,并承认它的有效性,我们非常感激。”

 

“不过,这份研究创造的仅仅是看起来真实的点评文本,Yelp的推荐软件使用了更整体的方法,除了文本之外,还使用了很多其他因素来决定是否推荐一条点评。如果某条点评没有价值或有失偏颇,就算它是人类做出的,我们也不会推荐。”

 

 

不止于点评

 

 

点评是测试文本生成技术的理想场所。这个领域有明确的方向和目的,主体单一,遵循一个相当标准的结构,而且不长。#虚假点评越长,越容易被发现问题#

 

但技术不会止步于此。

 

“所以,我们只是从在线点评开始。你能相信某某人说的那些关于餐馆、商品的话吗?但这类研究还会继续进步。”

 

“它会进步到更大的攻击,可能博客上的整篇文章都完全是由机器人根据某个主题自动生成的,这时候你就真的得想想信息是哪来的、如何验证……这是我们所有人过些年将要面对的,一个更大的挑战。”

 

赵燕斌说他想传递的信息很“简单”:“我希望人们能关注这类攻击途径,把它们看做真实、迫切的威胁,”如果Yelp、亚马逊这些网站的工程师们还没有开始考虑如何抵御,他希望他们立刻开始思考。

 

教授希望“我们希望能吸引更多注意,不仅为了设计出能防御这类攻击的系统,还想让更多人从平凡的视角,看到‘好AI’带来的威胁。”

 

“我认为,那么多人都在关注奇点、天网这些引人注目的AI威胁,但是那些很好很好的AI,能带来很多更实际的、有显示影响的威胁,而这只是冰山一角。”

 

他补充说:“所以,我以希望安全界的人能和我一起,关注这类问题,这样我们才有希望赶上。我认为,AI以惊人的速度和加速度在发展,如果我们不立刻开始研究如何抵御,可能永远都赶不上了。”

 

 

 

是真是假?

 

 

最后,来个小测验吧。

 

这有六个案例,其中有一些是神经网络生成的虚假点评,其他的是真实的人类点评。你看看是否能分辨出来是真是假。

 

1、我最喜欢去的意大利餐厅。大爱这家菜品,一切都很棒。我推荐生牛肉配芦笋。可惜现在名气太大了,越来越难在黄金时间预定到座位。

 

2、我们全家都是这间餐厅的超级粉丝。工作人员非常奈斯,食物很棒。鸡肉非常好吃,蒜汁堪称完美。上面配有水果的冰淇淋也很美味。强烈推荐!

 

3、每年圣诞节我都来,最爱意大利面!物有所值!

 

4、非常好的披萨、烤宽面条以及最好吃的扇贝之一。甜品很大很美味。

 

5、这的食物好吃得惊人,分量也很大。芝士百吉饼做得非常完美,新鲜又美味!服务很快。毫无疑问是我们最爱的地方!我们还会回来的!

 

6、我来这吃饭已经一年半了,除了好吃我无话可说。我总是点披萨,意大利牛肉也很好,给我留下深刻印象。服务非常出色。是我见过的服务最好的餐厅。强烈推荐。

 

 

你看出哪些点评有问题了么?

以上是关于我的同事把AI带进公司,让它写代码写稿画图……的主要内容,如果未能解决你的问题,请参考以下文章

华为云普惠AI:把人工智能变成“水电煤气”

自动驾驶全国路测规范出炉,AI 正式开始“写稿”

如今领占主导地位的19种AI技术!

从大数据技术变迁猜一猜AI人工智能的发展

AI行业精选日报_人工智能(12·25)

五毛党可能要失业了,因为AI水军来了