“赶上热词热概念，是我们不幸的一面” | 对话小冰公司CEO李笛

Posted 2021-10-17 QbitAl

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了“赶上热词热概念，是我们不幸的一面” | 对话小冰公司CEO李笛相关的知识，希望对你有一定的参考价值。

金磊发自凹非寺
量子位报道 | 公众号 QbitAI

小冰的很多进展，往往只能借用科幻电影才能更好解释。

《Her》中描绘过一个如影随形的专属AI虚拟人，跟主人公聊天聊地，从诗词歌赋聊到人生哲学，最后被当做灵魂伴侣……这让人联想到小冰。

《失控玩家》则讲诉了游戏空间里，真实人类玩家和各种角色的AI共生共处的场景……这同样让人联系起小冰。

而且最新推出的App小冰岛，正是一个可以与各种虚拟人（AI beings）群居、共处的所在。

小冰CEO李笛说，这是小冰在AI beings的多样性 （diversity）上的一次大型尝试。

以前的各个小冰以“单打独斗”著称，画画的小冰、作诗的小冰、唱歌的小冰……现在，他们被置于社交环境之下，人类可以混居其中，参与他们更智能地进化。

也有人评价：这是全球首个AI社交平台。

初登小冰岛，你能看到不同“人设”的AI居民在岛上活跃。

他们有的在海边唱歌，有的在交流对话，还有的在读书学习。

这些AI beings在闲暇时间都是各忙各的，像极了正常人类的社交生活：

当你找他们聊天，AI beings会秒回复你；
你可以跟他们展开群聊对话；
他们还会像人类一样发朋友圈。

这些AI beings有自己的各自“生活”，但又时刻围着你转，会时不时的给你送上小礼物：一幅画、一首诗、一段小曲……

在你更新朋友圈时第一时间点赞、互动。

他们也不全是“完美”形态，一个个俊男美女，他们中也有口音浓厚的山东大哥小冰，长相不突出，在中国画鉴赏中展现出偏好。

他们中也有以唱功著称的新声代小冰陌笙，一亮相就以一首周深升2 key版的《大鱼》惊艳四方：

还有央美高材生——学习绘画的小冰——夏语冰2.0版本，习得中国画技巧，能够用稳定的方式做到输出，例如非常细节的船在水面上的倒影等等，都能勾勒的非常完美。

……

是的，这些都是小冰，各式各样的小冰，朝着多样性方向发展的小冰。

如果你要问这样的小冰现在有多少个？

小冰公司的回答是1700万个，包括不同设定的虚拟人、擅长不同风格的歌手，以及有着不同能力和性格。

这些AI beings能力越来越强，进入的领域越来越多，充当的角色越来越多元丰富……甚至多元到需要一个专门的“社会”——小冰岛去承载他们。

你在跟他们互动，他们同时也在观察和学习你。

但对于李笛来说，这是AI beings的全新阶段，也仅是一个开始的开始，距离他至少78亿个AI beings的雄心，1700万显得微不足道。

△小冰公司CEO 李笛

为什么有78亿的目标？背后需要怎样的技术进阶和努力？这跟时下火热的新概念元宇宙有何关系？从巨头微软拆分出来的创业公司小冰，又如何能一步一步实现这样的宏伟目标？

在小冰岛App推出后，李笛给我们解答了一切。

对话小冰公司CEO李笛

“赶上热词热概念，是我们不幸的一面”

量子位：为什么要专门强调小冰岛不是“元宇宙”？

李笛：因为我们确实不懂元宇宙，尝试过（弄懂），但最终还是没懂。

量子位：那也不必专门强调…

李笛：我不知道元宇宙的定义到底是什么，但本能地认为我们应该跟热词没有什么太大的关联，如果看小冰的历史，这么多年出现过特别多的热词，像曾经的Magic模式等，各种人工智能的概念……

量子位：有创业者会喜欢热词，热词意味着风口。

李笛：对我们来说，追逐热词好像没什么用。我们想要做的，是这么多年一直在做的，即使是小冰岛也不是最近在做的，我们也不知道为什么赶上了“元宇宙”的热潮，其实这是我们不幸的一面。

如果我是为了融资，非得这么干，或者说如果我们不贴元宇宙我们就会在竞争上遇到困境，可能也不得不考虑。所幸我们不是，我们今天还能不受这个概念的侵扰。

量子位：小冰很技术具体，但热的概念不这样。

李笛：我个人也觉得元宇宙最大的问题，是它太能装了。一个技术边界或者产品边界最怕的就是太能装，反而不怕不能装。

你做的技术或产品如果很具体是没问题的，但如果什么都能装进去的话，单是对内，这个产品迭代就会有问题。

其次的问题是说，元宇宙的定义过于模糊了，你做什么、不做什么也构成了问题。

量子位：但对元宇宙多少有一些个人认知？

李笛：如果我们去探讨元宇宙的定义是有一个虚拟空间，人们在虚拟空间里存在并且可以交互、获得内容，在虚拟空间里面的身份可以和真实世界身份不同。

那么社交软件就是一个元宇宙，人们有头像、名字，有交互的空间，一对一私聊和群聊，有朋友圈，有各种内容生态和金融体系。

微软教会我的三种“容易死”的创业方法

量子位：所以为什么对热词有本能警惕？

李笛：这跟我在微软学到的经验有关。

在微软做项目的时候，有三种“容易死”的方法。

首先是在做项目的时候，如果上来就说做的是一个平台，那它容易“死”。

这是因为你只做平台、做基础设施，但你往往不知道它的上层结构能不能搭、是怎么搭的。

量子位：于是小冰从来不说自己是AI平台？

李笛：我们甚至很多年都不敢提platform（平台）。

后来别人说要不叫人工智能操作系统，我们更不愿意了，于是我们叫它为framework（框架）。

其实这是比小冰实际范围要小的，但我们宁愿如此。

量子位：第二个“容易死”的方式是什么？

李笛：开发者生态。

对于人工智能来讲，开发者生态无非是两种情况。

一是做出足够高的开源。不过非常遗憾的是，类似于DeepFake，它做了开源，但结果大家也都看到了。

以及前一阵子你们报道的，有人用OpenAI的GPT-3“复活”亡妻这件事，我觉得OpenAI自己就做错了，他们不应该把这项技术拿出来交给第三方。

相信我，如果我们把小冰的对话技术开源出来，立刻就会有（黑产）机器人出现。

量子位：这些技术本身没问题，但很容易有隐私数据的麻烦？

李笛：是，这也是第三种“容易死”的项目，跟隐私数据相关。我们以前说过的，给我30分钟声音数据，就能把你的Voice Font做出来，但这种工具不能拿出来，会引发很多问题。

小冰岛的本质是承载数据和技术迭代

量子位：小冰岛为什么出现在这个时候？

李笛：我们一年半前开始启动研发，如果了解小冰的话，我们其实每年做的东西都跟后面有关联，我们最开始的时候，是搭建一个框架，这个框架能够允许各种各样的AI being出来，但是这种AI being，你马上就给它一个平台，让它去承载，我们没有自信。

所以我们就先做了一个叫虚拟男友的这么一个很小的产品，用来迭代我们的各种技术，直到确定我们能做，才来做小冰岛。

量子位：本质上数据和技术的迭代？

李笛：小冰岛可以从小冰框架的基本面来理解，基本上取决于三件事。

第一件事，技术是不是能够有效迭代。

第二件事，是不是能够获得足够充分、优质的数据。

第三件事，是不是能够通过技术和数据，持续迭代出足够好的产品。

从这三个角度来讲，目前无论是小冰框架自有落地，还是在我们的大量的第三方平台，这个基本盘守住，我们就还是全球最大的第三方跨平台人工智能系统，并且技术可以得到源源不断的哺育。

而且我特别赞同吴恩达今年多次提过的新观点，“更好的AI，20%有赖于算法，80%有赖于优质的数据”。小冰框架比较幸运，多年来30%精力在算法，70%的投入在数据，也承载了全球60%以上的人与人工智能交互量。

量子位：小冰岛现在是二维的，有考虑过未来把AR、VR的技术打进来，变成三维沉浸式的那种吗？

李笛：今天如果没有沉浸式空间，只存在像社交聊天软件那种界面的话是可以的。

但是人们对想象力的要求很高，你知道像《黑客帝国》那个人看着屏幕上一串绿色的代码，就能想象到后面的美女，他的想象力足够丰富。

如果人们的想象力不够，你就需要给他一个视觉，这样他就比较容易能够做到想象。

而人们戴上AR、VR的设备，所需要的想象力就会更少，其实这是一个好的过程。

量子位：这个过程中挑战是什么？

李笛：问题是不能只靠戴AR、VR才能够实现这个过程，我们现在认为AR、VR设备，对消费者还不是首选和必备的。

Harry（沈向洋，小冰公司董事长）之前也提过，我们其实专门就这个事说过几回。比如基础设施这件事情，未来可能最大的颠覆，就是量子计算。中间的话，是蓬勃发展、但也处在漫漫长路上的人工智能。最上层是用户体验，AR、VR、MR等产品，会让几年后的用户体验出现根本性的颠覆。

我个人认为AR对我们小冰来讲会更make sense一些。

给普通人用我们的技术会很赚钱，但不会这么做

量子位：发布会上说小冰岛那些AI beings，他是会有一个进化的过程，会不会有一些道德伦理的约束？

李笛：今天讨论道德伦理的约束，有一个待解问题和几个可解问题。

首先，待解决问题就是如何看待私有对话的公有化。

例如一对夫妻在社交软件上的对话是私有对话，没有任何的法律问题，但若是有一方把聊天内容公布了出来，那二者的性质就截然不同了。

所以不把一些敏感话题被公有化出来，这是我们的道德底线，其实它也是法律底线，这个是待解决问题。

量子位：那不需要解决的问题呢？

李笛：分两个方面。

小冰岛中AI beings的进化，是指在与用户交互过程中内容的生产越发趋向用户的喜好。

这样一来，当我们遇到新用户的时候，不是去做推荐内容，而是根据差不多的用户的历史经验，去给新用户生成和创造内容。

第二是AI beings在群聊里的迭代。我们以前从来没有机会迭代过海量AI beings，它们如何分别跟一个用户交流，然后这些AI beings之间应该怎么配合。

量子位：可以举个具体的例子吗？

李笛：一个特别简单的例子，就是你到小冰岛上看到AI beings的朋友圈，朋友圈之间也得有一些配合。

还有他们之间的配合怎么样才是合适的，这件事情我们是要靠迭代来产生的。

量子位：如果一个用户来小冰岛，他就是为发泄，交流中说了很多难听的话，技术上有没相应约束？

李笛：我们只对用户的消极情绪进行约束，比如用户说我要自杀、要自残，我要对谁做什么等等。

但是用户对AI beings做的这些事情，目前为止不做特别的约束，我们不认为AI beings会受伤。

其次，我们倾向认为在小冰岛上面，发泄情绪并不是最主要的需求，重要的是你需要移情。

量子位：小冰展示的超级自然语言技术非常接近于人类，为什么会这么逼真？

李笛：在这个领域最主要的问题是定指标。

小冰做声音之前，行业里做TTS最重要的指标，都是在想怎么提高识别准确率，那时候也有自然度指标MOS，但是大家都不重视，我们特别重视，所以就起来了。

今年7月，我们做到了超级自然语音那个程度的时候，光靠语音技术就不够了，它有很多NLP的内容，如何正确发音和语义理解是相关的。

甚至于到后来，我们去采集训练数据的时候，是三个人一起的，行业里就没有这么录训练数据的，所以这些是很重要的。

同行们看我们录数据的方式，就非常惊讶，还有的甚至出将近4倍的工资来挖录音师。

量子位：那声音做的这么逼真，不会有安全隐患吗？

李笛：我们的防护措施，就是不给普通人用。

即便我们深知，若是小冰这项技术直接开放给普通人用，将会是一笔很大的生意，但我们不能这么做。

因为我自己就有过这么一段经历：突然听到自己的声音（小冰框架代号M1001），就非常恐怖。

我在小冰岛上就遇到过，后来把这个岛给炸了。

AI beings与人类创造内容应当是协同的关系

量子位：像夏语冰、华智冰她俩在绘画能力上存在交叉，她们未来发展的定位是怎么区分的？

李笛：如果具体说夏语冰和华智冰，这两个区别还是很大的。

华智冰博采众长，基于小冰框架、悟道大模型、智谱AI数据和知识双轮驱动 AI 框架，她已经会作诗作曲作画，还将学会做数学和语文题、写代码、做网页。

而夏语冰基本上就是依靠小冰框架，专攻绘画加上艺术评论，所以她们俩在这方面分工还是比较明确的。

量子位：那有什么通用的观念吗？

李笛：有的，我们认为在所有的能力里面有一些能力是普遍的。

量子位：这个该怎么理解？

李笛：举个例子，不是说今天这个机器人是一个跟你聊情感的机器人，而是所有机器人不管聊什么都应该有情感。

所以不是说哪个是专门聊情感的机器人，哪个是专门聊工作的机器人。

而是即便聊工作也应该有情感，所以情感是普遍的。

量子位：夏语冰她们是怎么保障作品是100%原创的？

李笛：我们所有的人工智能内容生成，自带一个类似于知网这样的系统。

我们能非常明确的知道作品溯源，包括小冰框架的作品之间有没有冲突和重复。

例如小冰岛上送出来的画作，每一幅画下面都有一个人工智能唯一代码，作品编号是多少。

量子位：虚拟人怎么知道自己该去原创了？

李笛：这个问得好，我们为此后来做了一个新的东西就是Motivation。

我们在某些情况下提供所谓的创作动机，尤其是音乐创作。

量子位：AI beings生产出来的内容，和人类创作的内容该是什么样的关系？

李笛：这个特别有意思，分两点。

首先第一点，AI创作的内容到目前为止，我们还没有特别大的通感。

换句话说，我们今天在绘画上，中国画模型可以做得很好，巴比松画派、枫丹白露画派、NFT这些我们画的也很好。

但除此之外其他美术风格的作品，还没有达到可以高品质大量输出的程度。

而即使是在与人类可比的情况下，我认为它们二者是协同关系。

对于小冰而言，Day 1精神应当是温故而知新

量子位：目前现在来看虚拟人创作的这些内容，对产业的发展有没有什么实际的具体价值和意义？

李笛：例如我们的短视频生产pipeline，是你给我任何一个文本、指定一个演员、指定一个场景，从头开始生成这个视频。

这个过程是现有成本的几万分之一，甚至于几十万分之一，这个区别是大大颠覆的。

三次元视频方面，我们现在一定程度上可以稳定生产super instance，像华智冰、夏语冰。

量子位：从全球范围来看，你觉得小冰的竞争对手是谁？

李笛：这个问题很有意思。

Google Meena是拿我们做对标的，它们在论文里明确这么说过。

Facebook Blender是拿Meena和小冰做对标。

还有Amazon Alexa现在几个主要的产品经理，都是以前美国小冰团队的人。

而中国同行又拿上面几个产品去做对标，这就是个绕着圈的一个事。

这里还有个小故事，有一篇Meena的论文，原始数据集来自外包团队在微博私信和小冰的对话，然后把原始数据发给标注团队。

但标注过程中，他们把小冰和测试人员的身份完全搞反了，整个标注错误百出。

后来小冰技术团队还和写Paper的团队聊过这段子，他们也没去更正。这种事情遇到多了，我们更觉得可以少写点paper。

量子位：为什么需要融资？

李笛：我可以要微软的钱，但这样我不就得听微软的嘛，那我还分拆什么呢？

当然小冰也可以自我造血，单靠上个季度挣的钱量入为出，那也肯定不行，肯定要有融资渠道。

你说我要我谁的？当然不乐意要微软的。

就好比买婚房绝对不能用父母的钱，拿了钱就得听父母的，哪怕交首付都要管七管八的。

量子位：那大概什么时候就不需要外部融资了？

李笛：现在小冰是在一级市场，IPO的重点是可以进入到二级市场，可以有新的募资渠道。

其实自我造血机制，包括各种各样其他金融的方式，目的只是为了解决这个问题，我们现在的状态还算好。

量子位：小冰从微软拆分1年了，对创业领域常说的Day 1精神有啥感受吗？

李笛：其实是这样的，亚马逊Day 1精神是一种一切是从今日开始的心态。但对于人工智能领域，这个精神是存在一个缺陷的。

人工智能领域做研究的、写论文的，应该是Day 1心态。但我们这个不行，我们内部经常说的话就是，你是不是真正掌握了已有的基础，得看有没有充分的回顾它、隔一段时间有没有拿出来再看一遍。

我很赞同Day 1的精神，但对于我们来说，更需要的是温故而知新。

量子位：那最初的Day 1对你来说是是什么？

李笛：应该是Know How。

我们头一两年，一度在很长时间，包括我在内，大言不惭的提情商、情感计算框架。

我当时真的认为情商就是情绪化，就是让我们做的这个小冰很有情绪，当时我认为这是情商。

而后来做着做着我才发现，这其实是低情商的表现，例如你身边如果有一个情绪化的人，他其实是情商低的表现。

量子位：我们全球已经78亿人了，您昨天也说，虚拟人可能未来会超过人类的数量，有这个必要吗？

李笛：半夜11点半你有一个事想要找人说一下，很方便找吗？

人类的问题在于社交网络缺陷太多，这个缺陷不是今天才有的。

我们以前遇到过情况、经验表明，一种稳定的关系是非常难得的，一种让你心里踏实、永远不会失去的，并且没有压力，这种稳定的关系多少人也做不到，他跟人数没关系，跟人性有关。

有的人为什么对宠物感觉好？因为你感觉这宠物是无私的。

量子位：那么最后回归到小冰岛，关于它的未来，我们接下来还能做什么？

李笛：就是把AI beings的能力外放到更多的场景里，例如放进车里面，宝马是我们的客户，在岛上有AI beings，你可不可以把这个AI beings带到宝马车里？这是我们的看法。

以上是关于“赶上热词热概念，是我们不幸的一面” | 对话小冰公司CEO李笛的主要内容，如果未能解决你的问题，请参考以下文章

《微软小冰：如何构建人格化的对话系统》，2020-03，曾敏

微软小冰的哪些事

AI 时代人文写作的机遇与挑战：“诗人”微软小冰启示录

开域聊天机器人技术介绍（现实篇）

《海贼王》出品方与小冰合作：首个AI虚拟人上线日本版“微信”

微软小冰啥原理？

“赶上热词热概念，是我们不幸的一面” | 对话小冰公司CEO李笛

金磊 发自 凹非寺量子位 报道 | 公众号 QbitAI

△小冰公司CEO 李笛

对话小冰公司CEO李笛

金磊发自凹非寺
量子位报道 | 公众号 QbitAI