借阿丽塔的慧眼，带你一起看懂世界

Posted 2021-02-12

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了借阿丽塔的慧眼，带你一起看懂世界相关的知识，希望对你有一定的参考价值。

《阿丽塔·战斗天使》近日在中国内地上映，你有没有和我一样，被硬核少女阿丽塔美丽动人水汪汪的大眼睛迷倒？
技术图片

“如果说眼睛是心灵的窗户，那我们有非常漂亮的大窗户——她的眼睛极其迷人有吸引力，展示了她内心的一切。”这是该电影的导演罗伯特·罗德里格兹面对采访时对女主大眼睛讨论所做出的回应，言语中带着些自豪。他还表示“用放大版的眼睛呈现一个漫画角色”的设定，其实是源于詹姆斯·卡梅隆的坚持。

然而，创造出一双这样逼真的眼睛比我们想象的要难得多。电影的特效团队通过CG技术在制作过程中尝试过各式各样的“眼睛”大小、间距、瞳孔大小、虹膜大小，光是眼珠“虹膜”就运用了830 万多边形数量的几何建模，再从眼球壁到血管膜到视网膜每一层结构的制作和渲染，经过复杂的光路追踪，最终将这双眼睛呈现在观众面前。
技术图片

图片源于网络

// 爱莫里的大眼睛 //

在阿丽塔电影问世很久之前，爱莫的小伙伴们也创造出了一双双炯炯有神的眼睛，虽然这些眼睛没有被搬上大银幕，但他们的目标也是让计算机能像阿丽塔一样，更好地看见、看懂这个世界。先来看看这些杰作：

技术图片

爱莫的小伙伴们创造的眼睛成为了让神经网络不断进化升级的驱动力。

这些年无论是下围棋无敌手的AlphaGo，还是比电视播音员发挥稳定的虚拟播音，都离不开人工智能领域最火热的技术——深度学习。深度学习的效果非常棒，但“胃口”却特别大，是被称为Data-Hungry的“怪物”，没有几百上千万的数据量，它都纹丝不动。

所以，呕心沥血的工程师们只能依靠大量的手工标注样本数据来“打动”深度学习，人工智能变成了：有多少“人工”就有多少”智能”。

拿简单的眼球跟踪和视线估计问题来说，如果要给眼球周围打上点，需要收集至少100万张眼睛图片，然后每天一人标注100张（绝对让人热血澎湃精疲力尽），团队20人需要整整500天才能完成任务。标注眼睛点还算好，视线可就难了，一张图片要把眼睛看的方向（α / β / Φ 角度）标注出来非常不容易，两个人标注出来的结果都可能差别巨大。而数据标注工厂开价也不低，很多和爱莫一样的创业公司必须精打细算用好每一分钱。

动手效率太低，爱莫的小伙伴们只能动脑了，虽然一直从事的是计算机视觉（以下简称CV）技术，这次必须求助于与CV相爱相杀的CG技术了。

爱莫通过自研CG引擎，对眼部结构、眼部纹理、肌肉肌理、运动模式等进行高精准建模，目的就是“以假乱真”，让计算机和深度学习算法完成由虚（虚拟模型）到实（真实应用）的过渡。采用这种方式可以源源不断产生数据，并且，这些数据还可以按需产生，眼球的转向完全可控，使得数据分布非常均匀，训练出来的神经网络深度学习模型，就可以勇敢面对真实世界的所有场景了。

这样的技术已经被团队广泛应用到驾驶员状态监测、人机交互、AR眼镜、新零售用户关注点分析等领域。
技术图片

爱莫车载视觉管理应用案例展示

这些眼睛为爱莫的技术拓展带来新思路，尝到自动数据标注的甜头，他们把CG引擎扩展到人脸3D渲染、身体3D渲染中去，对表情变化、光照变化、姿态变化等进行了高逼真的仿真，填补真实采集的数据分布不均的缺陷，同时大大减少了人力标注的成本，并且使得训练出来的人工智能模型在与对手的pk中争取更大优势，特别是在处理“疑难杂症”上，优势更为明显，比如在人脸识别中，因为对不同角度和光照条件都进行了很好的模拟，可以轻松完成大角度、复杂光照环境下的人脸准确识别。