手机影像二十载，AI多摄会是终极答案吗？

Posted 2021-11-05 脑极体

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了手机影像二十载，AI多摄会是终极答案吗？相关的知识，希望对你有一定的参考价值。

上世纪20年代，拉兹洛·莫霍利·纳吉曾说，“不懂得摄影的人，便是将来的文盲”。如今大规模普及的手机摄影，正好说明了这句话惊人的预见性。自拍、合影、短视频……按下手机拍照键记录生活，几乎成了人的本能。

《2020中国人工智能手机白皮书》数据显示，“拍摄”是2019年中国用户最关注的手机功能，远超其他应用。为了迎合消费者的需求，手机厂商们自然也将目光和火力都集中在影像能力的塑造上。

以至于近年摄影能力几乎占据了新品发布会的高光时刻，手机新品海报也几乎被摄像头画面包揽。厂商们在分辨率数字上互相碾压，摄像头数量也开始内卷，手机背面的开孔一个比一个多，四摄、长焦、微距恨不得都塞到框里来……

多摄像头基础上的AI计算摄影，逐渐成为主流旗舰机的标配。接下来，手机摄影将向哪里走？

以史为鉴，可知兴替，我们不妨先回溯一下手机影像能力的进化轨迹，找到未来的发展路径。

时间简史：

手机摄影的曲折往事

随着手机摄像头越来越多、模组越来越厚，开始有人觉得，现在的手机摄影有点过于内卷，真的有必要吗？回到历史上的一些决定性时刻我们发现，影像技术的每一次内卷，都推动了创新步伐的加速。

手机如何塑造出移动影像能力，大概分为四个时期：

1.萌芽时期。

2000年11月，夏普发行了第一个真正的相机手机J-Phone。行业很快发现，智能手机中的摄像头将成为未来的主要功能。Canalys报告显示，2004年第三季度售出的手机中，有三分之二都是相机手机。

2.黄金时期。

2006年，诺基亚将相机手机推向了新的高度，拥有200万像素的摄像头，卡尔蔡司光学元件、自动对焦和LED闪光灯。LG与德国光学巨头施耐德合作。这一阶段，手机影像纷纷开启了拥抱专业科技的进击之路，尝试突破智能手机成像功能的极限。

3.滞缓时期。

随着智能手机的起飞，改进手机摄像头的竞争稍有停顿，主要是因为智能手机要求纤薄，强大的相机手机有些笨重。于是，手机厂商开始思考多摄像头阵列。2010年苹果iPhone 4等手机将自拍（前置摄像头）带入智能手机市场，计算摄影开始成为手机影像的创新方向。

4.智能时期。

受手机空间和模组尺寸的影响，手机不可能无止境地增加元器件。真正让手机摄影成为大多数用户的选择，是AI算法与多摄像头合并，带来前所未有的镜头效果。

AI如同一个光影魔术手，通过一系列智能摄影功能，将计算摄影提升到一个新的水平，成为多摄像头不可或缺的伙伴。也是在这一时期，移动设备和专业相机之间的界限才开始消弭，我们不再质疑为什么专业人士也要用手机拍照片拍电影。

经过了一轮轮的迭代升级，手机拍摄能力才真正变得举足轻重，让普通人可以拍出精彩的作品、记录生活的点滴。

成像挑战：

AI多摄要跨越的三重门

可以说，摄影这门艺术，发展历史的每一个刻度，都铭刻着技术进步的烙印。AI多摄成为大势的背后，也是一众科技企业的技术长跑，其中既有华米OV这样的手机厂商，也有旷视这样的AI公司，和代工厂、供应链企业的努力。

比如在硬件上，增加CMOS可以提升成像质量，但也会增加手机存储读写的效率压力和功耗，手机厂商不得不在硬件上做大量突破。像是SoC工艺的应用，光学变焦潜望式镜头，堆栈式感光元件等等，手机厂商不断追求轻薄与成像的平衡。

既然是计算摄影，自然也离不开算力的支持。很多头部手机厂商都研发并应用了专门的AI芯片，以提升手机的计算性能，以支撑AI多摄的算力需求。

另一个必不可少的，则是算法。

10月12日旷视在其MegTech Lite漫谈AI技术分享会上，就提到了移动摄影的技术挑战，展示了旷视在AI多摄领域所做的大量技术创新和实践成果。简单来说，要让手机摄影达到媲美专业单反的效果，主要有三重挑战：

挑战之一，变焦。

我们知道，专业摄影师拍摄不同题材要用到不同的焦段，比如大场景自然风光适合12到24毫米，人像就要85到135毫米，而一部手机想要应对这么多题材，就需要多个摄像头来支撑。随着手机后置摄像头的数量和类别不断增加，主摄、广角、超广角、长焦、微距等五花八门，不可能全部打开。而AI算法可以有效弥补手机的硬件局限性，协调更多镜头组，来实现近似单反的变焦效果。

那么，怎么搭配组合才能让手机的变焦过程变得丝滑呢？越好的算法越能够消除不同摄像头接缝处的违和感，实现1+1大于2的成像效果。以旷视的平滑变焦算法为例，可以支持超广角+广角、广角+长焦等多种镜头组合，变焦过程平滑自然，不会出现黑区。

挑战之二，虚化。

专业单反的另一个厉害之处，就是有质感的虚化，人像或物体清晰而背景变虚，让画面更有故事感。但很多手机的虚化功能，成片看起来似乎总有点廉价，问题之一就出在算法上。

因为手机不可能装下一个直径4厘米的大光圈，虚化效果靠的是两个镜头来制造视差，模拟出大光圈的效果。如果算法不够强，没能精准测距，对画面上非常细节的部分进行计算，自然很难还原出高质量的视差效果。

据透露，旷视基于深度学习的双摄虚化算法，可以准确地计算出深度信息，实现非常精细的虚化效果，能够把消防栓孔的细节都恢复出来。

挑战之三，融合。

不同摄像头除了焦距不同，感光度也不同，如果能把不同能力的摄像头融合起来，就能获得双重效果。比如把一个对颜色感知能力强的摄像头和对结构感知能力强的摄像头融合起来，可以让画面变得既有颜色又有细节。

但做好这一点并不容易。因为两个摄像头拍摄的画面场景里出现的物体可能并不一模一样，会形成一定的视野盲区。想要把两张图融合成一张，就需要靠算法进行计算处理，比如把缺失的图像部分用AI“脑补”出来、将重合的部分对齐等等，从而提升成像质量。

可以说，利用AI算法能够有效弥补硬件局限，更好地调度镜头、理解意图、优化成像，达到近似单反的拍照效果。这时候，移动影像也就有了质感之美、多元之美、创作之美。

光之传奇：技术与艺术的结合体

多摄像头的趋势下，AI算法的重要性越来越不可忽视，角色有点像战场的指挥官，要在拍摄时让不同摄像头打好配合战，借助焦段、清晰度、感知度等等，实现1+1大于2的成像效果。

而旷视这样的AI公司的参与，也给计算摄影的创新演进带来了新思路。比如用AI重新定义光感知系统的理念，就是由旷视提出的。目前，旷视为多款主流安卓智能手机提供一系列计算摄影解决方案。从旷视对AI与光感知系统的思考中，或许我们可以窥见计算摄影的进化之路。

简单来说，光感知协同进化，就是将原本相对独立的光学系统、传感系统、计算系统，统一纳入到算法考量思考中来。旷视利用深度神经网络，让光、感、知系统充分协作，释放出移动摄影的最大价值，带来指数级的成像效果提升。

就拿最直观的画质来说，要提升成像画质，传统做法可能是各个系统分别优化，比如采用更好的镜头组件、更高性能的处理器，提升镜头传感器的像素等等，这种A+B+C的模式，可以提升成像质量，同时也会给储存、计算、功耗带来压力。

而旷视的计算摄影解决方案则是用AI算法配合光感知系统，进行全流程协同升级。算法协同光感知系统共同发力，获得高品质画面的同时，也减少了对硬件系统的依赖，提升了数据处理能力和时效性，让画面输出更加稳定、快捷，实现了A x Bx C的指数性改变。

可以肯定的是，未来的手机摄影，将在AI的加持下，变得更懂用户、更懂画面，从“所见即所得”到“所想即所得”。终有一天，手机拍摄的景物将和我们眼中所见、心中所想的美景一般无二。

每一个平凡的角落，都值得我们去注视，这是人为什么需要手机摄影。

从历史上的一次次突破，到今天AI重新定义光感知系统，可以看到，手机影像的技术追求和艺术追求，一直未曾停止。软硬件协同的AI多摄，作为数字生活的记录者，在每一个人手中与眼中，书写着智能时代的光之传奇。

科技企业，不仅是手机摄影技术的探路者，更是摄影艺术的同路人。探索永无止境，值得欣喜的是，今天的中国AI企业，已经在路上。

以上是关于手机影像二十载，AI多摄会是终极答案吗？的主要内容，如果未能解决你的问题，请参考以下文章

一声快门和三个时代：全球移动影像二十年

Python遥感图像处理应用篇(二十二)：Python+GDAL 批量等距离裁剪影像

Python遥感图像处理应用篇(二十二)：Python+GDAL 批量等距离裁剪影像-续

Python遥感图像处理应用篇(二十三)：Python+GDAL 批量拼接图像