3分钟带你入门人工智能?互联网巨头都在用的高能算法,干了它!

Posted 不加班的程序员小二

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了3分钟带你入门人工智能?互联网巨头都在用的高能算法,干了它!相关的知识,希望对你有一定的参考价值。

       今天就带大家来扒一扒互联网巨头都在使用的人工智能AI算法,帮助想要入门人工智能领域的小伙伴有个全面的认知,这里会从实战出发,带大家快速入门。

       人工智能的应用可以分为四个部分:感知能力(类似于人类的看听说读写等能力,是AI目前的焦点之一);认知能力(基于感知能力更上一层的分析和认知能力);创造力和智能(更深层次的探索和创造)。这里我们先讲一下应用最广的感知能力-看,是AI学习一切能力的基础。专业术语就是我们的计算机视觉。

一、图像分类、目标检测和图像分割

1、图像分类

     就是对于一副图像,算法识别它是谁

2、目标检测:

还是对于一副图像,算法识别它在哪

3、图像分割

又是对于一副图像,算法识别相对于检测更加精准的位置。

        举个例子,你们女朋友淘宝经常会用到的拍照识别找同款功能就是用到了检测和分类的算法。相同的应用还有很多,比如百度的拍照识别功能,微信的扫一扫也有拍照识别物品的功能,大家可以亲自去体验一番,这里不深入探究,单从基础功能来帮大家有一个基本认知。

       除了应用到互联网产品中,还有城市要道出入口汽车数目的计数统计、大型超市货架上的商品检测,一旦缺货,商家就可以及时补货。还有每天都会打开的百度地图、高德地图的自动驾驶技术都涉及到了大量的分类、检测和分割技术。而在医学领域,病灶、肿瘤的分割等都应用到了分割技术,起到辅助诊断的作用。好了,应用先讲到这里,还有什么应用,欢迎大家在评论补充和探讨。

这上面说的这些应用都可以用这些算法实现,想要学习,从这些算法入手即可。

二、人脸、人体、手势识别

1、人脸

        首先是我们的人脸检测和人脸识别,这两个是分不开的,底层原理实现还是目标检测和图像分类技术,这里检测的范围对象只针对人,不再是检测各种物体了,这里的应用大家绝对熟悉,就是支付宝微信等各种app的人脸认证,超市的刷脸支付简直无处不在,真的是太方便了。这部分的学习推荐Openface和InsightFace,有一点基础的话,分分钟入手。

        第二就是我们的人脸编辑,就是对人脸属性的一种编辑,在这上面,你可以改变人脸的性别、年龄、发质等属性,这里推荐ALAE算法,学会了这个算法,你可以制作很多有趣的特效,比如抖音之前很火的一个变性特效也是应用了这方面。

2、人体

       人体包括人体抠图、姿态估计、基于骨架的动作识别、行人重识别。

       抠图底层也是分割算法的一种,比如B站、爱奇艺的视频弹幕会跑到人的后面,直播中会去掉背景都是抠图算法的应用,推荐MODNet,效果真的是快又好。

      姿态估计和基于骨架的动作识别都是对于人体的一种姿态估计,可以用真人来驱动虚拟形象以及行为分析。比如几个星期前奥运会夺金的中国高科技。

     行人重识别则可以辅助刑侦,可以通过一个视频中出现的人物快速定位到其他视频中他的身影,对其进行初步筛选。

3、手势识别

        除娱乐化应用外,还可以帮助聋哑人做到手语识别,不过这个要更复杂一些。人体算法有很多,这里推荐的都是一些主流算法,是可以带领大家快速入门的一些算法,感兴趣可以看看。

三、图像生成、风格迁移、降噪、超分辨率重建和图像修补

1、图像生成和风格迁移

        图像生成算法推荐:DeOldify为照片上色,修复珍贵的历史资料;StyleGAN则可以生成逼真的但是并不客观存在的人物肖像,比如网红脸、超模脸、混血人脸、黄种人脸等。First  Older  Motion  Model是最好玩的,一阶段运动模型,学会它随时可以来一段蒙娜丽莎的深情演

        风格迁移中如Stylized  Neural  Painting跟着照片一笔一划就可以成为油画大师,想要二次元风格滤镜就一定是AnimeGAN。

2、降噪、超分辨率重建、图像修补和图像修复

       这里面比较好玩的还有PULSE,本质上是一种超分辨率重建算法,可以帮你去除万恶的马赛克;修改图片,摘掉眼镜,换个刘海等等SC-FEGAN算法都可以帮你一键搞定,而我们的Old Photo Restoration算法顾名思义可以去除褶皱,修复老照片。

 这一部分的算法基本上是以GAN为主,想要学习,可以先看看对抗神经神经网络基础知识。

 四、其他能力

       深度估计就是对一幅图像的深度进行估计,简单点讲就是预测每个像素点的深度值;目标跟踪通常是配合目标检测一起使用的,跟踪某个特定的目标;OCR就很熟悉了,最简单的应用场景就是高速收费站、停车场的车牌识别了,更复杂一点的还有身份证、银行卡、发票、火车票等一些列文字场景的应用了。算法的话可以看看下面的主流算法,帮你快速入门。

       好了,今天就先扒到这里,明天继续。这部分算法思维导图和代码教程+Q裙361121142,免费领取!!

以上是关于3分钟带你入门人工智能?互联网巨头都在用的高能算法,干了它!的主要内容,如果未能解决你的问题,请参考以下文章

8分钟带你入门人工智能,互联网大厂都在用的高能AI算法

8分钟带你入门人工智能,互联网大厂都在用的高能AI算法

8分钟带你入门人工智能,互联网大厂都在用的高能AI算法

硬核 | 带你开发一个智能家居项目

三分钟带你入门redis高可用架构之哨兵模式,一文轻松搞定

华为阿里小米都在用的全屋智能技术