深度学习 CNN 和 RNN 等模型简介
Posted DataFunTalk
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了深度学习 CNN 和 RNN 等模型简介相关的知识,希望对你有一定的参考价值。
编辑整理:Hoh Xil
内容来源:黄浴@知乎
出品平台:DataFunTalk
注:文末有最新自动驾驶沙龙,欢迎报名。
导读:深度学习自从2006年以后已经 "火" 了十多年了,目前大家看到的,最普遍的应用成果是在计算机视觉、语音识别和自然语言处理 ( NLP )。最近工业界也在努力地扩展它的应用场景,比如游戏、内容推荐和广告匹配等等。
深度模型架构分三种:
❶ 前向反馈网络:MLP,CNN
❷ 后向反馈网络:stacked sparse coding, deconvolutional nets
❸ 双向反馈网络:deep Boltzmann machines, stacked auto-encoders
卷积神经网络 ( Convolutional Neural Network, CNN ) 应该是最流行的深度学习模型,在计算机视觉也是影响力最大的。下面介绍一下深度学习中最常用的 CNN 模型,以及相关的 RNN 模型,其中也涉及到著名的 LSTM 和 GRU。
——基本概念——
计算神经生物学对构建人工神经元的计算模型进行了重要的研究。试图模仿人类大脑行为的人工神经元是构建人工神经网络的基本组成部分。基本计算元素 ( 神经元 ) 被称为节点 ( 或单元 ),其接收来自外部源的输入,具有产生输出的一些内部参数 ( 包括在训练期间学习的权重和偏差 )。这个单位被称为感知器。感知器的基本框图如下图所示。
图显示神经元的基本非线性模型,其中 以上是关于深度学习 CNN 和 RNN 等模型简介的主要内容,如果未能解决你的问题,请参考以下文章