caffe blob理解
Posted 去做点事情
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了caffe blob理解相关的知识,希望对你有一定的参考价值。
blob数据结构是caffe中基本的数据存储单元,它主要存储的数据是网络中的中间数据变量,比如各层的输入和输出;代价函数关于网络各层参数的梯度。
blob中除了存储数据外,还有一些标记数据的参数,以下就是一些blob中的数据成员:
protected: shared_ptr<SyncedMemory> data_; shared_ptr<SyncedMemory> diff_; shared_ptr<SyncedMemory> shape_data_; vector<int> shape_; int count_; int capacity_
data_:表示网络各层的输入和输出;
diff_:表示代价函数相对于各层参数的梯度;
shape_:是一个可变数组,shape_中主要存储4个变量:num表示一个batch中的样本数量,从这我们可以看出Blob的存储是以batch为基本单位的;channels表示对应层的通道,比如卷积层有20个卷积核,channels的值就是20;height和width就表示单个数据的尺寸,可能是一副图像的尺寸,也可能表示卷积核的尺寸,在每一层所代表的含义也不相同。
count_:表示这个Blob里已经存储的元素的个数;
capacity_:表示这个Blob的容量;
Blob同时保存了data_和diff_,其类型为SyncedMemory的指针,注意是指针。
Blob中除了数据成员之外,也有很多用于操作数据的函数成员,下面就说几个比较重要的:
void Blob<Dtype>::Reshape():这个函数是在原来分配的内存不够的情况下重新分配内存。
const Dtype* Blob<Dtype>::cpu_data():这个是获取Blob结构体中的data_数据的指针,同时限制不能对返回的指针指向的内容进行更改。
const Dtype* Blob<Dtype>::cpu_diff():这个是获取Blob结构体中的diff_数据的指针,同时限制不能对返回的指针指向的内容进行更改。
Dtype* Blob<Dtype>::mutable_cpu_data():获取Blob结构体中的data_数据的指针,同时可以对指针指向的内容更改。
Dtype* Blob<Dtype>::mutable_cpu_diff():获取Blob结构体中的diff_数据的指针,同时可以对指针指向的内容更改。
void Blob<Dtype>::ShareData(const Blob& other):让其他Blob的data_数据和当前Blob共享。
void Blob<Dtype>::ShareDiff(const Blob& other):让其他Blob的diff_和当前的Blob共享。
在blob.hpp中还有这样几个定义:
按照注释的意思,这几个函数和shape()是一样的作用。shape本身是一个vector,这个vector的size为4,第一个位置存储图片的个数,第二个存储channel的个数,以此类推。
逻辑上看,blob是一个四维数组。但实际上,因为数组的存储是在内存中开辟一块连续的、大小相同的的空间,所以blob的存储应该是一个一维的存储结构。只不过是利用四个参数来进行寻址(shape_里的四个参数)。并且blob是行优先的存储方式。
所以对于一个(n, k, h, w)的blob,他的维度就是n*k*h*w,在(n, k, h, w)位置的值物理位置为((n * K + k) * H + h) * W + w。
以Blob中二维矩阵为例(如全连接网络shape (N, D)),如图所示。同样的存储方式可以推广到多维。
动态多维数组:Blob 类可以动态改变数组的尺寸,当拓展数组导致原有内存空间不足以存放下数据时 (count > capacity),就会重新分配内存。Blob 提供了一组 Reshape 函数来完成这个功能。
void Reshape(const int num, const int channels, const int height, const int width); // Deprecated
void Reshape(const vector<int>& shape);
void Reshape(const BlobShape& shape);
void ReshapeLike(const Blob& other);
Blob 类在初始化时并没有分配内存,也是通过调用 Reshape 来分配内存的。
template <typename Dtype> void Blob<Dtype>::Reshape(const vector<int>& shape) { CHECK_LE(shape.size(), kMaxBlobAxes); // 检查维数 count_ = 1; // 用于计算新的多维数组的大小 shape_.resize(shape.size()); // 更新维数 if (!shape_data_ || shape_data_->size() < shape.size() * sizeof(int)) { // shape_data_ 未初始化或者内存太小 shape_data_.reset(new SyncedMemory(shape.size() * sizeof(int))); } int* shape_data = static_cast<int*>(shape_data_->mutable_cpu_data()); for (int i = 0; i < shape.size(); ++i) { CHECK_GE(shape[i], 0); CHECK_LE(shape[i], INT_MAX / count_) << "blob size exceeds INT_MAX"; count_ *= shape[i]; shape_[i] = shape[i]; shape_data[i] = shape[i]; } if (count_ > capacity_) { // 内存不够 capacity_ = count_; data_.reset(new SyncedMemory(capacity_ * sizeof(Dtype))); diff_.reset(new SyncedMemory(capacity_ * sizeof(Dtype))); } }
http://blog.csdn.net/qq_14975217/article/details/51524042
http://blog.csdn.net/mounty_fsc/article/details/51085654
http://blog.csdn.net/buyi_shizi/article/details/51506853
http://blog.csdn.net/jyl1999xxxx/article/details/53981813
以上是关于caffe blob理解的主要内容,如果未能解决你的问题,请参考以下文章