量化如何以及何时在 TFLite 图中起作用？

Posted 2023-02-16

技术标签:

【中文标题】量化如何以及何时在 TFLite 图中起作用？【英文标题】：How and when does quantization work in a TFLite Graph? 【发布时间】：2018-10-20 08:40:48 【问题描述】：

我有一个 TF 模型，它经过量化训练、冻结、使用 TOCO 转换为 tflite，现在我有了 TFLite html 图形模型和 json。

我可以看到，对于我图中的每个张量，每个张量都有量化属性（最小值、最大值、比例、零点），我正在尝试确定这些属性中的每一个如何应用于每个张量。

例如，我理解representation of quantized data，并且我可以理解采用量化的权重/偏差、乘以比例并加上最小值会返回原始权重/偏差（几乎）。

我不明白的：

为什么有些张量有量化属性（如 Relu、Sigmoid）但没有内在参数（如权重和偏差）？是不是因为它们是输出张量，并且在数据输入到下一个操作之前应用了量化？在模型的数据流期间在哪些点（如果有）应用量化？例如，假设有一个浮点图像张量通过了 conv2d 操作 - weights/bias/relu 的量化属性在哪里以及如何用于获取 conv2d 操作的输出？

本质上，如果我将 TFLite 模型数据解析为一个 numpy 数组，那么我需要了解关于通过网络的数据流（关于量化）的所有信息，以便重新创建模型从头开始推理。

我似乎找不到任何关于此的文档。任何帮助将不胜感激。

【问题讨论】：

【参考方案1】：

卷积内循环对 uint8 值进行 macc。还有一个较小的外部循环用于计算 macc 的 z 偏移部分。在每个内核卷积结束时，您需要使用 input_scale * kernel_scale / output_scale 的缩减乘数从 int32 累加器缩减到 8 位 uint8 范围。这三个比例值是在训练期间学习的，位于 tflite 推理文件中。本文解释了这些操作。 http://openaccess.thecvf.com/content_cvpr_2018/papers/Jacob_Quantization_and_Training_CVPR_2018_paper.pdf

【讨论】：

我可以找到input_scale 和kernel_scale，但是在量化模型中我可以在哪里找到output_scale？

以上是关于量化如何以及何时在 TFLite 图中起作用？的主要内容，如果未能解决你的问题，请参考以下文章