markdown INT8不造成精度损失的原因
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了markdown INT8不造成精度损失的原因相关的知识,希望对你有一定的参考价值。
8-bit 量化本身不是一个非常激进的压缩策略,不会有严重的精度损失,在fine-tuning之后,由于量化可以带来一定防止over-fitting的作用,所以最终效果反而是有提升的
\begin{aligned} \min _{\mathbf{w}} L(\mathbf{w} ; \mathcal{D}) &=\min _{\mathbf{w}} \frac{1}{n} \sum_{i=1}^{n} \ell\left(\mathbf{w} ;\left(\mathbf{x}_{i}, \mathbf{y}_{i}\right)\right) \\ \text { s.t. } & \mathbf{w} \in \mathbb{R}^{m}, \quad\|\mathbf{w}\|_{0} \leq \kappa \end{aligned}
$\begin{aligned} \min _{\mathbf{w}} L(\mathbf{w} ; \mathcal{D}) &=\min _{\mathbf{w}} \frac{1}{n} \sum_{i=1}^{n} \ell\left(\mathbf{w} ;\left(\mathbf{x}_{i}, \mathbf{y}_{i}\right)\right) \\ \text { s.t. } & \mathbf{w} \in \mathbb{R}^{m}, \quad\|\mathbf{w}\|_{0} \leq \kappa \end{aligned}$
$$
\begin{aligned} \min _{\mathbf{w}} L(\mathbf{w} ; \mathcal{D}) &=\min _{\mathbf{w}} \frac{1}{n} \sum_{i=1}^{n} \ell\left(\mathbf{w} ;\left(\mathbf{x}_{i}, \mathbf{y}_{i}\right)\right) \\ \text { s.t. } & \mathbf{w} \in \mathbb{R}^{m}, \quad\|\mathbf{w}\|_{0} \leq \kappa \end{aligned}
$$
\begin{equation}
\begin{aligned} \min _{\mathbf{w}} L(\mathbf{w} ; \mathcal{D}) &=\min _{\mathbf{w}} \frac{1}{n} \sum_{i=1}^{n} \ell\left(\mathbf{w} ;\left(\mathbf{x}_{i}, \mathbf{y}_{i}\right)\right) \\ \text { s.t. } & \mathbf{w} \in \mathbb{R}^{m}, \quad\|\mathbf{w}\|_{0} \leq \kappa \end{aligned}
\end{equation}
以上是关于markdown INT8不造成精度损失的原因的主要内容,如果未能解决你的问题,请参考以下文章
雪花算法生成唯一ID,前后端不一致
光纤信号衰减的原因
使光纤衰减的原因
004_详解计算机各种语言浮点数运算会存在精度损失原因
在不损失精度的情况下将双精度从 C++ 转移到 python
如何在不损失精度的情况下解码 NSDecimalNumber?