Tensoflw.js - 02 - 模型与内存管理(易懂)

Posted xpwi

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Tensoflw.js - 02 - 模型与内存管理(易懂)相关的知识,希望对你有一定的参考价值。

Tensoflw.js - 02 - 模型与内存管理(易懂)

参考 W3Cschool 文档:https://www.w3cschool.cn/tensorflowjs/
本文主要翻译一些英文注释,添加通俗的注释,记录新手使用遇到的小问题,去除不必要的部分,帮助新手快速入门

上一篇介绍了,Tensorflow.js 的安装,张量与变量的表示方法、创建和输出
Tensoflw.js - 01 - 安装与入门(中文注释)
本篇介绍模型与内存管理

Tensorflow.js 模型:

1.在 Tensorflow.js 中,一个模型就是一个给定一些输入将会产生特定的输出的函数。简单来说,一个模型就是一个函数,只是它完成了特定的任务

2.在 TensorFlow.js 中有两种方式来创建模型:

  • 一种是通过操作(ops)来直接完成模型本身所做的工作
  • 另外一种就是通过高级API tf.model 来创建一个模型,显然第二种是更容易的

第一种创建模型的方法:

提示:可能有小伙伴没有看上一篇,可以直接使用在线引入:

<script src="https://cdn.jsdelivr.net/npm/@tensorflow/[email protected]"> </script>
<script>
//直接将代码拷贝到有引入 Tensorflow.js 的 html 中即可
//提示:输出的值都是打印在浏览器开发者工具的控制台,而不是页面上
//定义一个函数进行对输入参数的一系列操作

function predict(input) {
  // y = a * x ^ 2 + b * x + c
  // More on tf.tidy in the next section
  return tf.tidy(() => {
    const x = tf.scalar(input);

    const ax2 = a.mul(x.square());
    const bx = b.mul(x);
    const y = ax2.add(bx).add(c);

    return y;
  });
}

//上一篇介绍的 tf.scalar(零维)
const a = tf.scalar(2);
const b = tf.scalar(4);
const c = tf.scalar(8);

const result = predict(2);
result.print() 

</script>

如上所示,我们定义的 predict 函数就是一个模型,对于给定的输入,我们就可以得到预测的输出。注意:所有的数字都需要经过 tf.scalar() 张量处理

第二种创建模型的方法:
用 TensorFlow.js 中的 tf.model 方法(这里的 model 并不是真正可以调用的方法,而是一个总称,比如实际上可以调用的是 tf.sequential 模型),这在深度学习中是非常流行的概念。 下面的代码就创建了 tf.sequential 模型:

<script>
//直接将代码拷贝到有引入 Tensorflow.js 的 html 中即可
//提示:输出的值都是打印在浏览器开发者工具的控制台,而不是页面上

const model = tf.sequential();
model.add(
  tf.layers.simpleRNN({
    units: 20,
    recurrentInitializer: 'GlorotNormal',
    inputShape: [80, 4]
  })
);

const optimizer = tf.train.sgd(LEARNING_RATE);
model.compile({optimizer, loss: 'categoricalCrossentropy'});
model.fit({x: data, y: labels)});

</script>

Tensorflow.js 内存管理

因为 TensorFlow.js 使用了GPU来加速数学运算,因此当 tensorflow 处理张量和变量时就有必要来管理 GPU 内存。在 TensorFlow.js 中,我们可以通过 dispose 和 tf.tidy 这两种方法来管理内存

dispose
您可以在张量或变量上调用dispose来清除它并释放其GPU内存:

<script>
//直接将代码拷贝到有引入 Tensorflow.js 的 html 中即可
//提示:输出的值都是打印在浏览器开发者工具的控制台,而不是页面上

const x = tf.tensor2d([[0.0, 2.0], [4.0, 6.0]]);
const x_squared = x.square();

x.dispose();
x_squared.dispose();
</script>

tf.tidy
进行大量的张量操作时使用dispose可能会很麻烦。 TensorFlow.js提供了另一个函数tf.tidy,它对javascript中的常规范围起到类似的作用,不同的是它针对GPU支持的张量

tf.tidy执行一个函数并清除所有创建的中间张量,释放它们的GPU内存。 它不清除内部函数的返回值

<script>
//直接将代码拷贝到有引入 Tensorflow.js 的 html 中即可
//提示:输出的值都是打印在浏览器开发者工具的控制台,而不是页面上

const average = tf.tidy(() => {
  const y = tf.tensor1d([1.0, 2.0, 3.0, 4.0]);
  const z = tf.ones([4]);

  return y.sub(z).square().mean();
});

average.print()

</script>

使用 tf.tidy 将有助于防止应用程序中的内存泄漏。它也可以用来更谨慎地控制内存何时回收

两个重要的注意事项:

传递给 tf.tidy 的函数应该是同步的,并且不会返回 Promise。我们建议在 tf.tidy 内不要有更新 UI 或在发出远程请求的代码

tf.tidy 不会清理变量。变量通常持续到机器学习模型的整个生命周期,因此TensorFlow.js 不会清理它们,即使它们是在 tidy 中创建的。不过,您可以手动调用dispose处理它们

以上是关于Tensoflw.js - 02 - 模型与内存管理(易懂)的主要内容,如果未能解决你的问题,请参考以下文章

深入理解计算机系统02ISA 与内存模型

java并发编程:管程内存模型无锁并发线程池AQS原理与锁线程安全集合类并发设计模式

java并发编程:管程内存模型无锁并发线程池AQS原理与锁线程安全集合类并发设计模式

七LED将为我闪烁:控制发光二级管 ——学习笔记

BIM+GIS与三维管廊工程建设

三维管廊大规模实时渲染方案