torchnet.meter使用教程

Posted 夏小悠

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了torchnet.meter使用教程相关的知识,希望对你有一定的参考价值。

文章目录

前言

  最近项目开发过程中遇到了torchnet.meter来记录模型的信息,搜了好多篇博客都寥寥草草没有一点干货,于是博主看了下官方文档以及开放的代码,根据自己的理解,在此做一个torchnet.meter的使用教程。

1. torchnet简介

  torchnettorch的一个框架,它提供了一套抽象概念,旨在鼓励代码复用和模块化编程,其提供了四个重要的类:

说明
Dataset提供Dataset接口,类似于pytorch
Enginetrain/test机器学习算法
Meter提供了一种在线跟踪重要统计数据的方法
Log将性能信息或其他模型信息输出到文件

  每个Meter子类都有三个方法:

方法说明
add(value)meter中添加一个值
reset()重置meter为默认设置nan
value()获取当前状态下meter的值

2. Classification Meters

2.1 APMeter

  APMeter计算每个类的AP,即平均精度average precision

import torch
from torch.nn import functional as F
from torchnet import meter as tnt


seed = 1024
torch.manual_seed(seed)

# 128条数据, 10个类别
size = (128, 10)
output = torch.rand(size=size)
output = F.softmax(output, dim=1)
target = torch.randint(0, 2, size=size)

aper = tnt.APMeter()
aper.add(output, target)

"""
add(output, target, weight=None):
	output: 模型的输出, 是一个NxK的tensor, 表示每个类别的概率, N表示样本数目, K表示类别数目, 所有类别的概率总和应为1
	target: 样本的标签, 是一个NxK的二进制tensor, 即其值只能是0(负样本)或1(正样本)
	weight: 可选参数
"""

print('AP: ', aper.value().numpy())
print('mAP: ', aper.value().sum().numpy() / 10)
# AP:  [0.535214  0.6198798  0.59850764  0.527964  0.4984482  0.5188082  0.5916564  0.41430935  0.48577505  0.41956347]
# mAP:  0.5210125923156739

  详细参数可参见官方文档

2.2 mAPMeter

  mAPMeter计算所有类别的mAP,即平均AP

import torch
from torch.nn import functional as F
from torchnet import meter as tnt


seed = 1024
torch.manual_seed(seed)

# 128条数据, 10个类别
size = (128, 10)
output = torch.rand(size=size)
# output /= output.sum(dim=1).unsqueeze(dim=1).expand(size=size)
output = F.softmax(output, dim=1)
target = torch.randint(0, 2, size=size)

maper = tnt.mAPMeter()
maper.add(output, target)

"""
add(output, target, weight=None):
	output: 模型的输出, 是一个NxK的tensor, 表示每个类别的概率, N表示样本数目, K表示类别数目, 所有类别的概率总和应为1
	target: 样本的标签, 是一个NxK的二进制tensor, 即其值只能是0(负样本)或1(正样本)
	weight: 可选参数
"""

print('mAP: ', maper.value().numpy())
# mAP:  0.5210126

  详细参数可参见官方文档

2.3 ClassErrorMeter

  ClassErrorMeter计算模型的accuracy,即准确率。

import torch
from torch.nn import functional as F
from torchnet import meter as tnt


seed = 1024
torch.manual_seed(seed)

# 128条数据, 10个类别
size = (128, 10)
output = torch.randn(size=size)
output = F.softmax(output, dim=1)
target = torch.randint(0, 10, size=(128,))

# 计算acc1和acc5, 默认计算acc1, 即topk=[1]
classer = tnt.ClassErrorMeter(topk=[1, 5], accuracy=True)
classer.add(output, target)

"""
add(output, target):
	output: 模型的输出, 是一个NxK的tensor, 表示每个类别的概率, N表示样本数目, K表示类别数目, 所有类别的概率总和应为1
	target: 样本的标签, 是一个长度为N的tensor, 标签id从0开始
"""

print('acc1: 0%, acc5: 1%'.format(classer.value()[0], classer.value()[1]))
# acc1: 11.71875%, acc5: 56.25%

  详细参数可参见官方文档

2.4 ConfusionMeter

  ConfusionMeter计算多分类模型的confusion matrix,即混淆矩阵。不支持 multi-labelmulti-class问题,对于这类问题可以使用 MultiLabelConfusionMeter

import torch
from torch.nn import functional as F
from torchnet import meter as tnt


seed = 1024
torch.manual_seed(seed)

size = (128, 10)
output = torch.randn(size=size)
output = F.softmax(output, dim=1)
target = torch.randint(0, 10, size=(128,))

# k表示类别的数目, normalized表示是否对混淆矩阵进行归一化, 默认False
confer = tnt.ConfusionMeter(k=10, normalized=False)
confer.add(output, target)

"""
add(output, target):
	output: 模型的输出, 是一个NxK的tensor, 表示每个类别的概率, N表示样本数目, K表示类别数目, 所有类别的概率总和应为1
	target: 样本的标签, 是一个长度为N的tensor, 标签id从0开始
"""

print('confusion matrix: \\n', confer.value())
# confusion matrix: 
 [[1 1 2 1 0 0 0 1 1 0]
 [0 1 1 4 1 1 1 0 2 2]
 [0 2 2 1 0 1 0 2 1 2]
 [1 0 1 0 1 5 0 1 3 0]
 [3 3 3 1 1 1 3 1 0 3]
 [1 2 1 2 2 3 3 0 4 1]
 [1 1 1 0 1 1 0 2 0 2]
 [1 1 1 1 0 1 2 2 1 2]
 [2 0 0 0 1 0 1 2 2 3]
 [1 1 3 1 1 1 0 1 3 3]]

# normalized=True 
# confusion matrix: 
 [[0.14285715 0.14285715 0.2857143  0.14285715 0.         0.         0.         0.14285715 0.14285715 0.        ]
 [0.         0.07692308 0.07692308 0.30769232 0.07692308 0.07692308 0.07692308 0.         0.15384616 0.15384616]
 [0.         0.18181819 0.18181819 0.09090909 0.         0.09090909 0.         0.18181819 0.09090909 0.18181819]
 [0.08333334 0.         0.08333334 0.         0.08333334 0.41666666 0.         0.08333334 0.25       0.        ]
 [0.15789473 0.15789473 0.15789473 0.05263158 0.05263158 0.05263158 0.15789473 0.05263158 0.         0.15789473]
 [0.05263158 0.10526316 0.05263158 0.10526316 0.10526316 0.15789473 0.15789473 0.         0.21052632 0.05263158]
 [0.11111111 0.11111111 0.11111111 0.         0.11111111 0.11111111 0.         0.22222222 0.         0.22222222]
 [0.08333334 0.08333334 0.08333334 0.08333334 0.         0.08333334 0.16666667 0.16666667 0.08333334 0.16666667]
 [0.18181819 0.         0.         0.         0.09090909 0. 0.09090909 0.18181819 0.18181819 0.27272728]
 [0.06666667 0.06666667 0.2        0.06666667 0.06666667 0.06666667 0.         0.06666667 0.2        0.2       ]]

  详细参数可参见官方文档

3. Regression/Loss Meters

3.1 AverageValueMeter

  AverageValueMeter计算均值和标准差。

from torchnet import meter as tnt


avger = tnt.AverageValueMeter()

for i in range(10):
    avger.add(i)

"""
add(value):
	value: 一个数值
"""

print('mean: 0, std: 1'.format(avger.value()[0], avger.value()[1]))
# mean: 4.5, std: 3.0276503540974917

  详细参数可参见官方文档

3.2 AUCMeter

  AUCMeter计算AUC,即ROC曲线下的面积,用于二分类。

import torch
from torch.nn import functional as F
from torchnet import meter as tnt


seed = 1024
torch.manual_seed(seed)

size = (128, )
output = torch.randn(size=size)
output = F.sigmoid(output)
target = torch.randint(0, 2, size=size)

aucer = tnt.AUCMeter()
aucer.add(output, target)

"""
add(output, target):
	output: 模型的输出分数, 是一个一维的tensor
	target: 样本的标签, 也是一个一维的tensor, 其值只能是0(负样本)或1(正样本)
"""

print('AUC: ', aucer.value()[0])
# AUC:  0.5208791208791209

  详细参数可参见官方文档

3.3 MovingAverageValueMeter

  MovingAverageValueMeter计算当前状态前windowsize个数的均值和标准差,即计算最后windowsize个数的均值和标准差。

from torchnet import meter as tnt


# windowsize 需要计算的个数
mavger = tnt.MovingAverageValueMeter(windowsize=5)

for i in range(10):
    mavger.add(i)

"""
add(value):
	value: 一个数值
"""

print('mean: 0, std: 1'.format(mavger.value()[0].item(), mavger.value()[1]))
# mean: 7.0, std: 1.5811388300841898

  详细参数可参见官方文档

3.4 MSEMeter

  MSEMeter计算模型的MSE,即均方误差。

from torchnet import meter as tnt


seed = 1024
torch.manual_seed(seed)

size = (128, 10)
output = torch.randint(0, 10, size=size)
target = torch.randint(0, 10, size=size)

mser = tnt.MSEMeter(root=False)
mser.add(output, target)

"""
add(output, target):
	output: 模型的输出类别, 是一个NxK的tensor
	target: 样本的标签, 也是一个NxK的tensor
"""

print('MSE: ', mser.value().item())
# MSE:  17.3515625

  详细参数可参见官方文档

4. Miscellaneous Meters

4.1 TimeMeter

  TimeMeter可以用来计算模型处理数据的时间。

from torchnet import meter as tnt


def my_model():
    tmp = 1
    for i in range(10000000):
        tmp *= 1024 * 10.24 * (i+1)

# unit=False, 统计总的消耗时间
# unit=True, 统计平均消耗时间
timer = tnt.TimeMeter(unit=False)
for epoch in range(10):
    my_model()
    # timer.value()

print('all time: ', timer.value())
# all time:  8.787968158721924

  然而,当我将unit=True时,发现并没有得到平均消耗时间时间,看了下官方的代码,发现并没有统计次数的操作,官方是这样说的:
  `value()` returns the time passed since the last `reset()`; divided by the counter value when `unit=true`.
  所以重新封装了一下TimeMeter

import time
from torchnet import meter


class TimeMeter(meter.TimeMeter):
    """
    <a name="TimeMeter">
    #### tnt.TimeMeter(@ARGP)
    @ARGT

    The `tnt.TimeMeter` is designed to measure the time between events and can be
    used to measure, for instance, the average processing time per batch of data.
    It is different from most other meters in terms of the methods it provides:

    The `tnt.TimeMeter` provides the following methods:

       * `reset()` resets the timer, setting the timer and unit counter to zero.
       * `value()` returns the time passed since the last `reset()`; divided by the counter value when `unit=true`.
    """

    def __init__(self, unit):
        super(TimeMeter, self).__init__(unit)
        self.unit = unit
        self.reset()

    def add(self, value=None):
    	"""rewrite the method"""
        self.n += 1

    def reset(self):
        self.n = 0
        self.time = time.time()

    def value(self):
    	"""add a counter"""
        if self.unit:
            return (time.time() - self.time) / self.n
        return time.time() - self.time

  再次计算,将unit=True

timer = tnt.TimeMeter(unit=True)
for epoch in range(10):
    my_model()
    timer.add()

print('mean time: ', timer.value())
# mean time:  0.8796965837478637

  详细参数可参见官方文档

结束语

  以上的例子均来自博主对官方文档以及官方代码的理解,由于在开发的过程中,meter下的子类并没有全部用到过,可能部分示例给的不到位或存在些许问题,如有疑问,可在评论区下方留言交流!!!

以上是关于torchnet.meter使用教程的主要内容,如果未能解决你的问题,请参考以下文章

torchnet.meter使用教程

python系列教程198——任意数目的参数

python系列教程198——任意数目的参数

python系列教程198——任意数目的参数

python系列教程198——任意数目的参数

SQL*Loader详细使用教程:命令行参数