TVM安装(二):pycharm远程调试
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了TVM安装(二):pycharm远程调试相关的知识,希望对你有一定的参考价值。
参考技术A pycharm远程调试环境网上已经有很多答案,这里不重复,但在远程调试TVM时会有一个坑:pycharm不能读取远程机器的环境变量,从而导致cuda出错或各种错误,比如:Check failed: (bf != nullptr) is false: target.build.cuda is not enabled
因此需要在pycharm中加入系统变量。
在《TVM安装(一):Ubuntu下配置环境》中曾经提到要把tvm路径加入到环境变量中,其中除了要加入tvm文件路径之外还要加入tvm/python文件夹作为PYTHONPATH
因此在pycharm中也要加入这个环境变量
tvm在linux环境下的安装与编译及vscode如何配置tvm的远程连接调试环境
文章目录
前言
本篇文章介绍一下 tvm
在linux
环境下的安装与编译,以及如何使用vscode
来配置tvm
的远程连接调试环境。
所需软硬件环境:
环境 | 版本 |
---|---|
local system | windows 10 |
service system | ubuntu 18.04 |
tvm | latest(0.9.dev0) |
python(conda) | python 3.8.13 |
local IDE | vscode |
1. 安装TVM
1.1 下载源码
# 从github上拉取源码
git clone --recursive https://github.com/apache/tvm tvm
# --recursive指令:由于tvm依赖了很多第三方的开源库(子模块)
# 加入该参数之后也将相应的子模块一起进行clone
# 或者直接下载源码
https://tvm.apache.org/download
1.2 创建虚拟环境及安装依赖库
使用conda
创建tvm
的虚拟python
环境,python
版本为3.8
,虚拟环境名为tvmenv
:
conda create -n tvmenv python=3.8
编辑tvm
目录下的conda/build-environment.yaml
文件:
# conda/build-environment.yaml
# Build environment that can be used to build tvm.
name: tvmenv
# The conda channels to lookup the dependencies
channels:
- anaconda
- conda-forge
# 将name的值改为刚刚创建的虚拟环境名tvmenv
执行下面的指令,将构建tvm
所需的环境依赖更新到当前虚拟环境中:
conda env update -f conda/build-environment.yaml
# conda env update -n tvmenv -f conda/build-environment.yaml
# 设置完之后需要重新deactivate/activate对环境进行激活
如果上述命令执行较慢,可以将
conda
换成国内源(建议使用北京外国语大学的开源镜像站):参考连接
然后修改conda/build-environment.yaml
文件:
channels:
- defaults
# - anaconda
# - conda-forge
安装python
依赖库:
pip install decorator tornado psutil 'xgboost<1.6.0' cloudpickle -i https://pypi.tuna.tsinghua.edu.cn/simple
# 如果使用onnx或者pytorch作为原始模型,则还需要安装相应的依赖库
pip install onnx onnxruntime -i https://pypi.tuna.tsinghua.edu.cn/simple
pip install torch==1.7.1 torchvision==0.8.2 torchaudio==0.7.2 -i https://pypi.tuna.tsinghua.edu.cn/simple
在当前虚拟环境中添加用于tvm debug
的环境变量:
conda env config vars set TVM_LOG_DEBUG="ir/transform.cc=1,relay/ir/transform.cc=1"
# conda env config vars set TVM_LOG_DEBUG="ir/transform.cc=1,relay/ir/transform.cc=1" -n tvmenv
# 设置完之后需要重新deactivate/activate对环境进行激活是环境变量生效
使用这种方式设置环境变量的好处是:只有当前环境被激活(conda activate)
时,自定义设置的环境变量才起作用,当conda deactivate
后自定义的环境变量会自动清除。
当然,也可以更简单粗暴一些:
export TVM_LOG_DEBUG="ir/transform.cc=1,relay/ir/transform.cc=1"
在当前虚拟环境中添加用于tvm python
的环境变量:
export TVM_HOME=your tvm path
export PYTHONPATH=$TVM_HOME/python:$PYTHONPATH
1.3 编译TVM源码
如果linux
上没有安装C/C++
的编译环境,需要进行安装:
# 更新软件
apt-get update
# 安装
apt-get install build-essential
# 安装cmake
apt-get install cmake
在tvm
目录下创建build
文件夹,并将cmake/config.cmake
文件复制到此文件夹中:
mkdir build
cp cmake/config.cmake build/
编辑build/config.cmake
进行相关配置:
# 本次是在cpu上进行测试,因此没有配置cuda
set(USE_LLVM ON) # line 136
set(USE_RELAY_DEBUG ON) # line 285(建议先 OFF)
# 在末尾添加一个cmake的编译宏,确保编译出来的是debug版本
set(CMAKE_BUILD_TYPE Debug)
编译tvm
,这里开启了16
个线程:
cd build
cmake ..
make -j 16
# 建议开多个线程,否则编译速度很慢哦
大约5
分钟,即可生成我们需要的两个共享链接库:libtvm.so
和 libtvm_runtime.so
1.4 验证安装是否成功
tvm
版本验证:
import tvm
print(tvm.__version__)
pytorch
模型验证:
# from_pytorch.py
# https://tvm.apache.org/docs/how_to/compile_models/from_pytorch.html
# ps: TVM supports PyTorch 1.7 and 1.4. Other versions may be unstable.
import tvm
from tvm import relay
from tvm.contrib.download import download_testdata
import numpy as np
# PyTorch imports
import torch
import torchvision
######################################################################
# Load a pretrained PyTorch model
# -------------------------------
model_name = "resnet18"
model = getattr(torchvision.models, model_name)(pretrained=True)
# or
# model = torchvision.models.resnet18(pretrained=True)
# or
# pth_file = 'resnet18-f37072fd.pth'
# model = torchvision.models.resnet18()
# ckpt = torch.load(pth_file)
# model.load_state_dict(ckpt)
model = model.eval()
# We grab the TorchScripted model via tracing
input_shape = [1, 3, 224, 224]
input_data = torch.randn(input_shape)
scripted_model = torch.jit.trace(model, input_data).eval()
######################################################################
# Load a test image
# -----------------
# Classic cat example!
from PIL import Image
# img_url = "https://github.com/dmlc/mxnet.js/blob/main/data/cat.png?raw=true"
# img_path = download_testdata(img_url, "cat.png", module="data")
img_path = 'cat.png'
img = Image.open(img_path).resize((224, 224))
# Preprocess the image and convert to tensor
from torchvision import transforms
my_preprocess = transforms.Compose(
[
transforms.Resize(256),
transforms.CenterCrop(224),
transforms.ToTensor(),
transforms.Normalize(mean=[0.485, 0.456, 0.406], std=[0.229, 0.224, 0.225]),
]
)
img = my_preprocess(img)
img = np.expand_dims(img, 0)
######################################################################
# Import the graph to Relay
# -------------------------
# Convert PyTorch graph to Relay graph. The input name can be arbitrary.
input_name = "input0"
shape_list = [(input_name, img.shape)]
mod, params = relay.frontend.from_pytorch(scripted_model, shape_list)
######################################################################
# Relay Build
# -----------
# Compile the graph to llvm target with given input specification.
target = tvm.target.Target("llvm", host="llvm")
dev = tvm.cpu(0)
with tvm.transform.PassContext(opt_level=3):
lib = relay.build(mod, target=target, params=params)
######################################################################
# Execute the portable graph on TVM
# ---------------------------------
# Now we can try deploying the compiled model on target.
from tvm.contrib import graph_executor
dtype = "float32"
m = graph_executor.GraphModule(lib["default"](dev))
# Set inputs
m.set_input(input_name, tvm.nd.array(img.astype(dtype)))
# Execute
m.run()
# Get outputs
tvm_output = m.get_output(0)
#####################################################################
# Look up synset name
# -------------------
# Look up prediction top 1 index in 1000 class synset.
# synset_url = "".join(
# [
# "https://raw.githubusercontent.com/Cadene/",
# "pretrained-models.pytorch/master/data/",
# "imagenet_synsets.txt",
# ]
# )
# synset_name = "imagenet_synsets.txt"
# synset_path = download_testdata(synset_url, synset_name, module="data")
# https://raw.githubusercontent.com/Cadene/pretrained-models.pytorch/master/data/imagenet_synsets.txt
synset_path = 'imagenet_synsets.txt'
with open(synset_path) as f:
synsets = f.readlines()
synsets = [x.strip() for x in synsets]
splits = [line.split(" ") for line in synsets]
key_to_classname = spl[0]: " ".join(spl[1:]) for spl in splits
# class_url = "".join(
# [
# "https://raw.githubusercontent.com/Cadene/",
# "pretrained-models.pytorch/master/data/",
# "imagenet_classes.txt",
# ]
# )
# class_name = "imagenet_classes.txt"
# class_path = download_testdata(class_url, class_name, module="data")
# https://raw.githubusercontent.com/Cadene/pretrained-models.pytorch/master/data/imagenet_classes.txt
class_path = 'imagenet_classes.txt'
with open(class_path) as f:
class_id_to_key = f.readlines()
class_id_to_key = [x.strip() for x in class_id_to_key]
# Get top-1 result for TVM
top1_tvm = np.argmax(tvm_output.numpy()[0])
tvm_class_key = class_id_to_key[top1_tvm]
# Convert input to PyTorch variable and get PyTorch result for comparison
with torch.no_grad():
torch_img = torch.from_numpy(img)
output = model(torch_img)
# Get top-1 result for PyTorch
top1_torch = np.argmax(output.numpy())
torch_class_key = class_id_to_key[top1_torch]
print("Relay top-1 id: , class name: ".format(top1_tvm, key_to_classname[tvm_class_key]))
print("Torch top-1 id: , class name: ".format(top1_torch, key_to_classname[torch_class_key]))
2. 配置vscode
安装两个vscode
远程连接所需的两个插件,具体如下图所示:
安装完成之后,在左侧工具栏会出现一个图标,点击图标进行ssh
配置:
ssh yourname@yourip -A
然后右键选择在当前窗口进行连接:
除此之外,还可以设置免费登录,具体可参考这篇文章。
当然,也可以使用
windows
本地的WSL2,vscode
连接WSL
还需要安装WSL
和Dev Containers
这两个插件。
在服务器端执行code .
会自动安装vscode server
,安装位置在用户的根目录下:
3. 安装FFI Navigator
由于TVM
是由Python
和C++
混合开发,且大多数的IDE
仅支持在同一种语言中查找函数定义,因此对于跨语言的FFI
调用,即Python
跳转到C++
或者C++
跳转到Python
,vscode
是做不到的。虽然解决这个问题在技术上可能非常具有挑战性,但我们可以通过构建一个与FFI
注册码模式匹配并恢复必要信息的项目特定分析器来解决这个问题,FFI Navigator
就这样诞生了,作者仍然是陈天奇博士。
安装方式如下:
# 建议使用源码安装
git clone https://github.com/tqchen/ffi-navigator.git
# 安装python依赖
cd ffi-navigator/python
python setyp.py install
vscode
需要安装FFI Navigator
插件,直接搜索安装即可(安装到服务器端)。
最后需要在.vscode/setting.json
进行配置,内容如下:
"python.analysis.extraPaths": [
"$workspaceFolder/python"
], // 添加额外导入路径, 告诉pylance自定义的python库在哪里
"ffi_navigator.pythonpath": "/home/liyanpeng/anaconda3/envs/tvmenv/bin/python", // 配置FFI Navigator
"python.defaultInterpreterPath": "/home/liyanpeng/anaconda3/envs/tvmenv/bin/python",
"files.associations":
"type_traits": "cpp",
"fstream": "cpp",
"thread": "cpp",
"*.tcc": "cpp"
更详细内容可以参考项目链接。
结束语
对于vscode
的使用技巧及C/C++
相关的配置,这里不再详细的介绍了,感兴趣的小伙伴们可以了解下。
以上是关于TVM安装(二):pycharm远程调试的主要内容,如果未能解决你的问题,请参考以下文章
tvm在linux环境下的安装与编译及vscode如何配置tvm的远程连接调试环境
tvm在linux环境下的安装与编译及vscode如何配置tvm的远程连接调试环境