为啥我无法链接到使用动态并行和可分离编译的 CUDA 静态库?

Posted

技术标签:

【中文标题】为啥我无法链接到使用动态并行和可分离编译的 CUDA 静态库?【英文标题】:Why can't I link to my CUDA static library that uses Dynamic Parallelism and Separable Compilation?为什么我无法链接到使用动态并行和可分离编译的 CUDA 静态库? 【发布时间】:2021-12-09 02:41:04 【问题描述】:

我正在尝试创建最基本的 CUDA 应用程序来演示动态并行、单独编译和链接、静态库中的 CUDA 内核,并且我正在尝试使用 CMake 生成 Visual Studio 解决方案。我正在使用 CMake 3.21.3、CUDA 11.4 和 Visual Studio 2019 (16.11.5)。

我有一个 .h 和一个 .cu 文件,我正在将它们编译成一个静态库。我还有一个 main.cpp 文件,其中包含我的库中的标头和指向它的链接。该文件被编译为可执行文件。我的库和可执行文件的代码位于不同的文件夹中,如下所示:

src
 |-MyLib
 |  |-mylib.h
 |  |-mylib.cu
 |  |-CMakeLists.txt
 |
 |-MyMain
 |  |-main.cpp
 |  |-CMakeLists.txt
 |
 |-CMakeLists.txt

mylib.h 和 mylib.cu 包含一个初始化 CUDA 的函数、两个内核:一个父内核和一个子内核,以及一个调用父内核的宿主函数。 mylib.h #includes cuda_runtime.hdevice_launch_parameters.h 让 Visual Studio 开心。

main.cpp简单#includesmylib.h,调用initCUDA函数,然后调用宿主函数调用内核。

库的 CMakeLists 文件如下所示:

cmake_minimum_required(VERSION 3.17 FATAL_ERROR)
project(MyLib LANGUAGES CXX CUDA)

find_package(CUDAToolkit REQUIRED)

add_library($PROJECT_NAME STATIC mylib.h mylib.cu)

target_compile_options($PROJECT_NAME PRIVATE "$<$<AND:$<CONFIG:Debug>,$<COMPILE_LANGUAGE:CUDA>>:-G;-src-in-ptx>") # enable device debug flags

set_target_properties($PROJECT_NAME PROPERTIES CUDA_ARCHITECTURES "52") # this is to make CMake happy
set_target_properties($PROJECT_NAME PROPERTIES CUDA_SEPARABLE_COMPILATION ON)
set_target_properties($PROJECT_NAME PROPERTIES CUDA_RESOLVE_DEVICE_SYMBOLS ON)  # this is required for some reason

target_link_libraries($PROJECT_NAME $CUDAToolkit_LIBRARY_DIR/cudart.lib)

main.cpp 的 CMakeLists 文件如下所示:

cmake_minimum_required(VERSION 3.17 FATAL_ERROR)

project(CUDA_Dynamic_Parallelism)

add_executable($PROJECT_NAME main.cpp)
set_target_properties($PROJECT_NAME PROPERTIES CUDA_SEPARABLE_COMPILATION ON)
target_link_libraries($PROJECT_NAME MyLib)

CMake 配置并生成解决方案,没问题。但是,当我尝试构建时,库似乎构建正常,但是当可执行文件链接时,我收到以下错误: MyLib.lib(MyLib.device-link.obj) : error LNK2001: unresolved external symbol __fatbinwrap_38_cuda_device_runtime_compute_86_cpp1_ii_8b1a5d37

任何想法为什么会发生这种情况以及如何解决它?

【问题讨论】:

【参考方案1】:

只看错误,我猜cuda架构有问题。您使用 CUDA_ARCHITECTURES 52 构建您的 Lib,但您没有在 seconds 项目中指定任何内容。

"__fatbinwrap_38_cuda_device_runtime_compute_86_cpp1_ii_8b1a5d37" 似乎表明它正在寻找具有计算架构 86 的符号。我建议尝试一下。

【讨论】:

以上是关于为啥我无法链接到使用动态并行和可分离编译的 CUDA 静态库?的主要内容,如果未能解决你的问题,请参考以下文章

在计算加速时使用编译器优化

为啥 angular.js 在添加动态元素时不够聪明,无法编译 DOM?

为啥我的动态路由返回一个空白页?

Visual Studio静态编译

为啥gdb找不到源文件

为啥即使使用 -cudart static 编译,库用户仍然需要链接到 cuda 运行时