我应该如何构建包含 Cython 代码的 Python 包
Posted
技术标签:
【中文标题】我应该如何构建包含 Cython 代码的 Python 包【英文标题】:How should I structure a Python package that contains Cython code 【发布时间】:2011-05-29 04:35:18 【问题描述】:我想制作一个 Python 包,其中包含一些 Cython 代码。我的 Cython 代码运行良好。但是,现在我想知道如何最好地打包它。
对于大多数只想安装软件包的人,我想包含 Cython 创建的 .c
文件,并安排 setup.py
编译该文件以生成模块。那么用户不需要安装 Cython 来安装包。
但是对于可能想要修改包的人,我还想提供 Cython .pyx
文件,并且以某种方式还允许 setup.py
使用 Cython 构建它们(所以那些用户会 需要安装 Cython)。
我应该如何构建包中的文件以适应这两种情况?
Cython documentation gives a little guidance。但它并没有说明如何制作单个 setup.py
来处理有/没有 Cython 的情况。
【问题讨论】:
我看到这个问题得到的赞成票比任何答案都多。我很想知道为什么人们会觉得答案不令人满意。 我找到了this section of the documentation,它给出了准确的答案。 【参考方案1】:我现在自己在 Python 包中完成了这项工作 simplerandom
(BitBucket repo - 编辑:现在是 github)(我不认为这是一个受欢迎的包,但这是一个很好的机会学习 Cython)。
这种方法依赖于这样一个事实,即使用 Cython.Distutils.build_ext
(至少在 Cython 版本 0.14 中)构建一个 .pyx
文件似乎总是在与源 .pyx
文件相同的目录中创建一个 .c
文件。
这里是setup.py
的精简版,我希望它能够显示要点:
from distutils.core import setup
from distutils.extension import Extension
try:
from Cython.Distutils import build_ext
except ImportError:
use_cython = False
else:
use_cython = True
cmdclass =
ext_modules = []
if use_cython:
ext_modules += [
Extension("mypackage.mycythonmodule", ["cython/mycythonmodule.pyx"]),
]
cmdclass.update('build_ext': build_ext)
else:
ext_modules += [
Extension("mypackage.mycythonmodule", ["cython/mycythonmodule.c"]),
]
setup(
name='mypackage',
...
cmdclass=cmdclass,
ext_modules=ext_modules,
...
)
我还编辑了MANIFEST.in
以确保mycythonmodule.c
包含在源分发中(使用python setup.py sdist
创建的源分发):
...
recursive-include cython *
...
我不会将 mycythonmodule.c
提交给版本控制“主干”(或 Mercurial 的“默认”)。当我发布一个版本时,我需要记住首先做一个python setup.py build_ext
,以确保mycythonmodule.c
存在并且是最新的源代码分发。我还创建了一个发布分支,并将 C 文件提交到该分支。这样我就有了与该版本一起分发的 C 文件的历史记录。
【讨论】:
谢谢,这正是我正在开放的 Pyrex 项目所需要的! MANIFEST.in 让我一时不爽,但我只需要那一行。出于兴趣,我将 C 文件包含在源代码管理中,但我认为您的观点是不必要的。 我已经编辑了我的答案,以解释 C 文件如何不在主干/默认中,而是添加到发布分支中。 @CraigMcQueen 感谢您的出色回答,它对我帮助很大!但是,我想知道,在可用时使用 Cython 是理想的行为吗?在我看来,默认情况下使用预先生成的 c 文件会更好,除非用户明确想要使用 Cython,在这种情况下他可以设置环境变量或其他东西。这将使安装更加稳定/健壮,因为用户可能会根据他安装的 Cython 版本获得不同的结果 - 他甚至可能不知道他已经安装了它并且它正在影响包的构建。【参考方案2】:添加到 Craig McQueen 的答案:请参阅下文,了解如何覆盖 sdist
命令以让 Cython 在创建源代码分发之前自动编译您的源文件。
这样您就不会冒意外分发过时的C
资源的风险。在您对分发过程的控制有限的情况下,它也有帮助,例如从持续集成等自动创建分布时。
from distutils.command.sdist import sdist as _sdist
...
class sdist(_sdist):
def run(self):
# Make sure the compiled Cython files in the distribution are up-to-date
from Cython.Build import cythonize
cythonize(['cython/mycythonmodule.pyx'])
_sdist.run(self)
cmdclass['sdist'] = sdist
【讨论】:
【参考方案3】:http://docs.cython.org/en/latest/src/userguide/source_files_and_compilation.html#distributing-cython-modules
强烈建议您分发生成的 .c 文件以及 Cython 源代码,以便用户无需 Cython 即可安装您的模块。
还建议在您分发的版本中默认不启用 Cython 编译。即使用户安装了 Cython,他也可能不想使用它来安装您的模块。此外,他的版本可能与您使用的版本不同,并且可能无法正确编译您的源代码。
这只是意味着您附带的 setup.py 文件将只是生成的 .c 文件上的普通 distutils 文件,对于我们将拥有的基本示例:
from distutils.core import setup from distutils.extension import Extension setup( ext_modules = [Extension("example", ["example.c"])] )
【讨论】:
【参考方案4】:最简单的方法是包含两者但只使用 c 文件?包含 .pyx 文件很好,但是一旦有了 .c 文件就不需要了。想要重新编译 .pyx 的人可以安装 Pyrex 并手动进行。
否则,您需要为 distutils 自定义 build_ext 命令,该命令首先构建 C 文件。 Cython 已经包含一个。 http://docs.cython.org/src/userguide/source_files_and_compilation.html
该文档没有说明如何使这个条件成为条件,但是
try:
from Cython.distutils import build_ext
except ImportError:
from distutils.command import build_ext
应该处理它。
【讨论】:
感谢您的回答。这是合理的,尽管我更喜欢在安装 Cython 时setup.py
可以直接从 .pyx
文件构建。 My answer 也实现了这一点。
嗯,这就是我回答的重点。这不是一个完整的 setup.py。【参考方案5】:
包含 (Cython) 生成的 .c 文件非常奇怪。尤其是当我们将它包含在 git 中时。我更喜欢使用setuptools_cython。当 Cython 不可用时,它会构建一个内置 Cython 环境的 egg,然后使用 egg 构建您的代码。
一个可能的例子:https://github.com/douban/greenify/blob/master/setup.py
更新(2017-01-05):
因为setuptools 18.0
,所以没有必要使用setuptools_cython
。 Here 是一个在没有 setuptools_cython
的情况下从头开始构建 Cython 项目的示例。
【讨论】:
这是否解决了即使您在 setup_requires 中指定 Cython 也无法安装的问题? 也不能将'setuptools>=18.0'
放入setup_requires 而不是创建方法is_installed
?
@capa但是如果您使用的是 setuptools setuptools_cython。
感谢@McKelvin,这似乎是一个很好的解决方案!有什么理由为什么我们应该使用另一种方法,在此旁边预先对源文件进行cythonizing?我试过你的方法,安装时似乎有点慢(安装需要一分钟,但构建需要一秒钟)。
@Martinsos pip install wheel
。那么一定是原因1。请先安装***再试一次。【参考方案6】:
我想出的简单技巧:
from distutils.core import setup
try:
from Cython.Build import cythonize
except ImportError:
from pip import pip
pip.main(['install', 'cython'])
from Cython.Build import cythonize
setup(…)
如果无法导入,只需安装 Cython。可能不应该共享此代码,但对于我自己的依赖项来说已经足够了。
【讨论】:
【参考方案7】:所有其他答案要么依赖于
distutils 从Cython.Build
导入,这会在通过 setup_requires
要求 cython 和导入它之间产生先有鸡还是先有蛋的问题。
现代解决方案是改用 setuptools,请参阅 this answer(自动处理 Cython 扩展需要 setuptools 18.0,也就是说,它已经可用很多年了)。具有需求处理、入口点和 cython 模块的现代标准 setup.py
可能如下所示:
from setuptools import setup, Extension
with open('requirements.txt') as f:
requirements = f.read().splitlines()
setup(
name='MyPackage',
install_requires=requirements,
setup_requires=[
'setuptools>=18.0', # automatically handles Cython extensions
'cython>=0.28.4',
],
entry_points=
'console_scripts': [
'mymain = mypackage.main:main',
],
,
ext_modules=[
Extension(
'mypackage.my_cython_module',
sources=['mypackage/my_cython_module.pyx'],
),
],
)
【讨论】:
在设置时从Cython.Build
导入会导致 ImportError。使用 setuptools 编译 pyx 是最好的方法。【参考方案8】:
这是我编写的设置脚本,它可以更轻松地在构建中包含嵌套目录。需要从包中的文件夹运行它。
Givig 结构如下:
__init__.py
setup.py
test.py
subdir/
__init__.py
anothertest.py
setup.py
from setuptools import setup, Extension
from Cython.Distutils import build_ext
# from os import path
ext_names = (
'test',
'subdir.anothertest',
)
cmdclass = 'build_ext': build_ext
# for modules in main dir
ext_modules = [
Extension(
ext,
[ext + ".py"],
)
for ext in ext_names if ext.find('.') < 0]
# for modules in subdir ONLY ONE LEVEL DOWN!!
# modify it if you need more !!!
ext_modules += [
Extension(
ext,
["/".join(ext.split('.')) + ".py"],
)
for ext in ext_names if ext.find('.') > 0]
setup(
name='name',
ext_modules=ext_modules,
cmdclass=cmdclass,
packages=["base", "base.subdir"],
)
# Build --------------------------
# python setup.py build_ext --inplace
编译愉快 ;)
【讨论】:
【参考方案9】:我发现只使用 setuptools 而不是功能受限的 distutils 的最简单方法是
from setuptools import setup
from setuptools.extension import Extension
try:
from Cython.Build import cythonize
except ImportError:
use_cython = False
else:
use_cython = True
ext_modules = []
if use_cython:
ext_modules += cythonize('package/cython_module.pyx')
else:
ext_modules += [Extension('package.cython_module',
['package/cython_modules.c'])]
setup(name='package_name', ext_modules=ext_modules)
【讨论】:
事实上,使用 setuptools 不需要从Cython.Build
显式导入 try/catched,请参阅我的答案。【参考方案10】:
我想我通过提供自定义build_ext
命令找到了一个很好的方法。思路如下:
我通过覆盖finalize_options()
并在函数体中执行import numpy
来添加numpy标头,这很好地避免了numpy在setup()
安装之前不可用的问题。
代码如下:
import re, sys, os.path
from distutils import dep_util, log
from setuptools.command.build_ext import build_ext
try:
import Cython.Build
HAVE_CYTHON = True
except ImportError:
HAVE_CYTHON = False
class BuildExtWithNumpy(build_ext):
def check_cython(self, ext):
c_sources = []
for fname in ext.sources:
cname, matches = re.subn(r"(?i)\.pyx$", ".c", fname, 1)
c_sources.append(cname)
if matches and dep_util.newer(fname, cname):
if HAVE_CYTHON:
return ext
raise RuntimeError("Cython and C module unavailable")
ext.sources = c_sources
return ext
def check_extensions_list(self, extensions):
extensions = [self.check_cython(ext) for ext in extensions]
return build_ext.check_extensions_list(self, extensions)
def finalize_options(self):
import numpy as np
build_ext.finalize_options(self)
self.include_dirs.append(np.get_include())
这允许人们只写 setup()
参数而不必担心导入以及是否有可用的 cython:
setup(
# ...
ext_modules=[Extension("_my_fast_thing", ["src/_my_fast_thing.pyx"])],
setup_requires=['numpy'],
cmdclass='build_ext': BuildExtWithNumpy
)
【讨论】:
以上是关于我应该如何构建包含 Cython 代码的 Python 包的主要内容,如果未能解决你的问题,请参考以下文章
如何使用 pybrain 等外部 python 库在 cython 中编译我的 python 代码