PyTables 之外的 CArray 和 EArray 兼容性

Posted

技术标签:

【中文标题】PyTables 之外的 CArray 和 EArray 兼容性【英文标题】:CArray and EArray compatibility outside of PyTables 【发布时间】:2014-09-20 02:37:52 【问题描述】:

我使用 PyTables,并且经常使用 CArray 和 EArray 类来支持压缩。

但是,我正在开发一个可能需要 Python 之外的兼容性的项目(很可能是在 Java 中)。这是否意味着我不能使用 CArray 和 EArray?或者有没有处理这些的库?

【问题讨论】:

【参考方案1】:

HDF5 支持压缩(PyTables 称为 CArrays)和可扩展(PyTables 称为 EArrays)数据集。这些是 HDF5 的所有实现中可用的通用功能。

但是,需要注意一件事 - 它取决于 PyTables 使用的压缩算法。 h5py,另一个用于 python 的 HDF5 库,可以选择使用 LZF 压缩,并非所有 HDF5 安装都支持。如果它使用 gzip,那么数组应该在任何地方都是可读的。

您可以使用使用 Java 的免费 HDFView tool 轻松检查现有文件的可移植性。

【讨论】:

以上是关于PyTables 之外的 CArray 和 EArray 兼容性的主要内容,如果未能解决你的问题,请参考以下文章

HDF5 文件和 PyTables 文件的区别

如何在 EAR 或 WAR 之外存储 Java EE 配置参数?

Numpy 和 PyTables 的浮点异常

CArray 和内存预分配

pandas pytables 追加:性能和文件大小的增加

Python、PyTables、Java - 捆绑在一起