如何使用 libsvm 格式的数据集构建机器学习模型

Posted

技术标签:

【中文标题】如何使用 libsvm 格式的数据集构建机器学习模型【英文标题】:How to build a machine learning model using dataset with libsvm format 【发布时间】:2016-11-01 18:54:54 【问题描述】:

我有一个以.libsvm 格式编写的数据集,我想使用机器学习算法构建一个分类模型。 我已经尝试过 Weka 环境版本 3.6.12 但我收到以下错误:

weka.core.convrters.LibSVMLoaderfailed to load 'train.ecml.libsvm.txt' Reason: Unable to determine structure as libsvm:java.lang.StringIndexOutOfBoundsException:String index out of range: -1

那么,如何解决这个问题,或者有没有其他简单的方法来处理这种数据文件格式?

【问题讨论】:

欢迎来到 ***。请阅读并遵循帮助文档中的发布指南。 Minimal, complete, verifiable example 适用于此。在您发布代码并准确描述问题之前,我们无法有效地帮助您。 只引用环境是不够的。您应该在 Internet 上搜索适合您的环境 (Windows 10) 和算法 (SVM) 的示例。当您按照说明或教程遇到问题时,请查看父站点的问答资源 - 如果找不到帮助,请然后在此处发布。 谢谢@Prune 先生,我有一个关于如何处理 libsvm 格式以构建高效机器学习模型的问题? 然后发布问题 - 但请遵循介绍导览中的发布指南。 @CaptainFogetti 我解决了问题,谢谢你的帮助,我刚刚使用了 weka.core.converters.SVMLightLoader 问题解决了 【参考方案1】:

您可以使用weka.core.converters.SVMLightLoader 加载.libsvm 数据文件格式 谢谢。

【讨论】:

以上是关于如何使用 libsvm 格式的数据集构建机器学习模型的主要内容,如果未能解决你的问题,请参考以下文章

将带有分类数据的 csv 转换为 libsvm

PyTorch 加载超大 Libsvm 格式数据

LIBSVM 如何准备带有图像的训练数据集以进行徽标检测?

机器学习 - 支持向量机

如何将数据从 libsvm 导入到 R

如何使用 python 和 pandas 将 Csv 文件转换为 libsvm?