无法在python中将字符串转换为浮点数

Posted

技术标签:

【中文标题】无法在python中将字符串转换为浮点数【英文标题】:could not convert string to float in python 【发布时间】:2020-04-17 20:11:09 【问题描述】:

我尝试从 cvs 文件中分析原理组件,但是当我运行代码时出现此错误

C:\Users\Lenovo\Desktop>python pca.py

ValueError: 无法将字符串转换为浮点数:Annee;NET;INT;SUB;LMT;DCT;IMM;EXP;VRD

这是我的 cvs 文件

我尝试删除任何空间和任何想法 这是我的python脚本,我不知道我想念什么

注意:我在python2.7下运行这段代码

from sklearn.externals import joblib  
import numpy as np  
import glob  
import os  
import time  
import numpy

my_matrix = numpy.loadtxt(open("pca.csv","rb"),delimiter= ",",skiprows=0)  
def pca(dataMat, r, autoset_r=False, autoset_rate=0.9): 
    """
    purpose: principal components analysis
    """  
    print("Start to do PCA...") 
    t1 = time.time() 
    meanVal = np.mean(dataMat, axis=0)  
    meanRemoved = dataMat - meanVal  
    # normData = meanRemoved / np.std(dataMat)  
    covMat = np.cov(meanRemoved, rowvar=0)    
    eigVals, eigVects = np.linalg.eig(np.mat(covMat)) 
    eigValIndex = np.argsort(-eigVals)  


    if autoset_r:
        r = autoset_eigNum(eigVals, autoset_rate)
        print("autoset: take top  of  features".format(r, meanRemoved.shape[1]))

    r_eigValIndex = eigValIndex[:r]  
    r_eigVect = eigVects[:, r_eigValIndex]  
    lowDDataMat = meanRemoved * r_eigVect  
    reconMat = (lowDDataMat * r_eigVect.T) + meanVal    
    t2 = time.time()   
    print("PCA takes %f seconds" %(t2-t1))
    joblib.dump(r_eigVect, './pca_args_save/r_eigVect.eig')    
    joblib.dump(meanVal, './pca_args_save/meanVal.mean')   
    return lowDDataMat, reconMat


def autoset_eigNum(eigValues, rate=0.99):

    eigValues_sorted = sorted(eigValues, reverse=True)
    eigVals_total = eigValues.sum()
    for i in range(1, len(eigValues_sorted)+1):
        eigVals_sum = sum(eigValues_sorted[:i])     
        if eigVals_sum / eigVals_total >= rate:
            break
    return i

【问题讨论】:

如果您的 df 长度 isdigit 检查每个条目吗?从那里您可以找到问题条目并从那里进一步排除故障。快速referece isdigit 【参考方案1】:

NumPy 似乎在将索引行解析为浮动时遇到了一些问题。

尝试在np.readtxt 命令中设置skiprows = 1 以跳过表头。

【讨论】:

我试了一下,但我得到了这个错误ValueError: invalid literal for float(): 1969;17.93;3.96;0.88;7.38;19.86;25.45;5.34;19.21 请根据您的文件设置分隔符。在您的情况下,delimiter= ";" 应该可以完成这项工作。

以上是关于无法在python中将字符串转换为浮点数的主要内容,如果未能解决你的问题,请参考以下文章

ValueError:无法在熊猫中将字符串转换为浮点数

如何在python中将数据帧中的符号转换为浮点数?

如何在 JavaScript 中将字符串转换为浮点数?

在 C# 中将字符串转换为浮点数

Python:ValueError:无法将字符串转换为浮点数:'0'

在 C++ 中将字符串转换为浮点数