Pandas。类型错误:字符串索引必须是整数。
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Pandas。类型错误:字符串索引必须是整数。相关的知识,希望对你有一定的参考价值。
在当前的一个研究项目中,我计划读取JSON对象。"Main_Text"
在预定义的时间范围内,基于PythonPandas。然而,该代码产生了错误 TypeError: string indices must be integers
对于行 line = row["Main_Text"]
.
我已经翻遍了解决同样问题的页面,但还没有找到任何解决方案。有没有什么有用的调整来使其工作?
JSON文件的结构如下。
[
"No":"121","Stock Symbol":"A","Date":"05/11/2017","Text Main":"Sample text"
]
而相应的代码部分是这样的
import string
import json
import csv
import pandas as pd
import datetime
import numpy as np
# Loading and reading dataset
file = open("Glassdoor_A.json", "r")
data = json.load(file)
df = pd.json_normalize(data)
df['Date'] = pd.to_datetime(df['Date'])
# Create an empty dictionary
d = dict()
# Filtering by date
start_date = "01/01/2009"
end_date = "01/01/2015"
after_start_date = df["Date"] >= start_date
before_end_date = df["Date"] <= end_date
between_two_dates = after_start_date & before_end_date
filtered_dates = df.loc[between_two_dates]
print(filtered_dates)
# Processing
for row in filtered_dates:
line = row["Text Main"]
# Remove the leading spaces and newline character
line = line.strip()
答案
如果要求收集 "Text Main "列的所有内容,我们可以这样做。
line = list(filtered_dates['Text Main'])
然后我们也可以应用 strip:
line = [val.strip() for val in line]
以上是关于Pandas。类型错误:字符串索引必须是整数。的主要内容,如果未能解决你的问题,请参考以下文章