如何使用代理上的熊猫从 url 读取_csv 文件？

Posted 2023-03-12

技术标签:

【中文标题】如何使用代理上的熊猫从 url 读取_csv 文件？【英文标题】：How to read_csv file from url with pandas on proxy? 【发布时间】：2021-05-16 09:31:45 【问题描述】：

我在学生宿舍中使用 pandas 代理读取 csv 文件时遇到问题：

drinks=pd.read_csv('https://raw.githubusercontent.com/justmarkham/pandas-videos/master/data/drinks.csv')
type(drinks)

我试过这个，但对我没有帮助：

import pandas as pd
import io
import requests

proxy_dict = "http://proxy.rcub.bg.ac.rs:8080"

s = requests.get('https://raw.githubusercontent.com/justmarkham/pandas-videos/master/data/drinks.csv', proxies=proxy_dict).text

df = pd.read_csv(io.StringIO(s))

但我收到以下错误： enter image description here

有什么帮助吗？

【问题讨论】：

【参考方案1】：

您的 proxy_dict 是一个字符串，而不是一个字典。使用

proxy_dict = "https": "http://proxy.rcub.bg.ac.rs:8080"

【讨论】：

非常感谢！通常我们看不到最小的错误嘿嘿。现在，它起作用了！

以上是关于如何使用代理上的熊猫从 url 读取_csv 文件？的主要内容，如果未能解决你的问题，请参考以下文章

如何从存储在.csv中的熊猫数据框中读取np矩阵？

如何在熊猫中读取带有分号分隔符的文件

从 csv 文件读取时，熊猫会添加列

如何从多个 API 调用更新熊猫数据框

我应该如何使用熊猫读取没有“未命名”行的 csv 文件？ [复制]

将 .csv 文件从 URL 读取到 Python 3.x - _csv.Error：迭代器应返回字符串，而不是字节（您是不是以文本模式打开文件？）