如何从 imdb 获取更多信息并将其保存在 pandas 数据框中? [复制]

Posted

技术标签:

【中文标题】如何从 imdb 获取更多信息并将其保存在 pandas 数据框中? [复制]【英文标题】:How to fetch more information from imdb and save it in pandas data frame? [duplicate] 【发布时间】:2021-12-15 05:40:45 【问题描述】:

我正在学习熊猫和python,

我想从 IMDB 库中获取有关电影的更多信息,并将其保存在我现有数据框中的附加列中。

例如:df['titleId'] 在我的数据框中有电影 IDS(总共差不多 50-60 个)

(在 ImdbPy 库的帮助下),我想在同一数据帧中创建新列 df['movie_name'] 来存储特定电影 ID df['titleId'] 的电影名称

我设法用一个值(不在数据框中)来处理它,但无法在数据框中处理它。请帮忙。

Code to get movie name is as under:

#### YEAR OF THE MOVE

# importing the module
import imdb

# creating instance of IMDb
ia = imdb.IMDb()

# getting the movie with id
search = ia.get_movie("2082197")

# getting movie year
year = search['year']

# printing movie name and year
print(search['title'] + " : " + str(year))

【问题讨论】:

您在寻找Series.apply -> df['movie_name'] = df['titleID'].apply(lambda x: ia.get_movie(x)['title'])吗? How can I use the apply() function for a single column? @HenryEcker 成功了……非常感谢您的帮助。愿你崛起并闪耀:) 你得到什么警告? @HenryEcker ...它工作正常,但它也发出警告......(我知道应该忽略它们,但作为一个学习者我想知道它......)我会如果你能解释这个警告,真的很感激 @HenryEcker 试图在 DataFrame 中的切片副本上设置值。尝试改用 .loc[row_indexer,col_indexer] = value 查看文档中的警告:pandas.pydata.org/pandas-docs/stable/user_guide/… 【参考方案1】:

如果我对您的理解正确,您正在寻找merge

作为一个玩具示例,如果您有一个包含列 (id, name) 的数据框 A 和另一个包含列 (id, year) 的数据框 B,您可以执行 A.merge(B, how="left") 来获取包含列 (id, name) 的数据框 C , 年)。请注意,如果 B 远小于 A(即,如果 A 中的 id 不在 B 中),那么您可以在 C 中获取 nan 值 - 您可以为此探索其他类型的连接。

【讨论】:

以上是关于如何从 imdb 获取更多信息并将其保存在 pandas 数据框中? [复制]的主要内容,如果未能解决你的问题,请参考以下文章

我的 java 程序从哪里开始(使用文件夹名称从 IMDB 获取信息)

如何获取 ADLS Gen2 文件的最后修改日期并将其保存到 python 中的 csv

如何在 C# 中从 IMDB 获取信息

如何从 JTextField 获取字符串并将其保存在变量中的更新?

如何从 url 获取 json 数据并将其保存到 const 变量 [TypeScript]

将标准输出从 subprocess.Popen 保存到文件,并将更多内容写入文件