如何从 imdb 获取更多信息并将其保存在 pandas 数据框中? [复制]
Posted
技术标签:
【中文标题】如何从 imdb 获取更多信息并将其保存在 pandas 数据框中? [复制]【英文标题】:How to fetch more information from imdb and save it in pandas data frame? [duplicate] 【发布时间】:2021-12-15 05:40:45 【问题描述】:我正在学习熊猫和python,
我想从 IMDB 库中获取有关电影的更多信息,并将其保存在我现有数据框中的附加列中。
例如:df['titleId']
在我的数据框中有电影 IDS(总共差不多 50-60 个)
(在 ImdbPy 库的帮助下),我想在同一数据帧中创建新列 df['movie_name']
来存储特定电影 ID df['titleId']
的电影名称
我设法用一个值(不在数据框中)来处理它,但无法在数据框中处理它。请帮忙。
Code to get movie name is as under:
#### YEAR OF THE MOVE
# importing the module
import imdb
# creating instance of IMDb
ia = imdb.IMDb()
# getting the movie with id
search = ia.get_movie("2082197")
# getting movie year
year = search['year']
# printing movie name and year
print(search['title'] + " : " + str(year))
【问题讨论】:
您在寻找Series.apply
-> df['movie_name'] = df['titleID'].apply(lambda x: ia.get_movie(x)['title'])
吗? How can I use the apply() function for a single column?
@HenryEcker 成功了……非常感谢您的帮助。愿你崛起并闪耀:)
你得到什么警告?
@HenryEcker ...它工作正常,但它也发出警告......(我知道应该忽略它们,但作为一个学习者我想知道它......)我会如果你能解释这个警告,真的很感激
@HenryEcker 试图在 DataFrame 中的切片副本上设置值。尝试改用 .loc[row_indexer,col_indexer] = value 查看文档中的警告:pandas.pydata.org/pandas-docs/stable/user_guide/…
【参考方案1】:
如果我对您的理解正确,您正在寻找merge
。
作为一个玩具示例,如果您有一个包含列 (id, name) 的数据框 A 和另一个包含列 (id, year) 的数据框 B,您可以执行 A.merge(B, how="left")
来获取包含列 (id, name) 的数据框 C , 年)。请注意,如果 B 远小于 A(即,如果 A 中的 id 不在 B 中),那么您可以在 C 中获取 nan 值 - 您可以为此探索其他类型的连接。
【讨论】:
以上是关于如何从 imdb 获取更多信息并将其保存在 pandas 数据框中? [复制]的主要内容,如果未能解决你的问题,请参考以下文章
我的 java 程序从哪里开始(使用文件夹名称从 IMDB 获取信息)
如何获取 ADLS Gen2 文件的最后修改日期并将其保存到 python 中的 csv
如何从 JTextField 获取字符串并将其保存在变量中的更新?