【初学者】R语言 rvest包 爬取豆瓣电影top250,使用data.frame合并结果时,行数不一样,无法合并

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了【初学者】R语言 rvest包 爬取豆瓣电影top250,使用data.frame合并结果时,行数不一样,无法合并相关的知识,希望对你有一定的参考价值。

我是初学者。使用R语言的rvest包爬取网络数据,想用循环实现爬取豆瓣电影top250的电影信息,但因为某些电影的某些内容(比如外文名称)网页源代码xpath路径缺失,导致使用data.frame合并结果时,行数不一样,只能输出前面的100个电影信息,循环就终止了,报错为:“ 参数值意味着不同的行数: 25, 23”。请问这个怎么解决呢?如何设置使这些缺失的值命为空值呢?如果需要,我可以po上源代码。谢谢各位大神!!!

参考技术A frame <- data.frame(x=c(1,2,3),
y=c(4,7,9))
if (3 %in% frame$x)
foo()

以上是关于【初学者】R语言 rvest包 爬取豆瓣电影top250,使用data.frame合并结果时,行数不一样,无法合并的主要内容,如果未能解决你的问题,请参考以下文章

《团队-爬取豆瓣电影TOP250-需求分析》

python爬取豆瓣电影Top250(附完整源代码)

团队-爬取豆瓣电影TOP250-开发环境搭建过程

团队-爬取豆瓣电影TOP250-开发环境搭建过程

《团队-爬取豆瓣电影TOP250-成员简介及分工》

《团队-爬取豆瓣电影TOP250-设计文档》