R爬取网页信息

Posted 马家寨香椿

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了R爬取网页信息相关的知识,希望对你有一定的参考价值。

#爬取电影票房信息
library(stringr)
library(XML)
library(maps)
#htmlParse()用来interpreting HTML
#创建一个object
movie_parsed<-htmlParse("http://58921.com/boxoffice/wangpiao/20161004",
                        encoding = "UTF-8")
#the next step:extract tables/data
#readHTMLTable() for identifying and reading out those tables
tables<-readHTMLTable(movie_parsed,stringsAsFactors=FALSE)
is.matrix(tables)
is.character(tables)
is.data.frame(tables)
is.list(tables)
#so we got an "list" format#

以上是关于R爬取网页信息的主要内容,如果未能解决你的问题,请参考以下文章

Python爬取网页全代码

怎么利用爬虫技术抓取淘宝搜索页面的产品信息

爬取网页数据

python3 怎样爬取动态加载的网页信息

网页爬取

Python使用BeautifulSoup爬取网页信息