R语言网页数据抓取XML数据包
Posted R语言论坛
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了R语言网页数据抓取XML数据包相关的知识,希望对你有一定的参考价值。
有些网络上的数据无法复制粘贴,一个一个录入有点费时费力,此时用这种数据抓取方法,短短几句,简单实用。XML是一种可扩展标记语言,它被设计用来传输和存储数据。XML是各种应用程序之间进行数据传输的最常用的工具。
install.packages("XML")#安装XML
library(XML)#加载XML
url <- 'http://www.。。。'#要抓取的网址放入引号内
dt1 <- readhtmlTable(url,header = T)#读取网页内的表格数据
t1<-readHTMLTable(u,which=1) #读取网页中的第一张表
write.csv(t1,file="d:/t1.csv") #存储t1为CSV文档至D盘中
![R语言网页数据抓取XML数据包](https://image.cha138.com/20210418/a7ce4ccf241c4abb990c585cb1159b74.jpg)
![R语言网页数据抓取XML数据包](https://image.cha138.com/20210418/28f8759142514af1b0f1d16a9948dc93.jpg)
![R语言网页数据抓取XML数据包](https://image.cha138.com/20210418/ca7d807410324a74a47b4dd89862593b.jpg)
![R语言网页数据抓取XML数据包](https://image.cha138.com/20210418/b70474fcee57496b919dc6382b6b30b4.jpg)
doc1<-htmlParse(“…html”)#读取html文件
t2<-getNodeSet(doc1,”//table”)#读取成为表格
ttn<-readHTMLTable(t2[[n]])#读取所有表格中的第n个表格
ttn
#用此方法读取html文件,并存储成数据框格式
![R语言网页数据抓取XML数据包](https://image.cha138.com/20210418/6facecf49d0a496eb82698c6a5ce8111.jpg)
![R语言网页数据抓取XML数据包](https://image.cha138.com/20210418/cf624c015ff4432cb0bf4c9d494bffcd.jpg)
![R语言网页数据抓取XML数据包](https://image.cha138.com/20210418/28f8759142514af1b0f1d16a9948dc93.jpg)
![R语言网页数据抓取XML数据包](https://image.cha138.com/20210418/ca7d807410324a74a47b4dd89862593b.jpg)
![R语言网页数据抓取XML数据包](https://image.cha138.com/20210418/b70474fcee57496b919dc6382b6b30b4.jpg)
那些突然明白的道理:
越是让你“秒爽”的东西,往往危害性越大,比如:熬夜,刷短视频,打游戏。
这些事情往往偶尔一两次没什么大的影响,但最怕超过一定频率和界限,到达上瘾的地步,产生依赖后,不做难受,做了自责与愧疚。真正要做到自律很难,但的的确确应该明白什么才是对于自己是有用的事情。
![R语言网页数据抓取XML数据包](https://image.cha138.com/20210418/6facecf49d0a496eb82698c6a5ce8111.jpg)
![R语言网页数据抓取XML数据包](https://image.cha138.com/20210418/cf624c015ff4432cb0bf4c9d494bffcd.jpg)
![R语言网页数据抓取XML数据包](https://image.cha138.com/20210418/3390fe57810147fbb7de2731efc5cdbb.jpg)
![R语言网页数据抓取XML数据包](https://image.cha138.com/20210418/84a0671925f54940a50a0232073efa8e.jpg)
以上是关于R语言网页数据抓取XML数据包的主要内容,如果未能解决你的问题,请参考以下文章