如何使用“选择器小工具”将数据抓取到 R 中?

Posted

技术标签:

【中文标题】如何使用“选择器小工具”将数据抓取到 R 中?【英文标题】:how to use 'selector gadget' to scrape data into R? 【发布时间】:2014-12-26 14:21:44 【问题描述】:

我已经设法从网站中选择了所需的内容,使用“选择器小工具”帮助创建了一个“css 选择器”。如何将我选择的内容导出到“R”或使用生成的 css 选择器从该网站上抓取数据?如果您有这样做的想法或经验,任何人都可以指导我。任何帮助表示赞赏。 谢谢

【问题讨论】:

您没有提供任何具体细节以便提供具体建议。如果您至少显示一些您正在使用的代码,那将会很有帮助。您是否尝试过在 R 中下载文件或从网页中抓取任何数据?我敢肯定有很多教程会弹出,快速谷歌搜索基础知识。 感谢弗利克先生的回复。内容的url是“manuals.bioinformatics.ucr.edu/home/ht-seq”。我不能共享代码只是因为我没有编写任何代码。 .我用鼠标选择了网站的某些内容,我将尝试分享相同的屏幕抓取,结果代码是“”.sites-codesn-p-block“”这是我所做的css选择。 我不懂 R,但大多数语言都有一个 CSS 解析库,您可以使用该库来提取文本。请参阅 Ruby 中的 Nokogiri 或 Python 中的 beautifulsoup。 【参考方案1】:

今天我遇到了这个网页,它通过动手教程帮助完美地回答了我自己的问题。

http://blog.rstudio.org/2014/11/24/rvest-easy-web-scraping-with-r/

我希望它有一些用处。

感谢大家及时的建议和意见。

【讨论】:

以上是关于如何使用“选择器小工具”将数据抓取到 R 中?的主要内容,如果未能解决你的问题,请参考以下文章

如何使用python将多个抓取的数据保存到mysql

R软件如何将爬虫得到的数据制成表格

循环抓取的数据以将数据存储在 R 中的数据框中

如何将抓取数据保存到 CSV 文件中?

如何将抓取的 Web 数据保存到多个 csv 文件中

R从网页抓取到文本分析全教程:影评的获取与分析