如何使用“选择器小工具”将数据抓取到 R 中?
Posted
技术标签:
【中文标题】如何使用“选择器小工具”将数据抓取到 R 中?【英文标题】:how to use 'selector gadget' to scrape data into R? 【发布时间】:2014-12-26 14:21:44 【问题描述】:我已经设法从网站中选择了所需的内容,使用“选择器小工具”帮助创建了一个“css 选择器”。如何将我选择的内容导出到“R”或使用生成的 css 选择器从该网站上抓取数据?如果您有这样做的想法或经验,任何人都可以指导我。任何帮助表示赞赏。 谢谢
【问题讨论】:
您没有提供任何具体细节以便提供具体建议。如果您至少显示一些您正在使用的代码,那将会很有帮助。您是否尝试过在 R 中下载文件或从网页中抓取任何数据?我敢肯定有很多教程会弹出,快速谷歌搜索基础知识。 感谢弗利克先生的回复。内容的url是“manuals.bioinformatics.ucr.edu/home/ht-seq”。我不能共享代码只是因为我没有编写任何代码。 .我用鼠标选择了网站的某些内容,我将尝试分享相同的屏幕抓取,结果代码是“”.sites-codesn-p-block“”这是我所做的css选择。 我不懂 R,但大多数语言都有一个 CSS 解析库,您可以使用该库来提取文本。请参阅 Ruby 中的 Nokogiri 或 Python 中的 beautifulsoup。 【参考方案1】:今天我遇到了这个网页,它通过动手教程帮助完美地回答了我自己的问题。
http://blog.rstudio.org/2014/11/24/rvest-easy-web-scraping-with-r/
我希望它有一些用处。
感谢大家及时的建议和意见。
【讨论】:
以上是关于如何使用“选择器小工具”将数据抓取到 R 中?的主要内容,如果未能解决你的问题,请参考以下文章