R语言进阶| 来一场真正的爬虫文本挖掘股票分析实战!

Posted 棕榈学院

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了R语言进阶| 来一场真正的爬虫文本挖掘股票分析实战!相关的知识,希望对你有一定的参考价值。


R语言进阶| 来一场真正的爬虫、文本挖掘、股票分析实战!

R语言进阶| 来一场真正的爬虫、文本挖掘、股票分析实战!


R语言进阶| 来一场真正的爬虫、文本挖掘、股票分析实战!


没错,就是这一款「卖萌捏脸」的变脸换装类游戏,完完全全激发了各位宅男宅女的展示欲,足不出户,就能在游戏里和朋友「云旅游」「云打卡」全世界网红地。


Buddies, 你妈妈指责你成天抱着手机,你却死命顶嘴。

这下你逃不掉了!

有人能证明你的时间都去哪儿了。

Hey, big brother is watching you ! 

它就是R语言!


R语言进阶| 来一场真正的爬虫、文本挖掘、股票分析实战!


设想,如果我们能够拿到此款游戏的后台数据,我们就能够借助R语言将你的游戏数据可视化。


简单的说,R语言可以抓取你的这些数据:某一环节的页面停留时长,你的服装选择偏好,和好友的互动拍照次数等,再结合后台获取你的地区、人群等信息,就能精准描绘出你的捏脸行为画像」

——

你,就是当年捏QQ秀的那批人!(开玩笑哒)


R语言进阶| 来一场真正的爬虫、文本挖掘、股票分析实战!



R语言是什么?


 统计数据必杀技 


简单说来,R是应统计和数据而生的语言和环境。


它的出生就肩负着统计分析、绘图、数据挖掘的重要使命。具备良好数理统计知识背景的人使用起来更加得心应手。


总结:R语言数据处理+统计分析+可视化

R语言进阶| 来一场真正的爬虫、文本挖掘、股票分析实战!  收获  

 语法简单,易上手 


它与其他统计分析软件相比较,语法结构更简单,上手更快

如果你没有编程经验,但是学习工作中却经常需要统计、分析、绘图,那R语言将是你的首选


R语言进阶| 来一场真正的爬虫、文本挖掘、股票分析实战!


 应用场景广 


R语言在江湖上有“横跨文理工商”的美誉,从生活到学术的各种疑难问题,都可以尝试用R语言解决。


分析科研数据,到洞察客户行为习惯、再到预测股票、房价走势,统统不在话下。(你还可以预测北京2019年哪几天雾霾最严重)R语言进阶| 来一场真正的爬虫、文本挖掘、股票分析实战!


如果你已经在入门训练营中杀出一条血路,初步学习了R语言的入门知识,那么这一次用三个数据项目实战操练,来实现全面进阶!


这一次,请给自己从幼稚,走向成熟的机会叭!


R语言进阶| 来一场真正的爬虫、文本挖掘、股票分析实战!

(学院佩奇出镜??)

7日R语言进阶训练营简介


这一次,我们的训练营目的清晰,模式简单有针对性,理论实践结合,让大家在3个案例项目中实战操练,真正实现R语言的进阶应用。


我们邀请到牛津大学数学系的Wenwen学姐坐镇训练营,带领大家使用R语言抓取和分析网络数据,并绘制数据可视化的图表~


首先,先来了解这三个有趣的数据绘画游戏。R语言进阶| 来一场真正的爬虫、文本挖掘、股票分析实战!

老师必须给大家展示一波,集专业与艺术于一身的图图们...


R语言进阶| 来一场真正的爬虫、文本挖掘、股票分析实战!

(集合专业性和美感于一身的图图们)


项目一  网页爬虫


世界上最大的电影数据库---IMDB上,抓取前100部影片的相关数据和资料,并对抓取数据进行清洗,最后用ggplot2包将数据可视化。这样我们就了解到哪种类型的影片分数最高。


R语言进阶| 来一场真正的爬虫、文本挖掘、股票分析实战!

(IMDB网站是目前最为权威的电影资料网站之一)


蓝后,你就会得到这样一个blingbling的图图! 卖座最好的电影便一目了然啦。


R语言进阶| 来一场真正的爬虫、文本挖掘、股票分析实战!

划重点:

◆ 利用Rvest包进行数据抓取

◆ 数据的处理和分析

◆ 利用ggplot2包进行数据可视化


项目二 文本挖掘


这个项目中,你将学到如何从成千上万的信息文本中抓取你感兴趣的部分而我萌选择的文本,就是你们每天疯狂刷的Twitter


我们将带你选择与咖啡有关的推文,并分析再分析与Barista (咖啡品牌)关联度最高的词,最终生成可爱的词云图。这样,我们就知道在谈论Barista咖啡的时候,人们都在说些什么了。

R语言进阶| 来一场真正的爬虫、文本挖掘、股票分析实战!

(图图这么可爱,确定不自己来画一个吗!)

(可以根据喜好调整字体,布局和配色方案)


当然,如果你能拿到具体数据,我们也可以分析出,你喜欢的TA谈起你的时候,具体都有些什么评价。哇咔咔~R语言进阶| 来一场真正的爬虫、文本挖掘、股票分析实战!


划重点:

可爱的词云图的诞生

数据清洗+词频分析+数据包进行数据可视化


项目三 股票数据处理


在第三个项目中,大家会学会如何分析股票的价格走势,并找到可以获利的时机。


这个项目的重点是学习量化交易工具之Quantmod包的基本应用。老师会带领大家从雅虎获取苹果、微软、谷歌三位大佬的股票数据~


除了用Quantmod 包进行股票价格的抓取,老师还会带领大家用绘制烛台图CandleChart、进行数据的对数差异处理等。


R语言进阶| 来一场真正的爬虫、文本挖掘、股票分析实战!


绘图成就达成,掌声雷动...学好了这个项目,说不定哪天你就暴富了...R语言进阶| 来一场真正的爬虫、文本挖掘、股票分析实战!


划重点:


本次训练营适合有R语言基础的童鞋参加~

如果你觉得直接参与进阶课程有一定难度,可以先补上R语言入门课程,再来进阶课程杀敌~


参与方式:

立即免费领取R语言入门课程~


R语言进阶| 来一场真正的爬虫、文本挖掘、股票分析实战!


课程亮点

  收获  

你将收获一项稳扎稳打的技能基础,有一定使用R语言解决问题的能力,并且熟练地使用R做出精美的图表。R语言进阶| 来一场真正的爬虫、文本挖掘、股票分析实战!


 边学边练 

七节课,战线不长,不用咬牙就能坚持下来。七天难度适宜的作业,及时检验学习内容。R语言进阶| 来一场真正的爬虫、文本挖掘、股票分析实战!


  高效的交流互动  

超活跃学习社群,可以与同期学员交流讨论,相互解疑(悄悄说一句,我们的学员超优秀)。一个人坚持不下来,找到组织就有力量啦~R语言进阶| 来一场真正的爬虫、文本挖掘、股票分析实战!


7日R语言训练营修炼日程


R语言进阶| 来一场真正的爬虫、文本挖掘、股票分析实战!

课程奖励

基础奖励!


R语言进阶| 来一场真正的爬虫、文本挖掘、股票分析实战!


从所有认真完成7天课程学习+作业打卡的同学中,抽取50位同学获得——Amazon Gift Card(价值50RMB)


叠加奖励!


R语言进阶| 来一场真正的爬虫、文本挖掘、股票分析实战!

从所有认真完成7天课程学习+作业打卡的同学中,抽取5位同学再获得非常实用的——《统计学习导论-基于R应用》


天选之人!

Marshall 马歇尔复古音箱

R语言进阶| 来一场真正的爬虫、文本挖掘、股票分析实战!


Marshall这个品牌可以说大有来头了,可以说和Beatles同期开启了英国摇滚乐的历史。


《时代》杂志称它为:能买到的最好的无线音箱。它不仅是复古时髦的颜值担当,优质的重低音更能还原音乐现场的激情,让你在家做饭、学习也能飞起来!

最后!从所有认真完成7天课程学习+作业打卡的同学中,再抽取一位天选之同学获得——Marshall Action II 复古音箱,恭喜恭喜恭喜你呀! 


没错,就是那种刺激的,如果你足够幸运是可以拿到三份奖励的抽奖方式!


注:获奖名单2月4日将在学习群里公布。


适合人群


1. 学过R语言入门课程,想要学习进阶课程的宝宝们;

2. 沉迷科研,常写论文,需要学会更高阶的数据处理分析方法的同学们;

3. 想成为数据分析师、数据科学家、投资分析师或者税务人员、管理人员的求职小白;

4. 每天与数据打交道、想让自己的数据更智慧的金融精英/舆情分析员/数据新闻工作者/数据科学家们;

5.来自天南地北各个专业,想结合各行业的专业知识,做深度的业务数据处理与统计分析的你们~

讲师介绍

R语言进阶| 来一场真正的爬虫、文本挖掘、股票分析实战!


wenwen

牛津大学本科,芝加哥大学、牛津大学双硕士

硕士毕业于芝加哥大学金融数学

本科和硕士就读于牛津大学数学专业

在牛津大学完成研究生数学统计专业课程的学习

曾多次在学院开设Python 相关课程,讲课细致,深入浅出,广受好评。


课程形式


7节R语言进阶视频课程


录播课程+无限回看


报名规则

原价1299元/人

但是!开学季学院送福利!

即日起至北京时间1月28日

限时免费报名!


报名方式



长按识别此二维码,

回复关键词

「 R进阶 」

即可获得报名入口


以下课程报名未截止,欢迎继续上车










新课预报

金融工程系列课程,即将上架,敬请期待!



以上是关于R语言进阶| 来一场真正的爬虫文本挖掘股票分析实战!的主要内容,如果未能解决你的问题,请参考以下文章

R语言文本挖掘

R从网页抓取到文本分析全教程:影评的获取与分析

R从网页抓取到文本分析全教程:影评的获取与分析

R语言数据挖掘实战系列

R语言文本挖掘| 网页爬虫新闻内容

R语言文本处理中文分词并制作文字云