R语言进阶| 来一场真正的爬虫文本挖掘股票分析实战!
Posted 棕榈学院
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了R语言进阶| 来一场真正的爬虫文本挖掘股票分析实战!相关的知识,希望对你有一定的参考价值。
没错,就是这一款「卖萌捏脸」的变脸换装类游戏,完完全全激发了各位宅男宅女的展示欲,足不出户,就能在游戏里和朋友「云旅游」,「云打卡」全世界网红地。
Buddies, 你妈妈指责你成天抱着手机,你却死命顶嘴。
这下你逃不掉了!
有人能证明你的时间都去哪儿了。
Hey, big brother is watching you !
它就是R语言!
设想,如果我们能够拿到此款游戏的后台数据,我们就能够借助R语言将你的游戏数据可视化。
简单的说,R语言可以抓取你的这些数据:某一环节的页面停留时长,你的服装选择偏好,和好友的互动拍照次数等,再结合后台获取你的地区、人群等信息,就能精准描绘出你的「捏脸行为画像」
——
你,就是当年捏QQ秀的那批人!(开玩笑哒)
统计数据必杀技
简单说来,R是应统计和数据而生的语言和环境。
它的出生就肩负着统计分析、绘图、数据挖掘的重要使命。具备良好数理统计知识背景的人使用起来更加得心应手。
总结:R语言≈数据处理+统计分析+可视化;
收获
语法简单,易上手
它与其他统计分析软件相比较,语法结构更简单,上手更快。
如果你没有编程经验,但是学习工作中却经常需要统计、分析、绘图,那R语言将是你的首选。
应用场景广
R语言在江湖上有“横跨文理工商”的美誉,从生活到学术的各种疑难问题,都可以尝试用R语言解决。
从分析科研数据,到洞察客户行为习惯、再到预测股票、房价走势,统统不在话下。(你还可以预测北京2019年哪几天雾霾最严重)
如果你已经在入门训练营中杀出一条血路,初步学习了R语言的入门知识,那么这一次用三个数据项目实战操练,来实现全面进阶!
这一次,请给自己从幼稚,走向成熟的机会叭!
(学院佩奇出镜??)
这一次,我们的训练营目的清晰,模式简单有针对性,理论实践结合,让大家在3个案例项目中实战操练,真正实现R语言的进阶应用。
我们邀请到牛津大学数学系的Wenwen学姐坐镇训练营,带领大家使用R语言抓取和分析网络数据,并绘制数据可视化的图表~
首先,先来了解这三个有趣的数据绘画游戏。
老师必须给大家展示一波,集专业与艺术于一身的图图们...
(集合专业性和美感于一身的图图们)
项目一 网页爬虫
在世界上最大的电影数据库---IMDB上,抓取前100部影片的相关数据和资料,并对抓取数据进行清洗,最后用ggplot2包将数据可视化。这样我们就了解到哪种类型的影片分数最高。
(IMDB网站是目前最为权威的电影资料网站之一)
蓝后,你就会得到这样一个blingbling的图图! 卖座最好的电影便一目了然啦。
▌划重点:
◆ 利用Rvest包进行数据抓取
◆ 数据的处理和分析
◆ 利用ggplot2包进行数据可视化
项目二 文本挖掘
这个项目中,你将学到如何从成千上万的信息文本中抓取你感兴趣的部分。而我萌选择的文本,就是你们每天疯狂刷的Twitter!
我们将带你选择与咖啡有关的推文,并分析再分析与Barista (咖啡品牌)关联度最高的词,最终生成可爱的词云图。这样,我们就知道在谈论Barista咖啡的时候,人们都在说些什么了。
(图图这么可爱,确定不自己来画一个吗!)
(可以根据喜好调整字体,布局和配色方案)
当然,如果你能拿到具体数据,我们也可以分析出,你喜欢的TA谈起你的时候,具体都有些什么评价。哇咔咔~
▌划重点:
可爱的词云图的诞生≈
数据清洗+词频分析+数据包进行数据可视化
项目三 股票数据处理
在第三个项目中,大家会学会如何分析股票的价格走势,并找到可以获利的时机。
这个项目的重点是学习量化交易工具之Quantmod包的基本应用。老师会带领大家从雅虎获取苹果、微软、谷歌三位大佬的股票数据~
除了用Quantmod 包进行股票价格的抓取,老师还会带领大家用绘制烛台图CandleChart、进行数据的对数差异处理等。
绘图成就达成,掌声雷动...学好了这个项目,说不定哪天你就暴富了...
▌划重点:
本次训练营适合有R语言基础的童鞋参加~
如果你觉得直接参与进阶课程有一定难度,可以先补上R语言入门课程,再来进阶课程杀敌~
参与方式:
立即免费领取R语言入门课程~
收获
你将收获一项稳扎稳打的技能基础,有一定使用R语言解决问题的能力,并且熟练地使用R做出精美的图表。
边学边练
七节课,战线不长,不用咬牙就能坚持下来。七天难度适宜的作业,及时检验学习内容。
高效的交流互动
超活跃学习社群,可以与同期学员交流讨论,相互解疑(悄悄说一句,我们的学员超优秀)。一个人坚持不下来,找到组织就有力量啦~
基础奖励!
从所有认真完成7天课程学习+作业打卡的同学中,抽取50位同学获得——Amazon Gift Card(价值50RMB)
叠加奖励!
从所有认真完成7天课程学习+作业打卡的同学中,抽取5位同学再获得非常实用的——《统计学习导论-基于R应用》
天选之人!
Marshall 马歇尔复古音箱
Marshall这个品牌可以说大有来头了,可以说和Beatles同期开启了英国摇滚乐的历史。
《时代》杂志称它为:能买到的最好的无线音箱。它不仅是复古时髦的颜值担当,优质的重低音更能还原音乐现场的激情,让你在家做饭、学习也能飞起来!
最后!从所有认真完成7天课程学习+作业打卡的同学中,再抽取一位天选之同学获得——Marshall Action II 复古音箱,恭喜恭喜恭喜你呀!
没错,就是那种刺激的,如果你足够幸运是可以拿到三份奖励的抽奖方式!
注:获奖名单2月4日将在学习群里公布。
1. 学过R语言入门课程,想要学习进阶课程的宝宝们;
2. 沉迷科研,常写论文,需要学会更高阶的数据处理分析方法的同学们;
3. 想成为数据分析师、数据科学家、投资分析师,或者税务人员、管理人员的求职小白;
4. 每天与数据打交道、想让自己的数据更智慧的金融精英/舆情分析员/数据新闻工作者/数据科学家们;
5.来自天南地北各个专业,想结合各行业的专业知识,做深度的业务数据处理与统计分析的你们~
wenwen
牛津大学本科,芝加哥大学、牛津大学双硕士
硕士毕业于芝加哥大学金融数学
本科和硕士就读于牛津大学数学专业
在牛津大学完成研究生数学统计专业课程的学习
曾多次在学院开设Python 相关课程,讲课细致,深入浅出,广受好评。
7节R语言进阶视频课程
录播课程+无限回看
原价1299元/人
但是!开学季学院送福利!
即日起至北京时间1月28日
限时免费报名!
长按识别此二维码,
回复关键词
「 R进阶 」
即可获得报名入口
以下课程报名未截止,欢迎继续上车
❖新课预报❖
金融工程系列课程,即将上架,敬请期待!
以上是关于R语言进阶| 来一场真正的爬虫文本挖掘股票分析实战!的主要内容,如果未能解决你的问题,请参考以下文章