100%好评的教授科研:使用机器学习的方法做数据分析
Posted 爱科研背景提升
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了100%好评的教授科研:使用机器学习的方法做数据分析相关的知识,希望对你有一定的参考价值。
随着中国金融市场的不断开放,信用评级在国内也十分重要和普遍。大了可以往贷款买房、买车、信用卡额度等方面考量,小了可以从日常生活中常用的“花呗”、“借呗”、共享单车免租金权限等方面说起。个人征信的重要性想必大家都有所了解,一旦有了“欠钱不还”的行为出现,很可能就会出现在“老赖”名单上。为了防止这种情况发生,各大借贷机构与平台一定会做出预估和判断,那我们每个人的信用等级究竟是如何评定的呢?
在本项目中,导师就将带领同学们了解并学习:
如何使用Machine Learning的方法预测个人借贷者的风险水平,并向大家展示Machine Learning的算法如何帮助我们对客户进行信用评级;
同学们可以通过对该课题的学习,进一步自选课题深入研究;
补充阅读:
信用评级(Credit Rating)是指对个人或者组织进行金融偿付能力的测评,在西方已经有了上百年的历史,它在金融市场的稳定发展中扮演了重要的角色。投资者可以通过参考信用评级机构对不同金融产品做出的风险评估来做出最优的投资决定,同时借贷者可以凭借信用评级机构对自己的风险评估,来拓宽自己的融资渠道。现在世界上最大的三家信用评级机构分别为标普(Standard & Poor's)、惠誉(Fitch Group)和穆迪 (Moody's)。
同时,个人对个人贷款(P2P Lending)在中国也发展的很快,中国的P2P市场的市值在2018年达到了2000亿美金。然而,由于信用评级的缺失与不足,P2P Lending市场充斥了大量高风险的借贷者,这也导致了中国个人借贷市场从2018年开始的严重下滑。
关于导师
南洋理工大学商学院 | 助理教授
Researchera Senior Mentor
研究领域:数字经济与机器学习
* 更多导师详情,请咨询科研顾问
项目安排
本项目为线上进阶科研, 导师授课、练习实战+导师1V1指导,完成课程学习、选题、研究实战探索及报告撰写。
Phase 1 | 远程预习 2-Week
在课程开始之前,导师提供必要的阅读、课程及练习题,为在线课程做预习,补充知识短板。
Read the recommended textbook.
Download R and RStudio.
Learn some basics about R.
Install Selectorgadget.
Finish Exercise 0(预习作业)
完成预习材料的学习和预习作业,确保项目开始前掌握关键的R语言技巧,熟悉主要课程概念和背景;
Phase 2 | 导师授课+研讨答辩 7-Week
Week 1:对课题及涉及到的内容进行介绍
Motivation.
Web crawler: SelectorGadget, rvest.
Supervised Learning and Unsupervised Learning.
Week 2:机器学习算法 I
Categorical Variable and Continuous Variable.
Linear Models.
Multicollinearity.
Entropy.
Decision Tree.
Implementation in R.
Week 3:机器学习算法 II
Advanced Tree Based Models.
Neural Network.
Unstructured Data.
Text Analysis.
Implementation in R.
Week 4:确定选题
1V1 office hour.
Find the topic.
Week 5:数据分析
1V1 office hour.
Try to analyze the data.
Week 6:机器学习算法的实现
1V1 office hour.
Apply machine learning algorithms to do predictions.
Week 7: 结课答辩
Presenting your work to the class.
Phase 3 | 报告撰写+导师反馈 1-Week
Week 8:完成报告撰写
Finish the write up of the report and the mentor will give his feedback in one week.
*每周课后需要至少6h自我学习与研讨时间
项目收获
项目结束后,你可以:
建造属于自己的网络爬虫从网站上提取信息;
理解不同种类的机器学习算法;
学习适用于不同种类商科类问题的机器学习算法;
使用 R 分析非结构化数据;
用 R语言(Python)编辑和实现机器学习的算法;
你将收获:
积极参与项目,完成课题探索,表现优异可获得导师学术推荐(详情咨询科研顾问);
导师签发的项目结课证明(电子版);
招生要求
我们建议你熟悉:
概率学:常见分布;
统计学:平均值、中位数、模式、最大似然率;
推荐读物:谢尔登·罗斯(Sheldon Ross)的《概率论基础教程》;
本项目使用双语教学,提交英文研究报告,要求学员有较好的英语基础;
本项目适合想要申请统计学、商业分析、数据科学、市场营销、金融工程、金融学、计算机科学等相关领域的同学,提升科研背景;
* 提供个人简历进行初步筛选
开始时间
2021年 2月
开课形式
远程线上 Workshop
科研小班,占位从速
报名方式
添加科研顾问并备注“NTU数据分析”
发送个人CV,了解项目详情
↓↓ 点击图片,查看更多该项目学员亲历分享 ↓↓
以上是关于100%好评的教授科研:使用机器学习的方法做数据分析的主要内容,如果未能解决你的问题,请参考以下文章
科研不是比赛,而是一种对未知和完美的自我追求——跟邢波(Eric Xing)面对面聊科研