不会编程,不会机器学习,来来来,试试OAC
Posted 甲骨文云技术
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了不会编程,不会机器学习,来来来,试试OAC相关的知识,希望对你有一定的参考价值。
越来越多的业务人员,想从身边的数据当中挖掘更多的价值,但没有学过编程,不知道numpy、pandas是什么,也不知道scikit-learn是什么。怎么能用最简便的方式,探索身边的数据,如何以最优雅的方式进行展现?Oracle Analytics Cloud为您提供了完美的解决方案。
什么是 Oracle 分析云?
Oracle 分析云 (OAC) 是新推出的一个综合性分析平台,支持在任意规模下、任意环境中(云、内部部署、桌面和数据中心)制定分析策略。从自助式的数据可视化和数据准备,到企业报告和高级分析,再到用户驱动的动态假设建模,乃至提供前瞻性洞察的自主学习型移动分析,OAC 提供了您所需的一切必要功能。通过 OAC,您可以随时通过任意设备提出有关任意数据的问题,以便从分析中获得所期望的有价值信息。
Oracle 分析云包括哪些服务?
OAC 包括以下服务:
Oracle 数据可视化云服务 (DVCS)
Oracle 商务智能云服务 (BICS)
Oracle Essbase
Oracle Smartview
Oracle Day by Day
Oracle分析云的分类
标准公有云服务,通过Oracle强大的公有云计算能力,让您通过笔记本电脑、平板电脑、手机或者其他移动终端对多种数据源随时进行快速的数据探索,并将结果分享给他人。
Oracle桌面版数据可视化工具(Oracle Data Visualization Desktop),在个人电脑上安装Oracle数据可视化工具(包含R及机器学习组件),通过本地计算资源,对各种类型数据源进行数据探索。
移动终端App,通过在智能移动设备上安装Oracle Synopsis,对您移动设备上接收的Excel等数据文件进行快速的数据可视化展现。
接下来我们就以桌面版数据分析工具,在不进行编程的情况下,使用机器学习与可视化数据展现技术,进行数据探索。假设一个留学中介机构,想通过分析美国当前的工作申请情况为前来咨询的客户提供一份出国留学计划书。他想通过数据分析知道就读美国的哪个州的哪所大学,选择哪个专业,在毕业之后更容易获得H1B签证并留在美国工作。
为了得到以上的分析结果,我们需要H1B签证申请情况的数据,以及美国大学开设专业的数据。在美国移民局可以下载H1B签发情况的数据集,通过搜索引擎也很容易找到各种格式的美国大学专业设定的数据集。
我们想通过OAC了解一下情况:
数据基本情况。
签证申请的批复状态分布。
近年来H1B签证申请的数量变化。
容易获得批准的行业分布。
开设最流行专业的大学在地区上的分布。
数据处理的第一步就是数据的加载,在OAC当中支持几十种数据源,从最简单的CSV、Excel到各种云端数据源统统没有问题。本次下载的文件是文本文件,OAC可以轻松处理。
首先我们要了解数据集中各字段的数据情况,在OAC当中可以轻松地使用内嵌的Machine Learning算法获取该字段的数据分布,并通过文字来描述该字段信息。比如我们观察到数据集当中有一个字段叫做FULL_T,我们想了解该字段的情况,只需要通过右键点击该字段就可以获得它的描述。通过观察,我们发现在两百多万个申请当中,该字段的值有86%是Y,有14%是N。我们通过字段名称可以推测该字段应该是工作性质是否为全职。
接下来我们想了解在这两百多万个申请当中,签证批复的状态分布。只需要将签证状态和ROW_COUNT拖入展示区,并选择饼图作为展现图形就可以。通过下面的饼图可以看到,大部分的申请都是被批准的状态。看来,只要公司帮助提交申请,获得签证的可能性还是非常大的。
我们想知道每年递交申请的数量的变化趋势,使用条形图及趋势线是一个很好的选择。只需要将YEAR和ROW_COUNT拖入展示区,并使用CASE_STATUS(签证状态)作为颜色分类,然后添加趋势线即可。通过观察,每年的签证申请数量在逐渐上升。
接下来我们要了解已经获得H1B签证的申请者在行业上的分布,我们还是使用饼图显示。因为申请者所在的行业众多,我们只保留获得签证的数量在3万条以上的行业。通过下图观察,这些职业分类主要都是计算机相关专业。看来,学习Computer Science是一个很好的选择。
接下来我们想知道哪些公司招聘这些行业的人员,以及这些公司在各个州招聘的人数分布情况。通过观察我们看到最热门的职位分类是Computer Systems Analytics,招聘人数最多的公司是INFOSYS,并且该公司在加州招聘人数最多。
如果想去加州工作,那么我们看看加州有哪些大学开设了计算机相关的专业。先制作一张地图,并以地图为过滤器,在下面通过表格将该地区的大学里面program名称中含有computer的学校及专业显示出来,因为本次使用的数据集为抽样数据集,所以并没有显示出所有学校信息,大家如果在网络上找到更完整的数据集将得到更多的学校信息。
海量数据的分析处理
以上的数据分析与展现不需要编写代码,只需要通过拖拽的方式,将数据拖入展示区即可生成。如果数据源的数据量比较小,在本地可以完成分析,如果数据源是数据库中的海量数据,个人电脑的处理能力是不能满足的,那应该怎么办呢?
Oracle Analytics Cloud是一种云服务,可以在cloud.oracle.com上开通,利用Oracle强大的云计算资源,快速地进行海量数据的分析。
云端的数据分析方法和本地完全一致,使用Oracle云计算资源,您将获得更迅速的数据分析体验。
在手机上分析数据
当我们在手机上收到Excel或者CSV文件的时候,可以在手机上启动Oracle Synopsis对文件进行可视化展现。这个App可通过Apple Store进行下载并安装,安卓系统用户也可以在网络上找到apk安装文件。我们将上面例子当中的数据源通过邮件或者社交软件发送到手机上,使用Synopsis进行数据探索,请参考如下视频。
学习资源
更多有趣的数据源可以在这里进行下载https://data.world/
OAC官方网站:https://cloud.oracle.com/zh_CN/oac
OAC官方文档:https://docs.oracle.com/en/cloud/paas/data-visualization-cloud/index.html
OAC教学视频:https://docs.oracle.com/en/cloud/paas/data-visualization-cloud/videos.html
作者简介
Henry Yin来自甲骨文云平台事业部,是Commercial行业的技术顾问。之前曾在Oracle University 授课多年,其幽默风趣的风格深受广大学员的喜爱。
编辑: 萧宇
以上是关于不会编程,不会机器学习,来来来,试试OAC的主要内容,如果未能解决你的问题,请参考以下文章