Python从入门到数据分析第一篇—Python简介- Python介绍与初探
Posted 程序员与Python
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Python从入门到数据分析第一篇—Python简介- Python介绍与初探相关的知识,希望对你有一定的参考价值。
一直以来以分享Python、数据分析、数据科学为主,即使有了大受好评的程序入门系列,但考虑到多数文章使用分析工具都以Python为主,决定撰写这一系列文章帮助刚看完程序,对于Python数据分析感到好奇的朋友入门,并且衔接与实作我过往的文章。如此一来您能够透过这一系列文章学习Python程序语言,做Python商管程序设计,同时配合其他文章实作数据分析。
目前初步规划章节如下:
- Python简介:Python介绍与初探
- 变数与基础运算
- 条件
- 循环
- 函式
- 面向对象程序语言设计
- 迭代物件
- Python数据结构:String,List,Tuple
- Python数据结构:Dict,Set
- 数据处理Pandas / Numpy
理论上读完所有章节可以预期您学习完毕大学程度的一学期程序语言课程,能够使用Python作到自动化部分Excel工作、了解基础电脑科学知识、基础程序语言知识,并且透过进一步项目来学习完成项目所需学习的其他Python library。
Python概述—什么是Python?
Python的创始人为吉多·范罗苏姆,当时他在阿姆斯特丹的荷兰数学和计算机科学研究学会工作。1989年的圣诞节期间,吉多·范罗苏姆为了打发时间,决心开发一个新的指令码解释程序,作为ABC语言的一种继承,替代使用Unix shell和C语言进行系统管理,担负同Amoeba操作系统的互动和例外处理。
之所以选中Python作为程序的名字,是因为他是BBC电视剧——《蒙提·派森的飞行马戏团》(Monty Python’s Flying Circus)的爱好者。
Python支持多种程序设计范式,包括函数式、指令式、结构化、面向对象和反射式程序。它拥有动态型别系统和垃圾回收功能,能够自动管理內存使用,并且其本身拥有一个巨大而广泛的标准库。
Why Python?Python商管程序设计定位?
其实许多工具都能够作为数据分析的利器,比如Google Analytics、Power BI、Tableau,许多程序语言也具有开发为数据分析工具的能力,比如股票、金融分析常用的C#/C++、常用于统计、计量运算的R,甚至操作数据库语言SQL、熟悉的电子表格应用开发Excel VBA,那为什么我会挑选Python作为数据分析的工具呢?相比与「软件」与「其他程序语言」,为何是Python?
胜过软件:方便度、弹性
Python弹性相比软件高出非常多,比如我可以自己撰写SPSS、SAS等分析功能,透过自己撰写来达到客制化效果,甚至运用Plotly等Python库来做酷炫、互动式的数据可视化
胜过程式语言:端到端数据处理,一次搞定
Python满足数据抓取、基础数据分析、数据处理的良好特质,又蕴含强大的计算效果,甚至可以进一步开发为数据产品(比如数据仪表板、机器学习可解释性仪表板),意思就是,作为运行端到端数据分析的工具,我只需要透过Python基本上是可以满足所有需求的。
为什么这很重要呢?因为过去许多分析师的做法是下载数据直接从数据库读入、对于爬虫不熟悉,用Excel分析,但受限于数据量与可视化不够直觉因此拖慢效率与处理性能,最后要输出报表也只能透过大量截图、截表格再放到word、PPT上
但透过Python可以直接满足整个数据收集、分析、输出、产品化流程,甚至输出成报表、嫁接到网页上等来呈现。
而其他Python特点如下:
- 开源/免费:个人可增加数据力,企业可增强运行效率
- 强大的学习交流和培训资源:学习资源多,99%遇到问题可透过Google解决
- 开发效率高:数位转型必备
- 简单易学:对于第一门程序语言入门友善
- 可移植性强:跨平台开发,不必担心硬件与系统
- 与其他语言的集成:集成性高,是好的工程师team player
- 扩展性强:学过基础,想要拓展到其他分析、产品等应用领域都很容易
我将会分述如下:
开源/免费
Python是FLOSS(自由/开放原始码软件)之一,使用Python(及其第三方库)无需任何产品购买,授权或许可费用,举例来说相比于许多企业常用的SAS、SPSS,Python基本上都能达到相同的功能,但不分团体或者个人均为免费。
强大的学习交流和培训资源
Python已经成为世界上最主流的数据分析工具与程序语言,有非常多的学习社群,Blog,论坛,培训,教育机构提供了许多交流、互相学习的机会。
开发效率高
Python语言简洁。这对于以效率优先的程序工作或验证性项目非常关键,尤其是在数位转型需求上特别重要,举例来说通常我们不确定一个数位项目的导入对于企业的影响,此时用Python可以快速构建一个MVP(最小可行性产品)尝试数位使用案例对组织的影响,方便又零成本。
简单易学
Python语法简单,没有任何程序语言基础的人也能在几个小时能掌握基本的Python语法与撰写方法。这对于初学者而言很友善,透过英文式语法就可以学习使用Python来运算,并且完成许多Excel的数据自动化处理需求。
可移植性
Python可以跨Windows,Linux,Mac等多平台运行,这使得它的移植性非常强,一次开发,多平台应用。
与其他语言的集成
Python具有“胶水”能力,能与Java,C,C ++,MATLAB,R等集成使用,这意味着你既可以把其他语言写到的脚本嵌入Python,也可以把Python Script嵌入其他语言(比方说我可以把Python嵌入C/C++),集成不同代码。
扩展性强
通常写程序很多功能不需要自己写,工程师习惯透过模块化来重复利用某些特定功能,这个我们在库与包章节会详细介绍,Python具有丰富的结构化和非结构化包与程序库,可以透过方便的pip来快速安装、使用。
- 信息工程方面:线程、正规表示法、网页浏览、电子邮件、XML、GUI(图形化用户界面)
- 数据分析方面:Python自带数学、科学计算库,还包括丰富的第三方库和工具,例如用于连接Oracle,mysql,SQLite等数据库连接,数据科学计算库Numpy,Sciy,Pandas,文本处理库NLTK,机器学习库Scikit-Learn,Theano,图形视频分析处理和挖掘库PIL和Opencv以及开源计算框架Tensorflow等。
之后我们会透过Colab来学习写程序与实作Python
下一章开始,我就会开始带大家正式开始写程序,因为Python已经被大量使用,我们可以透过Google云端来建立写程序的界面(甚至提供机器学习的免费运算资源),帮助大家跳过繁杂的环境设定而专心在语言学习上面。
那么这就是本次的第一篇:Python从入门到数据分析—Python介绍与初探,下一章我们就会开始介绍基础的变数啰!
欢迎对数据分析、商业策略有兴趣的读者追踪,我们下一篇文章见!
欢迎想学习Python数据科学、商业分析、金融知识的人一起交流!
本部落格的内容全部都是基于「分享」的实作、理论兼顾文章,希望能够帮助到所有对数据科学领域有兴趣的人们,
若喜欢我在CSDN的内容,可以点个赞,好让我知道你喜不喜欢这篇文章:
收藏一下:签个到,表示支持(谢谢鼓励!)
关注一下:想要我多写「python数分相关」
三连一下:我有你这读者写这篇也心满意足了!
敬请期待下一篇!或是您也可以逛逛我的其他文章
以上是关于Python从入门到数据分析第一篇—Python简介- Python介绍与初探的主要内容,如果未能解决你的问题,请参考以下文章