Python征途-01.Python概述
Posted 天生帅才
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Python征途-01.Python概述相关的知识,希望对你有一定的参考价值。
本文主要介绍Python的基础知识,包括以下内容:
1.Python的诞生和发展史
2.Python的应用领域
3.Python的特点和优缺点
4.Python解释器
5.Python2与3的区别
6.字符编码
7.进制转换
8.代码书写规范
-------------------------------- 完美的分割线 --------------------------------------
1.Python的诞生和发展史
1.1.Python介绍
Python(英国发音:/?pa?θ?n/ 美国发音:/?pa?θɑ?n/), 是一种面向对象、解释型计算机程序设计语言,由Guido van Rossum于1989年发明,第一个公开发行版发行于1991年。
Python是纯粹的自由软件, 源代码和解释器CPython遵循 GPL(GNU General Public License)协议。
1.2.Python发展史
1989年的圣诞节期间,为了打发在阿姆斯特丹时间,吉多·范罗苏姆(Guido van Rossum)决心开发一个新的脚本解释程序(Python语言的编译器),作为ABC语言的一种继承。Python这个名字,来自Guido所挚爱的电视剧Monty Python’s Flying Circus。
他对Python的期望是:介于C和shell之间,功能全面,易学易用,可拓展。
1991年,第一个Python编译器诞生。它是用C语言实现的,并能够调用C语言的库文件。Python创生之初便具有了:类,函数,异常处理,包含表和词典在内的核心数据类型,以及模块为基础的拓展系统。
1994年1月,发布Python 1.0,增加了 lambda, map, filter and reduce.
1999年,Python的第一个web框架Zope 1发布,Granddaddy of Python web frameworks was released in 1999.
2000年10月16日,发布Python 2.0,加入了内存回收机制,构成了现在Python语言框架的基础
2004年11月30日,发布Python 2.4,同年目前最流行的WEB框架Django 诞生
2006年9月19日,发布Python 2.5
2008年10月1日,发布Python 2.6,同年12月3日,发布Python 3.0
2009年6月27日,发布Python 3.1
2010年7月3日,发布Python 2.7
2011年2月20日,发布Python 3.2
2012年9月29日,发布Python 3.3
2014年3月16日,发布Python 3.4
2014年11月,官方宣布:Python2.7将在2020年停止支持,且不再有2.8及以上的版本,建议现有2.x版本的需要迁移到3.4及以上版本
2015年9月13日,发布Python 3.5
2016年12月23日,发布Python 3.6.0,目前最新版本为3.6.3,发布时间为20171003.
更新的3.7版本正在计划发布中
Python的官方网址为:https://www.python.org
Python的web框架
Being the grandaddy of Python web frameworks, Zope has grown into a family of frameworks over the years. Zope 1 was released in 1999. Zope 2 is both a web framework and a general purpose application server, today it is primarily used by ContentManagementSystems. Zope 3 is both a standalone framework and a collection of related libraries, which are also included with newer releases of Zope 2. All of the Zope frameworks include the ZODB, an object database for Python.
Tips:
百度百科: https://baike.baidu.com/item/Python/407313?fr=aladdin 维基百科: https://wiki.python.org/moin/ tiobe排行榜 https://www.tiobe.com/tiobe-index/
2.Python的应用领域
2.1.技术领域
1)系统运维
Python在与操作系统结合以及管理中非常密切,目前所有linux发行版中都带有python,且对于linux中相关的管理功能都有大量的模块可以使用,例如目前主流的自动化配置管理工具:SaltStack Ansible(目前是RedHat的)。目前在几乎所有互联网公司,自动化运维的标配就是python+Django/flask,另外,在虚拟化管理方面已经是事实标准的openstack就是python实现的,所以Python是所有运维人员的必备技能。
python已经成为自动化运维平台领域的实施标准,
2)云计算
云计算最火的语言, 典型应用OpenStack
3)WEB开发
python相比php\ruby的模块化设计,非常便于功能扩展;
有大量优秀的web开发框架,并且在不断迭代,如:Django,flask,他们都继承了python简单、明确的风格;
众多大型网站均使用Python开发:Youtube, Dropbox, 豆瓣。
4)金融
量化交易,金融分析,在金融工程领域,Python不但在用,且用的最多,而且重要性逐年提高。
原因:作为动态语言的Python,语言结构清晰简单,库丰富,成熟稳定,科学计算和统计分析都很牛逼,生产效率远远高于c,c++,java,尤其擅长策略回测
5)大数据
Python相对于其它解释性语言最大的特点是其庞大而活跃的科学计算生态,
在数据分析、交互、可视化方面有相当完善和优秀的库(python数据分析栈:Numpy Pandas Scipy Matplotlip Ipython)
形成了自己独特的面向科学计算的Python发行版Anaconda,而且这几年一直在快速进化和完善,对传统的数据分析语言如R MATLAB SAS Stata形成了非常强的替代性。
6)人工智能
基于大数据分析和深度学习而发展出来的人工智能本质上已经无法离开python的支持
目前世界优秀的人工智能学习框架如Google的TransorFlow 、FaceBook的PyTorch以及开源社区的神经网络库Karas等是用python实现的
微软的CNTK(认知工具包)也完全支持Python,而且微软的Vscode都已经把Python作为第一级语言进行支持。
7)图形GUI
PyQT, WxPython,TkInter
2.2.行业应用,Python在一些公司和组织的应用
豆瓣:公司几乎所有的业务均是通过Python开发的
知乎:国内最大的问答社区,通过Python开发(国外Quora)
春雨医生:国内知名的在线医疗网站是用Python开发的
谷歌:Google App Engine 、code.google.com 、Google earth 、谷歌爬虫、Google广告等项目都在大量使用Python开发
YouTube:世界上最大的视频网站YouTube就是用Python开发的
Facebook:大量的基础库均通过Python实现的
Dropbox:美国最大的在线云存储网站,全部用Python实现,每天网站处理10亿个文件的上传和下载
Instagram:美国最大的图片分享社交网站,每天超过3千万张照片被分享,全部用python开发
Redhat:世界上最流行的Linux发行版本中的yum包管理工具就是用python开发的
CIA:美国中情局网站是用Python开发的
NASA:美国航天局(NASA)大量使用Python进行数据分析和运算
搜狐、金山、腾讯、盛大、网易、百度、阿里、淘宝 、土豆、新浪、果壳等公司都在使用Python完成各种各样的任务。
3.Python的特点及优缺点
3.1.Python语言的特点
python是一门动态解释性的强类型定义语言
3.2.Python的优缺点
3.2.1优点:
1)优雅”、“明确”、“简单”
Python程序看上去总是简单易懂,初学者学Python,不但入门容易,而且将来深入下去,可以编写那些非常复杂的程序。
2)开发效率非常高
Python有非常强大的第三方库,基本上我们想通过计算机实现的任何功能,Python官方库里都有相应的模块进行支持,直接下载调用后,在基础库的基础上再进行开发,大大降低开发周期,避免重复造轮子。
3)是一门高级语言
当我们用Python语言编写程序的时候,无需考虑诸如如何管理程序使用的内存一类的底层细节
4)具备可移植性
由于它的开源本质,Python可以通过改动被移植在不同平台进行工作。如果我们避免使用依赖于系统的特性,那么所写Python程序无需修改就几乎可以在市场上所有的系统平台上运行
5)具备可扩展性
如果需要使一段关键代码运行得更快或者希望某些算法不公开,可以把该部分程序代码用C或C++编写,然后在Python程序中使用它们。
6)具备可嵌入性
可以把Python嵌入C或C++程序,从而向程序用户提供脚本功能。
3.2.2缺点:
1)速度较C语言慢
Python运行速度相比C语言确实慢很多,跟JAVA相比也要慢一些,但其实这里所指的运行速度慢在大多数情况下我们是无法直接感知到的,必须借助测试工具才能体现出来,大多数情况下Python已经完全可以满足我们对程序速度的要求,但是如果要写对速度要求极高的搜索引擎等,当然还是建议用C去实现。
Tips:
比如,用C运一个程序花了0.01s,用Python是0.1s,这样,虽然C语言直接比Python快了10倍,但是我们是无法直接通过肉眼感知的,因为一个正常人所能感知的时间最小单位也才是是0.15-0.4s左右
2)代码不能加密
因为PYTHON是解释性语言,所以它的源码都是以明文形式存放的。
但是,如果项目要求源代码必须是加密的,那么我们一开始就不应该选择用Python来去实现,所以这个其实不能算作是Python的缺点。
3)线程不能利用多CPU问题
这是Python被人诟病最多的一个缺点,GIL即全局解释器锁(Global Interpreter Lock),是计算机程序设计语言解释器用于同步线程的工具,使得任何时刻仅有一个线程在执行,Python的线程是操作系统的原生线程。在Linux上为pthread,在Windows上为Win thread,完全由操作系统调度线程的执行。一个python解释器进程内有一条主线程,以及多条用户程序的执行线程。即使在多核CPU平台上,由于GIL的存在,也会禁止多线程的并行执行。
拓展:编程语言分类及特点简介
编程语言主要从以下几个角度进行分类,编译型和解释型、静态语言和动态语言、强类型定义语言和弱类型定义语言。
1.1.编译型和解释型
CPU不能直接认识并执行我们写的语句,它只能认识机器语言(CPU指令集;二进制的形式);因此我们开发语言的Virtual Machine要将识别的开发语言转换成机器语言让CPU去执行;
那么就有两种以下两种方式:
编译型:编译器把源程序的每一条语句都编译成机器语言,并保存成二进制文件,这样运行时计算机可以直接以机器语言来运行此程序,速度很快;
编译型:解释器则是只在执行程序时,才一条一条的解释成机器语言给计算机来执行,所以运行速度是不如编译后的程序运行的快的.
编译型 | 解释型 | 混合型 |
C | Java Script | Java |
C++ | Python | C# |
GO | Ruby | N/A |
Swift | PHP | N/A |
Ojbect-C | Perl | N/A |
1.2.编译和解释型优缺点
编译型
优点:编译器一般会有预编译的过程对代码进行优化。因为编译只做一次,运行时不需要编译,所以编译型语言的程序执行效率高。可以脱离语言环境独立运行。
缺点:编译之后如果需要修改就需要整个模块重新编译。编译的时候根据对应的运行环境生成机器码,不同的操作系统之间移植就会有问题,需要根据运行的操作系统环境编译不同的可执行文件。
解释型
优点:有良好的平台兼容性,在任何环境中都可以运行,前提是安装了解释器(虚拟机)。灵活,修改代码的时候直接修改就可以,可以快速部署,不用停机维护。
缺点:每次运行的时候都要解释一遍,性能上不如编译型语言。
2.1.静态和动态语言(静态类型语言和动态类新语言)
动态类型语言:
动态类型语言是指在运行期间才去做数据类型检查的语言,在用动态类型的语言编程时,永远也不用给任何变量指定数据类型,该语言会在你第一次赋值给变量时,在内部将数据类型记录下来。
Python和Ruby就是一种典型的动态类型语言,其他的各种脚本语言如VBScript也多少属于动态类型语言。
静态类型语言:
静态类型语言与动态类型语言刚好相反,它的数据类型是在编译其间检查的,也就是说在写程序时要声明所有变量的数据类型。
C/C++是静态类型语言的典型代表,其他的静态类型语言还有C#、JAVA等。
3.1.强类型和弱类型定义语言
强类型定义语言在速度上可能略逊色于弱类型定义语言,但是强类型定义语言带来的严谨性能够有效的避免许多错误。
另外,“这门语言是不是动态语言”与“这门语言是否类型安全”之间是完全没有联系的!
例如:
Python是动态语言,是强类型定义语言(类型安全的语言);
VBScript是动态语言,是弱类型定义语言(类型不安全的语言);
JAVA是静态语言,是强类型定义语言(类型安全的语言)。
强类型定义语言:
是强制数据类型定义的语言。一旦一个变量被指定了某个数据类型,如果不经过强制转换,那么它就永远是这个数据类型了。
举个例子:如果你定义了一个整型变量a,那么程序根本不可能将a当作字符串类型处理。强类型定义语言是类型安全的语言。
弱类型定义语言:
数据类型可以被忽略的语言。它与强类型定义语言相反, 一个变量可以赋不同数据类型的值。
所以:python是一门动态解释性的强类型定义语言。
4.Python解释器
当我们编写Python代码时,我们得到的是一个包含Python代码的以.py为扩展名的文本文件。要运行代码,就需要Python解释器去执行.py文件。
由于整个Python语言从规范到解释器都是开源的,所以理论上,只要水平够高,任何人都可以编写Python解释器来执行Python代码(当然难度很大)。事实上,确实存在多种Python解释器。
1)CPython
当我们从Python官方网站下载并安装好Python 2.7后,我们就直接获得了一个官方版本的解释器:CPython。这个解释器是用C语言开发的,所以叫CPython。在命令行下运行python就是启动CPython解释器。
CPython是使用最广的Python解释器。教程的所有代码也都在CPython下执行。
2)IPython
IPython是基于CPython之上的一个交互式解释器,也就是说,IPython只是在交互方式上有所增强,但是执行Python代码的功能和CPython是完全一样的。好比很多国产浏览器虽然外观不同,但内核其实都是调用了IE。
CPython用>>>作为提示符,而IPython用In [序号]:作为提示符。
3)PyPy
PyPy是另一个Python解释器,它的目标是执行速度。PyPy采用JIT技术,对Python代码进行动态编译(注意不是解释),所以可以显著提高Python代码的执行速度。
绝大部分Python代码都可以在PyPy下运行,但是PyPy和CPython有一些是不同的,这就导致相同的Python代码在两种解释器下执行可能会有不同的结果。如果你的代码要放到PyPy下执行,就需要了解PyPy和CPython的不同点。
4)Jython
Jython是运行在Java平台上的Python解释器,可以直接把Python代码编译成Java字节码执行。
5)IronPython
IronPython和Jython类似,只不过IronPython是运行在微软.Net平台上的Python解释器,可以直接把Python代码编译成.Net的字节码。
总结:
Python的解释器很多,但使用最广泛的还是CPython。
如果要和Java或.Net平台交互,最好的办法不是用Jython或IronPython,而是通过网络调用来交互,确保各程序之间的独立性。
5.Python2与3的区别
What are the differences? In summary : Python 2.x is legacy, Python 3.x is the present and future of the language https://wiki.python.org/moin/Python2orPython3
摘录一段官方的说明:
Python 3.0 was released in 2008. The final 2.x version 2.7 release came out in mid-2010, with a statement of extended support for this end-of-life release. The 2.x branch will see no new major releases after that. 3.x is under active development and has already seen over five years of stable releases, including version 3.3 in 2012, 3.4 in 2014, 3.5 in 2015, and 3.6 in 2016. This means that all recent standard library improvements, for example, are only available by default in Python 3.x. Guido van Rossum (the original creator of the Python language) decided to clean up Python 2.x properly, with less regard for backwards compatibility than is the case for new releases in the 2.x range. The most drastic improvement is the better Unicode support (with all text strings being Unicode by default) as well as saner bytes/Unicode separation. Besides, several aspects of the core language (such as print and exec being statements, integers using floor division) have been adjusted to be easier for newcomers to learn and to be more consistent with the rest of the language, and old cruft has been removed (for example, all classes are now new-style, "range()" returns a memory efficient iterable, not a list as in 2.x).
5.1.性能
Py3.0运行 pystone benchmark的速度比Py2.5慢30%。Guido认Py3.0有极大的优化空间,在字符串和整形操作上可以取得很好的优化结果。
Py3.1性能比Py2.5慢15%,还有很大的提升空间。
现在Py3.x已经比Py2.x运行速度要快很多了。
5.2.编码
Py3.x: ALL IS UNICODE NOW
从此不再为讨厌的字符编码而烦恼
# Python3的bytes/str之别
http://www.ituring.com.cn/article/1116
Python 3最重要的新特性大概要算是对文本和二进制数据作了更为清晰的区分。文本总是Unicode,由str类型表示,二进制数据则由bytes类型表示。
Python 3不会以任意隐式的方式混用str和bytes,正是这使得两者的区分特别清晰。不能拼接字符串和字节包,也无法在字节包里搜索字符串(反之亦然),也不能将字符串传入参数为字节包的函数(反之亦然)。这是件好事。
音频视频类文件使用二进制数据保存的
5.3.语法
PRINT IS A FUNCTION
The statement has been replaced with a print() function, with keyword arguments to replace most of the special syntax of the old statement (PEP 3105). Examples:
2.X: print "The answer is", 2*2 3.X: print("The answer is", 2*2) 2.X: print x, # 使用逗号结尾禁止换行 3.X: print(x, end=" ") # 使用空格代替换行 2.X: print # 输出新行 3.X: print() # 输出新行 2.X: print >>sys.stderr, "fatal error" 3.X: print("fatal error", file=sys.stderr) 2.X: print (x, y) # 输出repr((x, y)) 3.X: print((x, y)) # 不同于print(x, y)!
5.4.Rename module(一些模块被重命名)
Old Name New Name
_winreg winreg
ConfigParser configparser
copy_reg copyreg
Queue queue
SocketServer socketserver
markupbase _markupbase
repr reprlib
test.test_support test.support
5.5.谁不支持python3?
Twisted在2016年的时候还没有完全支持
6.字符编码
6.1.编码发展史(关于中文的处理)
为了处理汉字,程序员设计了用于简体中文的GB2312和用于繁体中文的big5。
1980年,设计出GB2312,是支持中文的第一张表,收录7445个中文字符,包括6763个汉字和682个其他符号
1995年,设计出GBK1.0,扩展了更多的汉字支持,收录21886个中文字符,
2000年,设计出GB18030,是取代GBK1.0的正式国家标准,该标准收录27484个汉字,和其他藏文,蒙文,维吾尔文等主要的少数名族文字,
现在的PC平台要求必须能支持GB18030,嵌入式产品不做要求,如手机,MP3等只需要支持GB2312即可
big5是台湾人民设计的用于支持繁体中文
以上的编码方法中,后面的标准兼容前面的标准,在这些编码中,英文和中文可以统一处理。区分中文编码的方法是高字节的最高位不为0。
按照程序员的习惯,GB2312、GBK1.0到GB18030都属于双字节字符集 (DBCS)。
有的中文Windows的默认内码是GBK,可以升级到GB18030。不过GB18030相对GBK增加的字符,普通人很难用到,通常我们还是用GBK指代中文Windows内码。
由于ASCII码无法表示世界上的所有文字和符号,所以,设计出一个可以表示所有国家和地区的字符和符号的编码:Unicode
Unicode万国码,也称为统一码,单一码,规定:所有的字符和符号最少由16位(2个字节)来表示,即:2 **16 = 65536,
注:此处说的的是最少2个字节,可能更多
2**16 = 65535 = 存一个字符 统一占用2个字节
UTF-8 = unicode 的扩展集,可变长的字符编码集
ASCII -->Gb2312 ->gbk1.0-->gb18030 ASCII -->unicode -->utf-8 /utf-16
6.2.Python的字符编码
python解释器在加载 .py文件中的代码时,需要对内容进行编码,默认使用ASCII对内容进行转换二进制代码
ASCII(American Standard Code for Information Interchange,美国标准信息交换代码)是基于拉丁字母的一套电脑编码系统,主要用于显示现代英语和其他西欧语言,
ACSII表规定每个字符最多只能用 8 位(8个bit)来表示一个字节,即所有字符都各占1个字节,即:2**8 = 256-1,所以,ASCII码最多只能表示 255 个符号。
注意:
(1)Python2.x中的默认编码是ASCII不支持中文,如果想让python2.7支持中文,有以下2种方式
1)编辑py程序msg.py,在文前申明
vim msg.py
#! -*- coding:utf-8 -*- 或者 # coding:utf-8 msg = "今天天气真不错" print(msg)
python msg.py
今天天气真不错
2)变量值前加个字母“u”
>>>msg = u"今天天气真不错" >>>print(msg)
今天天气真不错
(2)Python3.x中的默认编码是unicode,支持中文,不需要申明
unicode 是向下兼容gb2312 , gbk
7.进制转换
关于进制转换本文不再赘述,可以参考下文
http://jingyan.baidu.com/article/495ba84109665338b30ede98.html
8.代码书写规范
8.1.文件扩展名(后缀)
最具常识性的问题,是哪种类型的文件就存成那种文件类型的后缀,让人一眼就可以看出来写的是什么代码,不要太low了
以下是一些常见的文件扩展名,供参考:
.txt 记事本文本文件
.py python文件
.java java 文件
.c .h c源码
.php php文件
.js javascript
8.2.缩进和空格
python中使用缩进体现代码的逻辑性
该缩进的必须缩进,tab键和空格键都可以实现缩进的功能,但是,必须且同时只能单独只使用一种缩进方式
注意:
在windows下,notepad++中tab键和4个空格的长度一样,但是效果却完全不一样
官方建议敲4个空格进行缩进,在notepad中可以手动设定tab键修变为4个空格,方便程序开发
8.3.注释
(1)注释的用处
1)方便自己或者他人友好的阅读代码,增进对代码的感情
2)。。。
(2)注释的类型
1)单行注释:在被注释内容前加井号
#【被注释内容】
2)多行注释:在被注释内容前后使用3个引号进行注释,引号可以是单引号也可以是双引号,但必须成对出现
‘‘‘【被注释内容】‘‘‘ 或者是 """【被注释内容】"""
(3)注释符号的其他应用:打印多行内容
>>> msg=‘‘‘ ... aaa ... bbb ... ccc ... ‘‘‘ >>> print(msg) aaa bbb ccc
>>> msg="aaa bbb ccc" >>> print(msg) aaa bbb ccc
使用注释符号可以打印出多行的内容,而字符串赋值中多个字符串打印是在同一行
完毕,呵呵呵呵
以上是关于Python征途-01.Python概述的主要内容,如果未能解决你的问题,请参考以下文章
10行代码集2000张美女图,Python爬虫120例,再上征途