python的数据类型简介

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了python的数据类型简介相关的知识,希望对你有一定的参考价值。

ipython:原生python不具有命令行补全等功能,这个工具提供了类似shell的功能,方便学习使用
安装:
wget https://repo.continuum.io/archive/Anaconda2-5.1.0-Linux-x86_64.sh #利用这个工具来管理python版本
sh Anaconda2-5.1.0-Linux-x86_64.sh
conda search python
conda create -n py27 python=2.7 Anaconda #创建2.7的环境

1."一切皆对象“

例子1:

In [3]: name=‘jerry‘

In [4]: id(name)
Out[4]: 140621392396080

In [6]: name=‘tom‘

In [7]: id(name)
Out[7]: 140621403686472

name=‘jerry‘,为了方便理解可以看成name的值是‘jerry‘,但是当我们对name重新赋值的时候,并不是改变jerry这个值,而是新建一个值‘tom‘,再把name重新指向到tom,所以两次name的id不一样,‘jerry‘和‘tom‘这种值在python中不叫值,而是被认为是一个对象

python的核心概念就是‘一切皆对象‘,根据值的可变与否可以分为可变和不可变对象,我个人是这么理解的:
    "可变对象都是对不可变对象的引用集合,改变可变对象的值的时候,对象/值本身不改变,而是引用改变了"

例子2:

In [107]: l1="hehe"

In [108]: l2=[l1,"66"]

In [109]: print l2
[‘hehe‘, ‘66‘]

In [110]: l1="haha"

In [111]: print l2
[‘hehe‘, ‘66‘]

In [112]: id(l1)
Out[112]: 139910507684560

In [113]: l3="haha"

In [114]: id(l3)
Out[114]: 139910507684560

In [115]: l2=["haha","xxx"]

In [116]: id(l2[0])
Out[116]: 139910507684560

从这个例子可以看出:
    l2[0]引用的是l1的数据对象部分,当对l1重新赋值的时候,并不影响l2的值
    l1、l3和l2[0],引用的都是同一数据对象,所以id都相同
从上面就不难理解:‘python的变量没有类型,数据才有类型‘这句话,因为变量只是个引用,类似于c语言中的指针

2.python类的属性和方法
参考:http://python.jobbole.com/82297/ (写的很详细,推荐看一看)

类:python的类也是一种对象,它类似于一种框架,当我们需要用到它的时候就对它进行实例化,比如:
    name=‘jerry‘,name可以看做字符类型str()的一个实例
属性:数据,可以用" 类的实例.属性名 "引用
方法:操作,可以用" 类的实例.方法名()"引用

属性与方法的区别在于,属性引用的是数据,而方法引用的是一段代码,属性是在类实例化过程中进行赋值的,而方法则类定义时就已经写好,所以,当某个变量属于某个类时,它能使用的方法/操作也就确定了

例子:

In [132]: val=1

In [133]: val.__doc__   
Out[133]: "int(x=0) -> int or long\nint(x, base=10) -> int or long\n\nConvert a number or string to an integer, or return 0 if no arguments\nare given.  If x is floating point, the conversion truncates towards zero.\nIf x is outside the integer range, the function returns a long instead.\n\nIf x is not a number or if base is given, then x must be a string or\nUnicode object representing an integer literal in the given base.  The\nliteral can be preceded by ‘+‘ or ‘-‘ and be surrounded by whitespace.\nThe base defaults to 10.  Valid bases are 0 and 2-36.  Base 0 means to\ninterpret the base from the string as an integer literal.\n>>> int(‘0b100‘, base=0)\n4"

In [134]: val.bit_length()
Out[134]: 1

In [135]: type(val)
Out[135]: int

这个例子中__doc__就是int类的内置属性,bit_length()则是int类的内置方法,val则是int类的实例

相关内置函数:
type(object):显示对象的类型
dir([object]):显示对象内置的属性,和支持的方法(或者操作)
help(builtin.object):打印对应函数的帮助,比如要查找bit_length()的使用帮助,则输入"help(val.bit_length)"或者 "help(int.bit_length)",因为val是int类的实例,所以是一样的代码,帮助文档也一样

3.数据类型

字符串:
python中字符串比较特别的地方在于它是一种序列而且又是不可变对象
例子:

In [165]: s1=‘haha‘

In [166]: s2=str(‘haha‘)

In [167]: id(s1)
Out[167]: 139910507684560

In [168]: id(s2)
Out[168]: 139910507684560

In [169]: s1+s2
Out[169]: ‘hahahaha‘

不难看出,s1=‘haha‘和s2=str(‘haha‘)效果是一样的,str()其实就是字符类型的实例化函数,也是所谓的工厂函数,这里两种写法之所以等价,是因为python规定了一系列规则,使得解释器可以识别,这里相关的规则如下:
    <1>数字不能作为变量名开头
    <2>字符串赋值必须用‘‘、""、‘‘‘ ‘‘‘ 或者""" """括起来,(三个引号的可以换行)
这些特殊使得解释器遇到没引号的字符是认为它是变量,而带引号则认为是字符。
还有一点是当字符串出现在函数方法定义的第一行的时候,则表示对函数的_doc_属性赋值(这个属性相当于函数的简介),例子如下:

    In [175]: def Testchar():
     ...:     "it just a test"
     ...:     

    In [176]: Testchar.__doc__
    Out[176]: ‘it just a test‘

布尔类型:
布尔类型跟其他语言一样,就两个值:True和False (首字母大写)

例子:

In [187]: ‘2xxx‘ in s
Out[187]: True

In [188]: a = 1 in s

In [189]: print a
False

In [190]: a = ‘1‘ in s

In [191]: print a
True

因为"一切皆对象",变量只是对对象的引用,所以布尔类型也是赋值给变量,这里第一次a为False的原因在于,s里面的1是字符,不是数字

整数、浮点数,数字:
这些没什么好说的,参考:http://www.cnblogs.com/linjiqin/p/3608541.html
这里copy对应的可能有用的函数

数字类型转换:
    int(x [,base]) 将x转换为一个整数 
    float(x ) 将x转换到一个浮点数 
    complex(real [,imag]) 创建一个复数 
    str(x) 将对象x转换为字符串 
    repr(x) 将对象x转换为表达式字符串 
    eval(str) 用来计算在字符串中的有效Python表达式,并返回一个对象 
    tuple(s) 将序列s转换为一个元组 
    list(s) 将序列s转换为一个列表 
    chr(x) 将一个整数转换为一个字符 
    unichr(x) 将一个整数转换为Unicode字符 
    ord(x) 将一个字符转换为它的整数值 
    hex(x) 将一个整数转换为一个十六进制字符串 
    oct(x) 将一个整数转换为一个八进制字符串

数学函数:
    abs(x)    返回数字的绝对值,如abs(-10) 返回 10
    ceil(x)    返回数字的上入整数,如math.ceil(4.1) 返回 5
    cmp(x, y) 如果 x < y 返回 -1, 如果 x == y 返回 0, 如果 x > y 返回 1
    exp(x)    返回e的x次幂(ex),如math.exp(1) 返回2.718281828459045
    fabs(x)    返回数字的绝对值,如math.fabs(-10) 返回10.0
    floor(x) 返回数字的下舍整数,如math.floor(4.9)返回 4
    log(x)    如math.log(math.e)返回1.0,math.log(100,10)返回2.0
    log10(x) 返回以10为基数的x的对数,如math.log10(100)返回 2.0
    max(x1, x2,...)    返回给定参数的最大值,参数可以为序列。
    min(x1, x2,...)    返回给定参数的最小值,参数可以为序列。
    modf(x)    返回x的整数部分与小数部分,两部分的数值符号与x相同,整数部分以浮点型表示。
    pow(x, y) x**y 运算后的值。
    round(x [,n]) 返回浮点数x的四舍五入值,如给出n值,则代表舍入到小数点后的位数。
    sqrt(x)    返回数字x的平方根,数字可以为负数,返回类型为实数,如math.sqrt(4)返回 2+0j

列表:
列表的特点在于它的元素是可变的,而且因为它是序列,所以支持序列的所有方法
元素:这里的元素其实也是对象,但是它可以是任意类型的(所谓的异构),简单地说就是不一定要整数或者字符串比如:
[[1,‘b‘],‘b‘,‘c‘]
列表里面还有列表,列表是用[]括起来的一堆元素的集合

例子1:

In [193]: l1=[‘1‘,‘2‘]

In [194]: id(l1)
Out[194]: 139910507832240

In [195]: id(l1[0])
Out[195]: 139910739440504

In [196]: l1[0]="3"

In [197]: print l1
[‘3‘, ‘2‘]

In [198]: id(l1[0])
Out[198]: 139910738702424

In [199]: id(l1)
Out[199]: 139910507832240

可以看出,在第一个元素发生变化的时候,l1引用的位置也是不变的,而l1[0]引用的位置则发生了变化

例子2:

In [212]: l1=[‘1‘,‘2‘]

In [213]: l2=l1

In [214]: import copy

In [215]: l3=copy.deepcopy(l1)

In [216]: print l2,l3
[‘1‘, ‘2‘] [‘1‘, ‘2‘]

In [217]: l1[0]=3

In [218]: print l2,l3
[3, ‘2‘] [‘1‘, ‘2‘]

In [219]: id(l1)
Out[219]: 139910507811688

In [220]: id(l2)
Out[220]: 139910507811688

In [221]: id(l3)
Out[221]: 139910509285672

从例子可以看出l2=l1,其实是把l2指向到了l1的数据部分,也就是说l1和l2指向了相同的数据部分,而l3则是原样复制l1的数据,所以,当l1[0]变化时,l2[0]也会变化,l3则不变

相关内置函数:
list.append(obj) 在列表末尾添加新的对象
list.count(obj) 统计某个元素在列表中出现的次数
list.extend(seq) 在列表末尾一次性追加另一个序列中的多个值(用新列表扩展原来的列表)
list.index(obj) 从列表中找出某个值第一个匹配项的索引位置,索引从0开始
list.insert(index, obj) 将对象插入列表
list.pop(obj=list[-1]) 移除列表中的一个元素(默认最后一个元素),并且返回该元素的值
list.remove(obj) 移除列表中某个值的第一个匹配项
list.reverse() 反向列表中元素,倒转
list.sort([func]) 对原列表进行排序

元组:
元组与列表相似(都是不同元素的集合),但是它的元素是不可以改变的,也支持序列的所有操作,它是用()括起来的

例子1:

In [226]: a=([1,‘b‘],‘b‘,‘c‘)

In [227]: a[2]=‘2‘
---------------------------------------------------------------------------
TypeError                                 Traceback (most recent call last)
<ipython-input-227-03bdd44bccdf> in <module>()
----> 1 a[2]=‘2‘

TypeError: ‘tuple‘ object does not support item assignment

例子2:

In [228]: a=(1)

In [229]: type(a)
Out[229]: int

In [230]: a=(1,)

In [231]: type(a)
Out[231]: tuple

当元组里面只有一个元素且是数字时,要加一个逗号,否则会被赋值为整型

元组内置的函数:
cmp(tuple1, tuple2) 比较两个元组元素。
len(tuple) 计算元组元素个数。
max(tuple) 返回元组中元素最大值。
min(tuple) 返回元组中元素最小值。
tuple(seq) 将列表转换为元组。

字典:(抄自:http://www.cnblogs.com/linjiqin/p/3608541.html)
字典(dictionary)是除列表之外python中最灵活的内置数据结构类型。列表是有序的对象结合,字典是无序的对象集合。两者之间的区别在于:字典当中的元素是通过键来存取的,而不是通过偏移存取。

字典由键和对应的值组成。字典也被称作关联数组或哈希表。基本语法如下:

dict = {‘Alice‘: ‘2341‘, ‘Beth‘: ‘9102‘, ‘Cecil‘: ‘3258‘};
也可如此创建字典:

    dict1 = { ‘abc‘: 456 };
    dict2 = { ‘abc‘: 123, 98.6: 37 };
每个键与值必须用冒号隔开(:),每对用逗号分割,整体放在花括号中({})。键必须独一无二,但值则不必;值可以取任何数据类型,但必须是不可变的,如字符串,数或元组。

字典内置的函数:
cmp(dict1, dict2) 比较两个字典元素。
len(dict) 计算字典元素个数,即键的总数。
str(dict) 输出字典可打印的字符串表示。
type(variable) 返回输入的变量类型,如果变量是字典就返回字典类型。
radiansdict.clear() 删除字典内所有元素
radiansdict.copy() 返回一个字典的浅复制
radiansdict.fromkeys() 创建一个新字典,以序列seq中元素做字典的键,val为字典所有键对应的初始值
radiansdict.get(key, default=None) 返回指定键的值,如果值不在字典中返回default值
radiansdict.has_key(key) 如果键在字典dict里返回true,否则返回false
radiansdict.items() 以列表返回可遍历的(键, 值) 元组数组
radiansdict.keys() 以列表返回一个字典所有的键
radiansdict.setdefault(key, default=None) 和get()类似, 但如果键不已经存在于字典中,将会添加键并将值设为default
radiansdict.update(dict2) 把字典dict2的键/值对更新到dict里
radiansdict.values() 以列表返回字典中的所有值

以上是关于python的数据类型简介的主要内容,如果未能解决你的问题,请参考以下文章

python之模块和包

Python学习总结

python 用于数据探索的Python代码片段(例如,在数据科学项目中)

13 个非常有用的 Python 代码片段

python函数简介

python-介绍,数据类型