pandas_数据读取
Posted jiaxinhuang
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了pandas_数据读取相关的知识,希望对你有一定的参考价值。
df = pd.read_excel(‘titanic.xlsx‘,nrows=111,dtype={‘价格‘:np.float},skiprows=13,index_col=0)
nrows:选取前面多少条
dtype:改变某一列类型
skiprows:跳过前面多少行
index_col:将第一列设置位索引列
如心南湾海景酒店(L‘hotel Island South) | 休闲度假 | 香港 | 南区 | 香港仔黄竹坑道55号 | 4.4 | 9573 | 447 | |
---|---|---|---|---|---|---|---|---|
12 | ||||||||
13 | 香港朗廷酒店(The Langham Hong Kong) | 休闲度假 | 香港 | 油尖旺 | 尖沙嘴北京道8号 | 4.7 | 11039 | 1899 |
14 | 迪士尼探索家度假酒店(Disney Explorers Lodge) | 海滨风光 | 香港 | 离岛 | 迪士尼乐园度假区 | 4.8 | 4794 | 1662 |
15 | 香港港丽酒店(Conrad Hong Kong) | 海滨风光 | 香港 | 中西区 | 金钟 金钟道88号太古广场 | 4.7 | 2392 | 2490 |
16 | 香港美丽华酒店(The Mira Hong Kong) | 休闲度假 | 香港 | 九龙城 | 尖沙咀弥敦道118-130号美丽华广场 | 4.6 | 5882 | 1583 |
17 | 香港悦来酒店(Panda Hotel) | 休闲度假 | 香港 | 荃湾 | 荃湾 荃华街3号 | 4.5 | 13694 | 358 |
... | ... | ... | ... | ... | ... | ... | ... | ... |
119 | 香港如心铜锣湾海景酒店(L‘hotel Causeway Bay Harbour View ... | 海滨风光 | 香港 | 东区 | 铜锣湾 英皇道18号 | 4.6 | 9712 | 678 |
120 | 香港港岛太平洋酒店(Island Pacific Hotel) | 海滨风光 | 香港 | 中西区 | 西环 干诺道西152号 | 4.6 | 4552 | 594 |
121 | 香港基督教青年会酒店(The Salisbury YMCA of Hong Kong) | 海滨风光 | 香港 | 油尖旺 | 尖沙嘴 梳士巴利道41号 | 4.7 | 3461 | 1008 |
122 | 香港逸兰精品酒店(Lanson Place Hotel) | 浪漫情侣 | 香港 | 湾仔 | 铜锣湾礼顿道133号 | 4.7 | 2053 | 1349 |
123 | 香港九龙海湾酒店(Kowloon Harbourfront Hotel) | 海滨风光 | 香港 | 油尖旺 | 九龙红磡红鸾道8号D座 | 4.6 | 5620 | 770 |
#打印数据基本信息(样本规模、每列特征类型、整的内存占用)
1:df.info()<class ‘pandas.core.frame.DataFrame‘>
Int64Index: 111 entries, 13 to 123 Data columns (total 8 columns): # Column Non-Null Count Dtype --- ------ -------------- ----- 0 如心南湾海景酒店(L‘hotel Island South) 111 non-null object 1 休闲度假 111 non-null object 2 香港 111 non-null object 3 南区 111 non-null object 4 香港仔黄竹坑道55号 111 non-null object 5 4.4 111 non-null float64 6 9573 111 non-null int64 7 447 111 non-null int64 dtypes: float64(1), int64(2), object(5) memory usage: 7.8+ KB
#返回索引
2:df.index
#返回每一列的特征名字
3:df.columns
#返回每一列的类型
4:df.dtypes
#数据矩阵
5:df.values
array([[‘香港朗廷酒店(The Langham Hong Kong)‘, ‘休闲度假‘, ‘香港‘, ‘油尖旺‘, ‘尖沙嘴北京道8号‘,
4.7, 11039, 1899], [‘迪士尼探索家度假酒店(Disney Explorers Lodge)‘, ‘海滨风光‘, ‘香港‘, ‘离岛‘, ‘迪士尼乐园度假区‘, 4.8, 4794, 1662], [‘香港港丽酒店(Conrad Hong Kong)‘, ‘海滨风光‘, ‘香港‘, ‘中西区‘, ‘金钟 金钟道88号太古广场‘]])
以上是关于pandas_数据读取的主要内容,如果未能解决你的问题,请参考以下文章
04 pandas DataFrame_创建、文件读取、编码
Pandas总结第二节 Pandas 的数据读取_pd.read_csv()的使用详解(非常全面,推荐收藏)