用在数据科学上的 Python:你可能忘记的 8 个概念

Posted 梦子mengy7762

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了用在数据科学上的 Python:你可能忘记的 8 个概念相关的知识,希望对你有一定的参考价值。

列表推导式

在写循环的时候,每次定义一堆的列表是相当无聊的。幸运的是,Python 内置了一种名为列表推导式的方法,这种方法仅仅使用一行代码就可以解决这个问题。列表推导式刚开始对你来说可能有些困难,但是你一旦熟悉,你就会经常使用。

来源: Trey Hunner

下面的第一个例子是求每一个元素平方的的普通写法,第二个是列表推导式的写法。最后,如果你的时间不是很紧张,并且又想快速的提高,最重要的是不怕吃苦,建议你可以联系维:762459510 ,那个真的很不错,很多人进步都很快,需要你不怕吃苦哦!大家可以去添加上看一下~

Lambda 函数

Lambda 函数在 Python 中通常被用来构建应用次数比较少的的匿名函数。也就是让你构建一个了不带名字的函数。

Lambda 函数的基本语法如下:

lambda arguments: expression

普通函数能做的,Lambda 函数也都能做,只要它们能够写成一行。

Map 函数与 Filter 函数

当你掌握了 Lambda 函数,然后将 Lambda 函数和 map,filter 函数一起使用,你会发现威力巨大。 具体的说,map 函数通过对列表中的每一个元素进行操作,将列表转换成一个新的列表。在下面的这个例子中,map 函数将每一个元素乘以 2,变成一个新的元素。注意这里的 list 函数只是简单的将输出结果转化为 list 类型。

Filter 函数类似于 map 函数,但是 filter 函数通过比较每一个元素是否为真从原始列表中抽取子集。

Arange 函数 和 Linspace 函数

快速创建简单的 NumPy 数组,使用 arange 和 linspace 函数最合适不过了。 它们都有各自特定的功能,但在这里使用(不是使用范围)在于其产生的 NumPy 数组,对于数据科学通常更容易操作。

Arange 函数,根据 start 和 stop 指定的范围以及 step 设定的步长,生成指定间隔的均匀间隔序列。最后,如果你的时间不是很紧张,并且又想快速的提高,最重要的是不怕吃苦,建议你可以联系维:762459510 ,那个真的很不错,很多人进步都很快,需要你不怕吃苦哦!大家可以去添加上看一下~

Linspace 函数非常相似,但略有不同。它根据 start 和 stop 指定的范围以及 num 设定的个数,生成指定个数的均匀间隔序列。

Concat 函数、Merge 函数和 Join 函数

如果你熟悉 SQL,那么这些函数方法可能会更容易理解。其实它们本质上都只是以一定方式合并 dataframe 的方法。哪种情况下用哪个最好很难说,所以让我们再回顾一下。

Concat 函数可以在下方或旁边合并一个或多个 dataframe(取决于如何定义轴)。

Merge 函数在作为主键的指定公共列上合并多个 dataframe。

Join 函数合并两个 dataframe 的方法与 merge 函数类似。但是,它根据索引合并 dataframe,而不是某些指定列。

Pandas 的 Apply 函数

你可以把 apply 函数想做地图功能,但它只对 Pandas 的 DataFrame 或者更具体地说是 Series 进行操作。如果你不熟悉 Series,其实它在很多方面都与 NumPy 数组非常相似。

Apply 函数会对你指定的列或行中每个元素作用一个函数。你可以想象到这是多么有用,尤其式当你对整个 DataFrame 列进行归一化和元素值操作,而不必进行循环。

Pivot Tables 数据透视表

最后但同样重要的是数据透视表。如果你熟悉 Microsoft Excel,那你可能已经在某些方面听说过数据透视表。Pandas 内置的 pivot_table 函数可以将电子表格样式的数据透视表创建为 DataFrame。需要注意的是,数据透视表中的级别存储在创建的 DataFrame 层次索引和列中。

什么是轴 Axis

使用 Pandas 删除列或对 NumPy 矩阵元素求和时,你可能会遇到这个问题。如果没有,那么之后也一定会遇到。下面给出删除列的示例:

df.drop(‘Column A’, axis=1)

df.drop(‘Row A’, axis=0)

在我真正知道为什么需要声明轴是什么之前,我编写了无数次这行代码。从上面的代码中,你可以推断出,如果对列进行操作需要将 axis 设置为 1,对行操作则将其设置为 0。但这是为什么呢?我喜欢探求原因,或者至少我记得这个:

df.shape

(# of Rows, # of Columns)

查看 Pandas 中 dataframe 的 shape 属性会返回一个元组,其中第一个值表示行数,第二个值表示列数。想想 Python 中的索引方法——行为 0 列为 1,这与我们声明轴的方法非常相似。很有意思,对吧?最后,如果你的时间不是很紧张,并且又想快速的提高,最重要的是不怕吃苦,建议你可以联系维:762459510 ,那个真的很不错,很多人进步都很快,需要你不怕吃苦哦!大家可以去添加上看一下~

总结

最后小编推荐一本关于数据分析的书籍《利用Python进行数据分析》

关注后私信【数据分析】即可领取本书PDF

以上是关于用在数据科学上的 Python:你可能忘记的 8 个概念的主要内容,如果未能解决你的问题,请参考以下文章

记住你学过的 LeetCode 的科学方法

Python科学计算结果的存储与读取

Python都被用在哪?都有哪些人在用Python呢?

python学习13之数据泄密

数据科学入门

R 和 Python 中的文本挖掘:8 个入门小贴士