如何在 Python 中创建DataFrame
Posted 来西瓜
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了如何在 Python 中创建DataFrame相关的知识,希望对你有一定的参考价值。
DataFrame是数据的二维集合。 它是一种数据结构,其中数据以表格形式存储。 数据集按行和列排列; 我们可以在DataFrame中存储多个数据集。 我们可以执行各种算术运算,例如在DataFrame中添加列/行选择和列/行。
我们可以从外部存储导入 DataFrame; 这些存储可以是 SQL数据库、CSV 文件和 Excel 文件。 我们还可以使用列表、字典和来自字典的列表等。
在本教程中,我们将学习以多种方式创建DataFrame。 让我们了解这些不同的方式。
方法一:创建空的DataFrame
我们可以创建一个基本的空DataFrame。 需要调用DataFrame构造函数来创建DataFrame。 让我们理解下面的例子:
输出:
方法二:使用List 创建DataFrame
我们可以使用单个列表或列表的列表创建DataFrame。 让我们理解下面的例子:
输出:
方法三:使用字典创建DataFrame
ndarray/lists 的 dict 可用于创建DataFrame,所有 ndarray 必须具有相同的长度。 默认情况下,索引将是一个范围(n); 其中 n 表示数组长度。 让我们理解下面的例子:
输出:
方法四:使用数组创建带索引DataFrame
请看下面的示例:
输出:
在上面的代码中,我们定义了包含各种汽车名称及其评级的列名。 我们使用数组来创建索引。
方法五:从字典列表创建DataFrame
我们可以将字典列表作为输入数据传递来创建 Pandas DataFrame。 默认情况下,列名作为键。 让我们理解下面的例子:
输出:
让我们学习另一个示例,从具有行索引和列索引的字典列表创建 pandas DataFrame。
输出:
让我们再来学习另一个通过传递字典和行列表来创建数据框的示例:
输出:
方法六:使用zip()函数创建DataFrame
zip() 函数用于合并两个列表。 让我们理解下面的例子。
输出:
方法七:从序列的字典创建DataFrame
可以传递字典来创建DataFrame。 我们可以使用序列的字典,其中后续索引是所有传递的索引值序列的并集。 让我们理解下面的例子:
输出:
在本教程中,我们讨论了创建 DataFrame 的不同方法。
以上是关于如何在 Python 中创建DataFrame的主要内容,如果未能解决你的问题,请参考以下文章
如何在 Databricks 的 PySpark 中使用在 Scala 中创建的 DataFrame
如何在 pandas DataFrame 中的字符串模式后提取数字并在 python 中创建新功能
python 在Pandas中创建DataFrame的不同方法