Python Pandas – 从DataFrame显示特定数量的行

您所在的位置:网站首页 Python随机输出5行数据 Python Pandas – 从DataFrame显示特定数量的行

Python Pandas – 从DataFrame显示特定数量的行

2024-07-13 02:26| 来源: 网络整理| 查看: 265

Python Pandas – 从DataFrame显示特定数量的行

Pandas 是 Python 中一个强大的数据处理库,它对于数据处理和分析非常有用。在 Pandas 中,DataFrame 是一个被广泛使用的数据结构,它类似于 Excel 的电子表格和 SQL 数据库中的表格,可以包含多个行和列的数据,可以进行各种操作,如过滤、排序、分组、聚合等。在这篇文章中,我们将介绍如何在 DataFrame 中显示特定数量的行。

背景

当我们在 Pandas 中使用 DataFrame 处理大规模数据集时,我们经常需要查看数据的一部分,而不是所有数据。有时候我们需要只显示前几行或后几行的数据,或者显示数据集中的随机行,以便快速了解数据的结构和内容。Pandas 提供了一些工具来满足这些需求。

head() 和 tail() 方法

head() 和 tail() 方法是 Pandas 中最常用的方法之一,它们可以帮助我们快速预览 DataFrame 中的一部分数据。head() 方法显示 DataFrame 中的前几行,默认显示前 5 行。tail() 方法显示 DataFrame 中的后几行,默认显示后 5 行。下面是 head() 和 tail() 方法的示例代码:

import pandas as pd # 创建一个包含100行和4列数据的DataFrame data = pd.DataFrame({ 'Name': ['Alice', 'Bob', 'Charlie', 'David'] * 25, 'Age': [25, 30, 35, 40] * 25, 'Gender': ['F', 'M'] * 50, 'Salary': [50000, 60000, 70000, 80000] * 25 }) # 显示前5行数据 print(data.head()) # 显示后5行数据 print(data.tail())

输出:

Name Age Gender Salary 0 Alice 25 F 50000 1 Bob 30 M 60000 2 Charlie 35 F 70000 3 David 40 M 80000 4 Alice 25 F 50000 Name Age Gender Salary 95 David 40 M 80000 96 Alice 25 F 50000 97 Bob 30 M 60000 98 Charlie 35 F 70000 99 David 40 M 80000

从输出结果可以看出,head() 方法显示 DataFrame 中的前 5 行,tail() 方法显示 DataFrame 中的后 5 行。我们还可以将参数传递给这两个方法来指定要显示的行数,例如:

# 显示前10行数据 print(data.head(10)) # 显示后10行数据 print(data.tail(10)) iloc[] 方法

iloc[] 方法是 Pandas 中另一个非常有用的方法,它可以用于按位置索引访问 DataFrame 中的数据。例如,我们可以使用 iloc[0:5] 访问 DataFrame 的前 5 行,使用 iloc[-5:] 访问 DataFrame 的后 5 行。下面是 iloc[] 方法的示例代码:

# 显示前5行数据 print(data.iloc[0:5]) # 显示后5行数据 print(data.iloc[-5:])

输出:

Name Age Gender Salary 0 Alice 25 F 50000 1 Bob 30 M 60000 2 Charlie 35 F 70000 3 David 40 M 80000 4 Alice 25 F 50000 Name Age Gender Salary 95 David 40 M 80000 96 Alice 25 F 50000 97 Bob 30 M 60000 98 Charlie 35 F 70000 99 David 40 M 80000 我们还可以使用 iloc[] 方法来选择特定的行和列。例如,我们可以使用 iloc[0:5, 0:2] 来选择前 5 行和前 2 列,即姓名和年龄。下面是 iloc[] 方法选择特定行和列的示例代码: ```python # 显示前5行和前2列数据 print(data.iloc[0:5, 0:2])

输出:

Name Age 0 Alice 25 1 Bob 30 2 Charlie 35 3 David 40 4 Alice 25

我们还可以使用 iloc[] 方法和 numpy.random.choice() 函数来选择 DataFrame 中的随机行。例如,我们可以使用 iloc[numpy.random.choice(df.index, size=10)] 来选择 DataFrame 中的随机 10 行。下面是选择随机行的示例代码:

import numpy as np # 选择随机10行数据 print(data.iloc[np.random.choice(data.index, size=10)]) sample() 方法

除了 iloc[] 方法外,Pandas 还提供了 sample() 方法来选择 DataFrame 中的随机行。与 iloc[] 方法不同的是,sample() 方法允许我们指定要显示的行数,而不是使用索引范围或 numpy.random.choice() 函数。例如,我们可以使用 data.sample(n=10) 来选择 DataFrame 中的随机 10 行。下面是 sample() 方法选择随机行的示例代码:

# 显示随机10行数据 print(data.sample(n=10)) 结论

在 Pandas 中,我们可以使用 head() 和 tail() 方法来显示 DataFrame 中的前几行或后几行,使用 iloc[] 方法来按位置索引访问 DataFrame 中的数据和选择特定的行和列,使用 sample() 方法来选择 DataFrame 中的随机行。无论是在数据探索过程中还是在数据分析和建模过程中,这些方法都非常实用,并且可以帮助我们快速了解数据的结构和内容。



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3