【Pandas】pandas DataFrame itertuples
Pandas2.2 DataFrame
Indexing, iteration
方法 | 描述 |
---|---|
DataFrame.head([n]) | 用于返回 DataFrame 的前几行 |
DataFrame.at | 快速访问和修改 DataFrame 中单个值的方法 |
DataFrame.iat | 快速访问和修改 DataFrame 中单个值的方法 |
DataFrame.loc | 用于基于标签(行标签和列标签)来访问和修改 DataFrame 中的数据 |
DataFrame.iloc | 用于基于整数位置(行号和列号)来访问和修改 DataFrame 中的数据 |
DataFrame.insert(loc, column, value[, …]) | 用于在 DataFrame 的指定位置插入一个新的列 |
DataFrame.iter() | 用于迭代 DataFrame 的列名 |
DataFrame.items() | 用于迭代 DataFrame 的列名和列数据 |
DataFrame.keys() | 返回 DataFrame 的列名 |
DataFrame.iterrows() | 用于逐行迭代 DataFrame |
DataFrame.itertuples([index, name]) | 用于逐行迭代 DataFrame |
pandas.DataFrame.itertuples()
pandas.DataFrame.itertuples([index, name])
方法用于逐行迭代 DataFrame,每次迭代返回一个命名元组(namedtuple),其中包含行的索引和列的值。与 iterrows()
不同,itertuples()
通常具有更好的性能,因为它避免了将每一行转换为 Series
对象。
语法
for row in DataFrame.itertuples(index=True, name='Pandas'):# 处理行数据
参数
index
: 布尔值,指示是否将行索引包含在返回的命名元组中,默认为True
。name
: 命名元组的名称,默认为'Pandas'
。如果设置为None
,则返回一个普通的元组。
示例
假设我们有一个 DataFrame 如下:
import pandas as pddata = {'A': [1, 2, 3],'B': [4, 5, 6],'C': [7, 8, 9]
}df = pd.DataFrame(data, index=['row1', 'row2', 'row3'])
print(df)
输出:
A B C
row1 1 4 7
row2 2 5 8
row3 3 6 9
迭代行数据(包含索引)
使用 itertuples()
方法逐行迭代 DataFrame,包含行索引:
for row in df.itertuples(index=True, name='Pandas'):print(row)
输出:
Pandas(Index='row1', A=1, B=4, C=7)
Pandas(Index='row2', A=2, B=5, C=8)
Pandas(Index='row3', A=3, B=6, C=9)
访问特定列的值
在迭代行数据时,访问特定列的值:
for row in df.itertuples(index=True, name='Pandas'):print(f"Index: {row.Index}, A: {row.A}, B: {row.B}, C: {row.C}")
输出:
Index: row1, A: 1, B: 4, C: 7
Index: row2, A: 2, B: 5, C: 8
Index: row3, A: 3, B: 6, C: 9
不包含索引
使用 itertuples()
方法逐行迭代 DataFrame,不包含行索引:
for row in df.itertuples(index=False, name='Pandas'):print(row)
输出:
Pandas(A=1, B=4, C=7)
Pandas(A=2, B=5, C=8)
Pandas(A=3, B=6, C=9)
使用普通元组
使用 itertuples()
方法逐行迭代 DataFrame,返回普通元组:
for row in df.itertuples(index=True, name=None):print(row)
输出:
Pandas(Index='row1', A=1, B=4, C=7)
Pandas(Index='row2', A=2, B=5, C=8)
Pandas(Index='row3', A=3, B=6, C=9)
总结
pandas.DataFrame.itertuples([index, name])
方法提供了一种高效的方式来逐行迭代 DataFrame,每次迭代返回一个命名元组或普通元组。与 iterrows()
相比,itertuples()
通常具有更好的性能,因为它避免了将每一行转换为 Series
对象。这对于需要逐行处理数据且对性能有要求的场景非常有用。