当前位置：首页 > news >正文

【Pandas】pandas DataFrame itertuples

news 来源：原创 2025/4/25 5:15:41

Pandas2.2 DataFrame

Indexing, iteration

方法	描述
DataFrame.head([n])	用于返回 DataFrame 的前几行
DataFrame.at	快速访问和修改 DataFrame 中单个值的方法
DataFrame.iat	快速访问和修改 DataFrame 中单个值的方法
DataFrame.loc	用于基于标签（行标签和列标签）来访问和修改 DataFrame 中的数据
DataFrame.iloc	用于基于整数位置（行号和列号）来访问和修改 DataFrame 中的数据
DataFrame.insert(loc, column, value[, …])	用于在 DataFrame 的指定位置插入一个新的列
DataFrame.iter()	用于迭代 DataFrame 的列名
DataFrame.items()	用于迭代 DataFrame 的列名和列数据
DataFrame.keys()	返回 DataFrame 的列名
DataFrame.iterrows()	用于逐行迭代 DataFrame
DataFrame.itertuples([index, name])	用于逐行迭代 DataFrame

pandas.DataFrame.itertuples()

pandas.DataFrame.itertuples([index, name]) 方法用于逐行迭代 DataFrame，每次迭代返回一个命名元组（namedtuple），其中包含行的索引和列的值。与 iterrows() 不同，itertuples() 通常具有更好的性能，因为它避免了将每一行转换为 Series 对象。

语法

for row in DataFrame.itertuples(index=True, name='Pandas'):# 处理行数据

参数

index: 布尔值，指示是否将行索引包含在返回的命名元组中，默认为 True。
name: 命名元组的名称，默认为 'Pandas'。如果设置为 None，则返回一个普通的元组。

示例

假设我们有一个 DataFrame 如下：

import pandas as pddata = {'A': [1, 2, 3],'B': [4, 5, 6],'C': [7, 8, 9]
}df = pd.DataFrame(data, index=['row1', 'row2', 'row3'])
print(df)

输出：

       A  B  C
row1   1  4  7
row2   2  5  8
row3   3  6  9

迭代行数据（包含索引）

使用 itertuples() 方法逐行迭代 DataFrame，包含行索引：

for row in df.itertuples(index=True, name='Pandas'):print(row)

输出：

Pandas(Index='row1', A=1, B=4, C=7)
Pandas(Index='row2', A=2, B=5, C=8)
Pandas(Index='row3', A=3, B=6, C=9)

访问特定列的值

在迭代行数据时，访问特定列的值：

for row in df.itertuples(index=True, name='Pandas'):print(f"Index: {row.Index}, A: {row.A}, B: {row.B}, C: {row.C}")

输出：

Index: row1, A: 1, B: 4, C: 7
Index: row2, A: 2, B: 5, C: 8
Index: row3, A: 3, B: 6, C: 9

不包含索引

使用 itertuples() 方法逐行迭代 DataFrame，不包含行索引：

for row in df.itertuples(index=False, name='Pandas'):print(row)

输出：

Pandas(A=1, B=4, C=7)
Pandas(A=2, B=5, C=8)
Pandas(A=3, B=6, C=9)

使用普通元组

使用 itertuples() 方法逐行迭代 DataFrame，返回普通元组：

for row in df.itertuples(index=True, name=None):print(row)

输出：

Pandas(Index='row1', A=1, B=4, C=7)
Pandas(Index='row2', A=2, B=5, C=8)
Pandas(Index='row3', A=3, B=6, C=9)

总结

pandas.DataFrame.itertuples([index, name]) 方法提供了一种高效的方式来逐行迭代 DataFrame，每次迭代返回一个命名元组或普通元组。与 iterrows() 相比，itertuples() 通常具有更好的性能，因为它避免了将每一行转换为 Series 对象。这对于需要逐行处理数据且对性能有要求的场景非常有用。