使用Pandas高效分组数据分析的实用技巧与方法

遍历 pandas group

在数据分析中，使用 pandas 进行分组操作是非常常见的。通过对数据进行分组，可以方便地进行聚合、转化和过滤等操作。本文将介绍如何遍历 pandas 分组对象，并提供详细的操作步骤、命令示例及注意事项。

首先，我们需要创建一个示例 DataFrame 来演示分组的操作：

import pandas as pd

data = {
    '团队': ['A', 'A', 'B', 'B', 'C', 'C'],
    '分数': [88, 92, 85, 95, 80, 82]
}

df = pd.DataFrame(data)

接下来，使用 `groupby` 方法按照 “团队” 列进行分组：

grouped = df.groupby('团队')

使用 `for` 循环可以遍历分组对象，分组对象会返回每个组的键和值：

for name, group in grouped:
    print(f"组名: {name}")
    print(group)

在这个示例中，`name` 是组的名称，`group` 是与该组相关的 DataFrame。

在遍历每个分组时，可以对组进行计算，例如计算每个组的平均分数：

for name, group in grouped:
    avg_score = group['分数'].mean()
    print(f"团队 {name} 的平均分数: {avg_score}")

result = grouped.agg({'分数': ['mean', 'max', 'min']})
    print(result)

filtered = grouped.filter(lambda x: x['分数'].mean() > 85)
    print(filtered)