关于 Pandas 中迭代的说明

Clarification about iteration in Pandas

我使用 Pandas 将近 6 个月,在我看来,最大的争论之一是关于迭代数据帧,通过 .iterrows() .apply()list-comprehension计算新数据。

我多次被引导,总是在可能的情况下使用 .loc 或类似的访问器来写入数据。问题是,当我有很多条件时,我以前用一行代码解决的问题,我需要创建很多行 .iloc 来完成数据。

简而言之shell:总是避免迭代并拥有更长的代码行是否值得,即使数据帧不是很大?

有人推荐一些解释这种效率权衡的文章吗?

有一篇很棒的文章介绍了遍历数据帧的不同方法,以及每种方法需要多少时间。我个人觉得很有帮助。看一看:https://towardsdatascience.com/apply-function-to-pandas-dataframe-rows-76df74165ee4