关于 Pandas 中迭代的说明

Clarification about iteration in Pandas

我使用 Pandas 将近 6 个月，在我看来，最大的争论之一是关于迭代数据帧，通过 .iterrows() .apply() 或 list-comprehension计算新数据。

我多次被引导，总是在可能的情况下使用 .loc 或类似的访问器来写入数据。问题是，当我有很多条件时，我以前用一行代码解决的问题，我需要创建很多行 .iloc 来完成数据。

简而言之shell：总是避免迭代并拥有更长的代码行是否值得，即使数据帧不是很大？

有人推荐一些解释这种效率权衡的文章吗？

有一篇很棒的文章介绍了遍历数据帧的不同方法，以及每种方法需要多少时间。我个人觉得很有帮助。看一看：https://towardsdatascience.com/apply-function-to-pandas-dataframe-rows-76df74165ee4