关于 Pandas 中迭代的说明
Clarification about iteration in Pandas
我使用 Pandas 将近 6 个月,在我看来,最大的争论之一是关于迭代数据帧,通过 .iterrows()
.apply()
或 list-comprehension
计算新数据。
我多次被引导,总是在可能的情况下使用 .loc
或类似的访问器来写入数据。问题是,当我有很多条件时,我以前用一行代码解决的问题,我需要创建很多行 .iloc
来完成数据。
简而言之shell:总是避免迭代并拥有更长的代码行是否值得,即使数据帧不是很大?
有人推荐一些解释这种效率权衡的文章吗?
有一篇很棒的文章介绍了遍历数据帧的不同方法,以及每种方法需要多少时间。我个人觉得很有帮助。看一看:https://towardsdatascience.com/apply-function-to-pandas-dataframe-rows-76df74165ee4
我使用 Pandas 将近 6 个月,在我看来,最大的争论之一是关于迭代数据帧,通过 .iterrows()
.apply()
或 list-comprehension
计算新数据。
我多次被引导,总是在可能的情况下使用 .loc
或类似的访问器来写入数据。问题是,当我有很多条件时,我以前用一行代码解决的问题,我需要创建很多行 .iloc
来完成数据。
简而言之shell:总是避免迭代并拥有更长的代码行是否值得,即使数据帧不是很大?
有人推荐一些解释这种效率权衡的文章吗?
有一篇很棒的文章介绍了遍历数据帧的不同方法,以及每种方法需要多少时间。我个人觉得很有帮助。看一看:https://towardsdatascience.com/apply-function-to-pandas-dataframe-rows-76df74165ee4