我如何遍历多个数据帧以 select 每个 python 中的一列?

How can I iterate through multiple dataframes to select a column in each in python?

对于我的项目,我正在读取一个包含美国各州数据的 csv 文件。我的函数将这些中的每一个都转换成一个单独的数据框,因为我需要对每个州的信息执行操作。

def RanktoDF(csvFile):
    df = pd.read_csv(csvFile)
    df = df[pd.notnull(df['Index'])] # drop all null values
    df = df[df.Index != 'Index'] #Drop all extra headers
    df= df.set_index('State') #Set State as index
    return df

我将此函数应用于我的每个文件,return df 的名称来自我的数组 varNames

for name , s in zip (glob.glob('*.csv'), varNames):
    vars()["Crime" + s] = RanktoDF(name)

所有这些都很完美。 我的问题是我还想创建一个数据框,它由每个状态数据框的一列组成。

我尝试遍历我的数据框列表并选择我想将其附加到新数据框的列(人口):

dfList

dfNewIndex = pd.DataFrame(index=CrimeRank_1980_df.index) # Create new DF with Index


for name in dfList:  #dfList is my list of dataframes. See image
    newIndex = name['Population']
    dfNewIndex.append(newIndex)

    #dfNewIndex = pd.concat([dfNewIndex, dfList[name['Population']], axis=1)

我的错误总是一样的,它告诉我名称被视为字符串而不是实际的 Dataframe

TypeError                                 Traceback (most recent call last)
<ipython-input-30-5aa85b0174df> in <module>()
      3 
      4 for name in dfList:
----> 5     newIndex = name['Index']
      6     dfNewIndex.append(newIndex)
      7 #     dfNewIndex = pd.concat([dfNewIndex, dfList[name['Population']], axis=1)

TypeError: string indices must be integers

我知道我的列表是一个字符串列表而不是 variables/dataframes 所以我的问题是我如何更正我的代码才能做我想做的事情,或者有更简单的方法吗?

我查找过的任何解决方案都给出了明确键入数据帧以便连接的答案,但我有 50 个,所以它有点不可行。任何帮助将不胜感激。

一种方法是索引到 vars(),例如

for name in dfList:
    newIndex = vars()[name]["Population"]

或者,我认为将数据帧存储在容器中并对其进行迭代会更整洁,例如

frames = {}

for name, s in zip(glob.glob('*.csv'), varNames):
    frames["Crime" + s] = RanktoDF(name)

for name in frames:
    newIndex = frames[name]["Population"]