Pandas:从大型 excel 文件中的每个电子表格生成数据框
Pandas: Generating a data frame from each spreadsheet in a large excel file
我有一个很大的 excel 文件,我已将其导入 pandas,由 92 张组成。
我想使用循环或某种工具从每个电子表格中的数据生成数据框(每个电子表格中的一个数据框),它还会自动命名每个数据框。
我才刚刚开始使用 pandas 和 jupyter,所以我一点经验都没有。
这是我目前的代码:
import pandas as pd
import matplotlib.pyplot as plt
import numpy as np
import datetime
%matplotlib inline
concdata = pd.ExcelFile('Documents/Research Project/Data-Ana/11July-27Dec.xlsx')
我还有所有电子表格名称的列表:
#concdata.sheet_names
谢谢!
您可以在 Python 字典中为每个 sheet 分配一个名称,而不是让每个 DataFrame 成为自己的变量,如下所示:
dfs = {}
for sheet in concdata.sheet_names:
dfs[sheet] = concdata.parse(sheet)
然后使用 sheet 名称访问每个 DataFrame:
dfs['sheet_name_here']
这样做可以让您拥有 amortised O(1) lookup 个 sheet。
我有一个很大的 excel 文件,我已将其导入 pandas,由 92 张组成。
我想使用循环或某种工具从每个电子表格中的数据生成数据框(每个电子表格中的一个数据框),它还会自动命名每个数据框。
我才刚刚开始使用 pandas 和 jupyter,所以我一点经验都没有。
这是我目前的代码:
import pandas as pd
import matplotlib.pyplot as plt
import numpy as np
import datetime
%matplotlib inline
concdata = pd.ExcelFile('Documents/Research Project/Data-Ana/11July-27Dec.xlsx')
我还有所有电子表格名称的列表:
#concdata.sheet_names
谢谢!
您可以在 Python 字典中为每个 sheet 分配一个名称,而不是让每个 DataFrame 成为自己的变量,如下所示:
dfs = {}
for sheet in concdata.sheet_names:
dfs[sheet] = concdata.parse(sheet)
然后使用 sheet 名称访问每个 DataFrame:
dfs['sheet_name_here']
这样做可以让您拥有 amortised O(1) lookup 个 sheet。