如何使用 python 将读取的 excel 数据放入数组中

How to get read excel data into an array with python

在我工作的实验室中,我们处理了 96 孔板产生的大量数据 reader。我正在尝试编写一个脚本,该脚本将执行一些计算并使用 matplotlib 输出条形图。

问题是板 reader 将数据输出到 .xlsx 文件中。我知道像 pandas 这样的一些模块有一个 read_excel 函数,你能解释一下我应该如何读取 excel 文件并将其放入数据帧吗?

谢谢

24 孔板的数据样本(为简单起见):

0.0868  0.0910  0.0912  0.0929  0.1082  0.1350
0.0466  0.0499  0.0367  0.0445  0.0480  0.0615
0.6998  0.8476  0.9605  0.0429  1.1092  0.0644
0.0970  0.0931  0.1090  0.1002  0.1265  0.1455

我不太确定你所说的数组是什么意思,但如果你指的是矩阵,你可能正在寻找:

import pandas as pd
df = pd.read_excel([path here])
df.as_matrix()

这个returns一个numpy.ndarray类型。

真棒xlrd package with quick start example here。 您可以 google 它来查找代码片段。我没用过pandaread_excel功能,但是xlrd满足了我的所有需求,我相信还能提供更多。

您也可以尝试使用 my wrapper library,它也使用 xlrd:

import pyexcel as pe     # pip install pyexcel
import pyexcel.ext.xls   # pip install pyexcel-xls
your_matrix = pe.get_array(file_name=path_here) # done

这几天 Pandas 这个任务超级简单。

import pandas as pd

df = pd.read_excel('file_name_here.xlsx', sheet_name='Sheet1')

df = pd.read_csv('file_name_here.csv')

这个 returns 一个 pandas.DataFrame 对象,它对于按列、行、整个 df 或带有 iterrows 的单个项目执行操作非常强大。更不用说以不同的方式切片了。