如何使用 python 将读取的 excel 数据放入数组中
How to get read excel data into an array with python
在我工作的实验室中,我们处理了 96 孔板产生的大量数据 reader。我正在尝试编写一个脚本,该脚本将执行一些计算并使用 matplotlib 输出条形图。
问题是板 reader 将数据输出到 .xlsx 文件中。我知道像 pandas 这样的一些模块有一个 read_excel 函数,你能解释一下我应该如何读取 excel 文件并将其放入数据帧吗?
谢谢
24 孔板的数据样本(为简单起见):
0.0868 0.0910 0.0912 0.0929 0.1082 0.1350
0.0466 0.0499 0.0367 0.0445 0.0480 0.0615
0.6998 0.8476 0.9605 0.0429 1.1092 0.0644
0.0970 0.0931 0.1090 0.1002 0.1265 0.1455
我不太确定你所说的数组是什么意思,但如果你指的是矩阵,你可能正在寻找:
import pandas as pd
df = pd.read_excel([path here])
df.as_matrix()
这个returns一个numpy.ndarray类型。
真棒xlrd
package with quick start example here。
您可以 google 它来查找代码片段。我没用过panda
的read_excel
功能,但是xlrd
满足了我的所有需求,我相信还能提供更多。
您也可以尝试使用 my wrapper library,它也使用 xlrd:
import pyexcel as pe # pip install pyexcel
import pyexcel.ext.xls # pip install pyexcel-xls
your_matrix = pe.get_array(file_name=path_here) # done
这几天 Pandas 这个任务超级简单。
import pandas as pd
df = pd.read_excel('file_name_here.xlsx', sheet_name='Sheet1')
或
df = pd.read_csv('file_name_here.csv')
这个 returns 一个 pandas.DataFrame
对象,它对于按列、行、整个 df 或带有 iterrows 的单个项目执行操作非常强大。更不用说以不同的方式切片了。
在我工作的实验室中,我们处理了 96 孔板产生的大量数据 reader。我正在尝试编写一个脚本,该脚本将执行一些计算并使用 matplotlib 输出条形图。
问题是板 reader 将数据输出到 .xlsx 文件中。我知道像 pandas 这样的一些模块有一个 read_excel 函数,你能解释一下我应该如何读取 excel 文件并将其放入数据帧吗?
谢谢
24 孔板的数据样本(为简单起见):
0.0868 0.0910 0.0912 0.0929 0.1082 0.1350
0.0466 0.0499 0.0367 0.0445 0.0480 0.0615
0.6998 0.8476 0.9605 0.0429 1.1092 0.0644
0.0970 0.0931 0.1090 0.1002 0.1265 0.1455
我不太确定你所说的数组是什么意思,但如果你指的是矩阵,你可能正在寻找:
import pandas as pd
df = pd.read_excel([path here])
df.as_matrix()
这个returns一个numpy.ndarray类型。
真棒xlrd
package with quick start example here。
您可以 google 它来查找代码片段。我没用过panda
的read_excel
功能,但是xlrd
满足了我的所有需求,我相信还能提供更多。
您也可以尝试使用 my wrapper library,它也使用 xlrd:
import pyexcel as pe # pip install pyexcel
import pyexcel.ext.xls # pip install pyexcel-xls
your_matrix = pe.get_array(file_name=path_here) # done
这几天 Pandas 这个任务超级简单。
import pandas as pd
df = pd.read_excel('file_name_here.xlsx', sheet_name='Sheet1')
或
df = pd.read_csv('file_name_here.csv')
这个 returns 一个 pandas.DataFrame
对象,它对于按列、行、整个 df 或带有 iterrows 的单个项目执行操作非常强大。更不用说以不同的方式切片了。