将多个 Excel 个文件合并为一个
Converting Multiple Excel Files Into One
我有多个 excel 文件保存在我转换成一个数据框的文件夹中。我写了一个 python 代码来将所有的 csv 文件组合成一个数据帧。问题是列格式不是我所期望的。这意味着原始文件包含单独的开盘价、最高价、最低价、收盘价和成交量函数,但组合数据框包含所有这些合并为一个的数据。我想合并文件以保留原始列格式,即开盘价、最高价、最低价、收盘价、交易量是单独的列。
这是我的代码:
<pre><code>import os
import pandas as pd
os.chdir("C:/Users/Administrator/Desktop/Zerodha/Day2/")
path = "C:/Users/Administrator/Desktop/Zerodha/Day2/"
files =os.listdir(path)
values =pd.DataFrame()
for f in files:
data = pd.read_csv(f, delim_whitespace=True)
values = values.append(data)
这是我的主数据帧的输出:
Values Data Frame
但是,我希望主数据框具有单独的列,如下所示:
Original Files
如有任何反馈,我们将不胜感激。
谢谢。
尝试使用与 CSV 文件内容匹配的列分隔符。例如,如果 CSV 文件的纯文本内容类似于以下内容,则使用 pd.read_csv(f, delimiter=',')
:
date,open,high,low,close,volume
2020-11-09 09:15:00+05:30,10.25,10.45,10.25,10.45,300
原因是 pandas.read_csv(fileobj, delim_whitespace=True)
需要空格作为列分隔符。如果 CSV 文件具有我的示例中假定的格式(逗号分隔),则具有 delim_whitespace=True
将导致遇到问题。
delim_whitespace
上 pandas.read_csv() docs 的片段:
delim_whitespace: bool, default False
Specifies whether or not whitespace (e.g. ' ' or ' ') will be used as the sep. Equivalent to setting sep='\s+'. If this option is set to True, nothing should be passed in for the delimiter parameter.
我有多个 excel 文件保存在我转换成一个数据框的文件夹中。我写了一个 python 代码来将所有的 csv 文件组合成一个数据帧。问题是列格式不是我所期望的。这意味着原始文件包含单独的开盘价、最高价、最低价、收盘价和成交量函数,但组合数据框包含所有这些合并为一个的数据。我想合并文件以保留原始列格式,即开盘价、最高价、最低价、收盘价、交易量是单独的列。
这是我的代码:
<pre><code>import os
import pandas as pd
os.chdir("C:/Users/Administrator/Desktop/Zerodha/Day2/")
path = "C:/Users/Administrator/Desktop/Zerodha/Day2/"
files =os.listdir(path)
values =pd.DataFrame()
for f in files:
data = pd.read_csv(f, delim_whitespace=True)
values = values.append(data)
这是我的主数据帧的输出:
Values Data Frame
但是,我希望主数据框具有单独的列,如下所示:
Original Files
如有任何反馈,我们将不胜感激。
谢谢。
尝试使用与 CSV 文件内容匹配的列分隔符。例如,如果 CSV 文件的纯文本内容类似于以下内容,则使用 pd.read_csv(f, delimiter=',')
:
date,open,high,low,close,volume
2020-11-09 09:15:00+05:30,10.25,10.45,10.25,10.45,300
原因是 pandas.read_csv(fileobj, delim_whitespace=True)
需要空格作为列分隔符。如果 CSV 文件具有我的示例中假定的格式(逗号分隔),则具有 delim_whitespace=True
将导致遇到问题。
delim_whitespace
上 pandas.read_csv() docs 的片段:
delim_whitespace: bool, default False
Specifies whether or not whitespace (e.g. ' ' or ' ') will be used as the sep. Equivalent to setting sep='\s+'. If this option is set to True, nothing should be passed in for the delimiter parameter.