如何使用 pandas 读取目录中所有文件的内容?
How can I read the contents of all the files in a directory with pandas?
我有一个包含很多 .txt
文件的文件夹。如何读取文件夹中的所有文件并使用 pandas 获取它们的内容?我尝试了以下方法:
import pandas as pd
list_=pd.read_csv("/path/of/the/directory/*.txt",header=None)
print list_
像这样:
import glob
l = [pd.read_csv(filename) for filename in glob.glob("/path/*.txt")]
df = pd.concat(l, axis=0)
您必须考虑 header,例如,如果您想忽略它,请查看 read_csv 中的 skiprows 选项。
我在我的项目中使用它来合并 csv 文件
import pandas as pd
import os
path = "path of the file"
files = [file for file in os.listdir(path) if not file.startswith('.')]
all_data = pd.DataFrame()
for file in files:
current_data = pd.read_csv(path+"/"+file , encoding = "ISO-8859-1")
all_data = pd.concat([all_data,current_data])
我有一个包含很多 .txt
文件的文件夹。如何读取文件夹中的所有文件并使用 pandas 获取它们的内容?我尝试了以下方法:
import pandas as pd
list_=pd.read_csv("/path/of/the/directory/*.txt",header=None)
print list_
像这样:
import glob
l = [pd.read_csv(filename) for filename in glob.glob("/path/*.txt")]
df = pd.concat(l, axis=0)
您必须考虑 header,例如,如果您想忽略它,请查看 read_csv 中的 skiprows 选项。
我在我的项目中使用它来合并 csv 文件
import pandas as pd
import os
path = "path of the file"
files = [file for file in os.listdir(path) if not file.startswith('.')]
all_data = pd.DataFrame()
for file in files:
current_data = pd.read_csv(path+"/"+file , encoding = "ISO-8859-1")
all_data = pd.concat([all_data,current_data])