将 tsv 的内容从文件夹合并到数据框中
Merging content of tsv's from a folder into a dataframe
我正在尝试将本地文件夹中的 tsv 文件合并到 pandas 数据框中。
我正在尝试遍历文件夹并将它们附加到数据框。
这是我到目前为止尝试过的:
bigdf=[]
for file in os.listdir(r'C:\Users\xxxx'):
print(file)
df = pd.read_csv(r'C:\Users\xxxx\xxxx\' + file, sep='\t')
bigdf.append(df)
'file' 只给我文件名而不是文件本身的内容。
第四行不完全工作。有谁知道如何以附加内容的方式遍历文件?
您的代码似乎是正确的,但您可以尝试类似的操作:
import pathlib
rootdir = pathlib.Path(r'C:\Users\xxxx')
data = []
for file in rootdir.glob('*.tsv'):
print(file)
df = pd.read_csv(file, sep='\t')
data.append(df)
bigdf = pd.concat(data) # or pd.concat(data, axis='columns')
我正在尝试将本地文件夹中的 tsv 文件合并到 pandas 数据框中。 我正在尝试遍历文件夹并将它们附加到数据框。 这是我到目前为止尝试过的:
bigdf=[]
for file in os.listdir(r'C:\Users\xxxx'):
print(file)
df = pd.read_csv(r'C:\Users\xxxx\xxxx\' + file, sep='\t')
bigdf.append(df)
'file' 只给我文件名而不是文件本身的内容。 第四行不完全工作。有谁知道如何以附加内容的方式遍历文件?
您的代码似乎是正确的,但您可以尝试类似的操作:
import pathlib
rootdir = pathlib.Path(r'C:\Users\xxxx')
data = []
for file in rootdir.glob('*.tsv'):
print(file)
df = pd.read_csv(file, sep='\t')
data.append(df)
bigdf = pd.concat(data) # or pd.concat(data, axis='columns')