如何通过 python 确定 .tsv 文件的形状
how to determine the shape of .tsv file through python
我有一个看起来像这样的 .tsv 文件.tsv File structure in MSExcel
我想通过pytorch确定它的形状。我该怎么做
我写了一个代码
import pandas as pd
df = pd.read_csv(path/to/.tsv)
df.shape
并输出
(13596, 1)
但显然形状与我提供的图像冲突。我做错了什么?
使用pd.read_csv时需要指定数据的分隔方式(除非是逗号分隔)
df = pd.read_csv(path/to/.tsv, sep = '\t')
应该正确加载数据。
参见:https://pandas.pydata.org/docs/reference/api/pandas.read_csv.html
编辑:查看您的数据,您还应该指定 header=None
,因为您没有 header 行。理想情况下还使用 pd.read_csv
的 names
参数提供列名列表
问题是您缺少分隔符属性
import pandas as pd
df = pd.read_csv("data/test.txt")
print(df.shape)
输出:(2, 1)
import pandas as pd
df = pd.read_csv("data/test.txt", sep='\t')
print(df.shape)
输出:(2, 3)
所以请将 sep='\t'
添加到您的 read_csv
另外如果有header,可以传header=0
pd.read_csv("data/test.txt", sep='\t', header=0)
如果有帮助请告诉我
我有一个看起来像这样的 .tsv 文件.tsv File structure in MSExcel
我想通过pytorch确定它的形状。我该怎么做
我写了一个代码
import pandas as pd
df = pd.read_csv(path/to/.tsv)
df.shape
并输出
(13596, 1)
但显然形状与我提供的图像冲突。我做错了什么?
使用pd.read_csv时需要指定数据的分隔方式(除非是逗号分隔)
df = pd.read_csv(path/to/.tsv, sep = '\t')
应该正确加载数据。
参见:https://pandas.pydata.org/docs/reference/api/pandas.read_csv.html
编辑:查看您的数据,您还应该指定 header=None
,因为您没有 header 行。理想情况下还使用 pd.read_csv
names
参数提供列名列表
问题是您缺少分隔符属性
import pandas as pd
df = pd.read_csv("data/test.txt")
print(df.shape)
输出:(2, 1)
import pandas as pd
df = pd.read_csv("data/test.txt", sep='\t')
print(df.shape)
输出:(2, 3)
所以请将 sep='\t'
添加到您的 read_csv
另外如果有header,可以传header=0
pd.read_csv("data/test.txt", sep='\t', header=0)
如果有帮助请告诉我