从数据框列索引中创建 csv 的循环
Loop for creating csv out of dataframe column index
我想创建一个循环来创建多个 csvs,这些 csvs 在开头具有相同的 9 列,但在最后一列中迭代不同。
[col1,col2,col3,col4,...,col9,col[i]]
我有一个形状为 (20000,209) 的数据框。
我想要的是我创建一个循环,它不会占用太多计算能力和资源,但会创建 200 个 csvs,它们在最后一列中有所不同。所有列都存在于一个数据框中。应添加的列在 i =[10:-1].
列中
我想到了类似的东西:
for col in df.columns[10:-1]:
dfi = df[:9]
dfi.concat(df[10])
dfi.dropna()
dfi.to_csv('dfi.csv'))
也许也可以使用
dfi.to_csv('dfi.csv', sequence = [:9,i])
i 应该显示添加的列的编号。知道如何轻松实现这一目标吗? :)
非常感谢!
我不确定我是否完全理解你想要什么,但你是说每个 csv 应该只有 10 列,所有的都应该有前 9 列,然后剩下的 200 列中的每一列都有一个 csv?
如果是这样,我会选择像这样简单的东西:
base_cols = list(range(9))
for i in range(9, 209):
df.iloc[:, base_cols+[i]].to_csv('csv{}.csv'.format(i))
我认为哪个应该有效。
我想创建一个循环来创建多个 csvs,这些 csvs 在开头具有相同的 9 列,但在最后一列中迭代不同。
[col1,col2,col3,col4,...,col9,col[i]]
我有一个形状为 (20000,209) 的数据框。 我想要的是我创建一个循环,它不会占用太多计算能力和资源,但会创建 200 个 csvs,它们在最后一列中有所不同。所有列都存在于一个数据框中。应添加的列在 i =[10:-1].
列中我想到了类似的东西:
for col in df.columns[10:-1]:
dfi = df[:9]
dfi.concat(df[10])
dfi.dropna()
dfi.to_csv('dfi.csv'))
也许也可以使用
dfi.to_csv('dfi.csv', sequence = [:9,i])
i 应该显示添加的列的编号。知道如何轻松实现这一目标吗? :)
非常感谢!
我不确定我是否完全理解你想要什么,但你是说每个 csv 应该只有 10 列,所有的都应该有前 9 列,然后剩下的 200 列中的每一列都有一个 csv?
如果是这样,我会选择像这样简单的东西:
base_cols = list(range(9))
for i in range(9, 209):
df.iloc[:, base_cols+[i]].to_csv('csv{}.csv'.format(i))
我认为哪个应该有效。