如何从 RDD 输出中删除括号?
How to remove brackets from RDD output?
当我打印 RDD 时,我得到以下结果:
[(46, u'15910'), (43, u'15287'), (43, u'15237'), (42, u'15923'), (41, u'15298')]
我想将 RDD 输出保存到不带括号或 'u' 符号的 csv 文件,类似于以下内容:
46, 15910
43, 15287
43, 15237
42, 15923
41, 15298
要么写入csv:
>>> rdd.toDF().write.csv("path")
或格式:
>>> rdd.map(lambda (k, v): "{0},{1}".format(k, v)).saveAsTextFile("path")
当我打印 RDD 时,我得到以下结果:
[(46, u'15910'), (43, u'15287'), (43, u'15237'), (42, u'15923'), (41, u'15298')]
我想将 RDD 输出保存到不带括号或 'u' 符号的 csv 文件,类似于以下内容:
46, 15910
43, 15287
43, 15237
42, 15923
41, 15298
要么写入csv:
>>> rdd.toDF().write.csv("path")
或格式:
>>> rdd.map(lambda (k, v): "{0},{1}".format(k, v)).saveAsTextFile("path")