pyspark 每行打印一个项目
pyspark print one item in each line
在 Pyspark 中,当我尝试打印列表时,我在同一行中打印了所有元素:
>>> wordslist = words.collect();
>>> wordslist
[(u'crazy', 1), (u'fox', 1), (u'jumped', 1)]
有什么方法可以让输出每行打印一个项目,如下所示:
>>> wordslist
[
(u'crazy', 1),
(u'fox', 1),
(u'jumped', 1)
]
这是基本的 python。当您从 RDD 收集结果时。您将获得一个列表,您可以对其进行迭代并以您希望的格式打印每个元素。
我认为关于如何打印列表的问题已经在 SO 中得到了很多次回答。
和here就是一个例子。
$> mylist = myrdd.collect()
$> for elem in mylist:
$> print elem
您还想检查 pyspark documentation 。
在 Scala 中使用 foreach
也可以实现同样的效果
mylist.foreach(println)
在 Pyspark 中,当我尝试打印列表时,我在同一行中打印了所有元素:
>>> wordslist = words.collect();
>>> wordslist
[(u'crazy', 1), (u'fox', 1), (u'jumped', 1)]
有什么方法可以让输出每行打印一个项目,如下所示:
>>> wordslist
[
(u'crazy', 1),
(u'fox', 1),
(u'jumped', 1)
]
这是基本的 python。当您从 RDD 收集结果时。您将获得一个列表,您可以对其进行迭代并以您希望的格式打印每个元素。
我认为关于如何打印列表的问题已经在 SO 中得到了很多次回答。
和here就是一个例子。
$> mylist = myrdd.collect()
$> for elem in mylist:
$> print elem
您还想检查 pyspark documentation 。
在 Scala 中使用 foreach
也可以实现同样的效果
mylist.foreach(println)