是否可以使用 unicode 列实例化 DataFrame?

Is it possible to instantiate a DataFrame with a unicode column?

我正在尝试创建一个 DataFrame,其中有一列存储 unicode 数据而不是标准的 python string,因为我的语言有一些额外的重音字母,例如ñ, á, é 等。

我尝试了以下方法。

x = sqlContext.createDataFrame([u"A", u"B", u"C"], ["letters"])

并显示下一个异常。

TypeError: Can not infer schema for type: <.type 'unicode'>

然后我阅读了 type documentation 并没有找到兼容的数据类型,因此我问是否有人知道是否可以实现这个?

问题是您如何提供元素而不是 unicode 数据。即使您只有一列,每个元素都应该是受支持的类型,例如 Rowlisttuple:

df = sqlContext.createDataFrame([(u"A", ), (u"B", ), (u"C", )], ["letters"])