是否可以使用 unicode 列实例化 DataFrame?
Is it possible to instantiate a DataFrame with a unicode column?
我正在尝试创建一个 DataFrame
,其中有一列存储 unicode
数据而不是标准的 python string
,因为我的语言有一些额外的重音字母,例如ñ, á, é
等。
我尝试了以下方法。
x = sqlContext.createDataFrame([u"A", u"B", u"C"], ["letters"])
并显示下一个异常。
TypeError: Can not infer schema for type: <.type 'unicode'>
然后我阅读了 type documentation 并没有找到兼容的数据类型,因此我问是否有人知道是否可以实现这个?
问题是您如何提供元素而不是 unicode
数据。即使您只有一列,每个元素都应该是受支持的类型,例如 Row
、list
或 tuple
:
df = sqlContext.createDataFrame([(u"A", ), (u"B", ), (u"C", )], ["letters"])
我正在尝试创建一个 DataFrame
,其中有一列存储 unicode
数据而不是标准的 python string
,因为我的语言有一些额外的重音字母,例如ñ, á, é
等。
我尝试了以下方法。
x = sqlContext.createDataFrame([u"A", u"B", u"C"], ["letters"])
并显示下一个异常。
TypeError: Can not infer schema for type: <.type 'unicode'>
然后我阅读了 type documentation 并没有找到兼容的数据类型,因此我问是否有人知道是否可以实现这个?
问题是您如何提供元素而不是 unicode
数据。即使您只有一列,每个元素都应该是受支持的类型,例如 Row
、list
或 tuple
:
df = sqlContext.createDataFrame([(u"A", ), (u"B", ), (u"C", )], ["letters"])