如何解决 Pyspark dataframes query error keyword can't be an expression
how to resolve Pyspark dataframes query error keyword can't be an expression
我有两个名为 tweetsDF 和 HashtagsDF 的数据框。两个数据帧的 tweet_status_id 相等,我想检索单个推文的主题标签计数。这是我正在使用的查询,它会抛出
ERROR : SyntaxError: keyword can't be an expression
tweet_hashtags_count_DF = tweetsDF.join(HashtagsDF,sum('tweetsDF.*'),tweetsDF.tweet_status_id == HashtagsDF.tweet_status_id & tweetsDF.tweet_status_id='636984052600274944').show()
我查询哪里错了?
尝试 tweetsDF.tweet_status_id == '636984052600274944'
(==
而不是 =
)。
我有两个名为 tweetsDF 和 HashtagsDF 的数据框。两个数据帧的 tweet_status_id 相等,我想检索单个推文的主题标签计数。这是我正在使用的查询,它会抛出
ERROR : SyntaxError: keyword can't be an expression
tweet_hashtags_count_DF = tweetsDF.join(HashtagsDF,sum('tweetsDF.*'),tweetsDF.tweet_status_id == HashtagsDF.tweet_status_id & tweetsDF.tweet_status_id='636984052600274944').show()
我查询哪里错了?
尝试 tweetsDF.tweet_status_id == '636984052600274944'
(==
而不是 =
)。