如何解决 Pyspark dataframes query error keyword can't be an expression

how to resolve Pyspark dataframes query error keyword can't be an expression

我有两个名为 tweetsDF 和 HashtagsDF 的数据框。两个数据帧的 tweet_status_id 相等,我想检索单个推文的主题标签计数。这是我正在使用的查询,它会抛出

ERROR : SyntaxError: keyword can't be an expression

tweet_hashtags_count_DF = tweetsDF.join(HashtagsDF,sum('tweetsDF.*'),tweetsDF.tweet_status_id == HashtagsDF.tweet_status_id & tweetsDF.tweet_status_id='636984052600274944').show()

我查询哪里错了?

尝试 tweetsDF.tweet_status_id == '636984052600274944'== 而不是 =)。