twitter4j - 控制采样率

twitter4j - controlling sampling rate

我需要使用 twitter4j 库抓取过去 1 周与特定查询相关的推文。我编写了一个批量收集批量可重启程序,我 运行 一夜之间收集了大约 5 GB 的推文。我相信这些是由 Twitter API 抽取的 1%。 我需要跨越一周的推文,但这对我来说是大量数据。我只需要代表上周的推文。我想知道是否有任何方法可以通过 twitter4j 配置来控制采样率。

你不能降低采样率,你应该采取让你满意的方法,比如取一个小时内随机收集的推文的 10% 或使用一些 filters...随你喜欢!