Spark 的 TwitterUtils 库是否捕获所有推特?

Does Spark's TwitterUtils library captures all the twitters?

我正在使用 Spark 的 Twitterutils 库来处理 Twitter。但是,我平均每秒只能收到 60 条推特,而每秒推特的数量肯定要多​​得多。所以,看起来 TwitterUtils 库并没有捕获所有的推特。有解决办法吗?

这不是链接到 Spark 的库,而是链接到 Twitter 对流的限制。如果你使用 public Twitter 流,你被限制在全球流量的 1%,即大约 60 tweets/seconds。

如果您想无限制访问,则需要订阅付费服务,例如 Twitter 子公司 Gnip (http://www.gnip.com)。