使用 LINQ to Twitter 查找不活跃的 Twitter 关注者的最有效方法
Most efficient way to find inactive Twitter followers using LINQ to Twitter
Twitter API 允许的查询数量是有限的。另一方面,"inactive user" 的定义可能暗示对请求数有影响的不同算法。
我正在寻找查询数量和质量 "inactivity" 方面最有效的方法,以使用 LINQ to Twitter 查找不活跃的关注者。
您现在一定已经了解到,rate-limits 和计数限制阻止了 Twitter API 上的许多操作。由于这些限制,大多数答案都不够充分,但这是我会使用的一般方法:
- 获取所有关注者 ID 的列表,使用 Listing Followers 查询。确保将 Count 最大化为 5000 以减少查询数量。如果您的用户拥有数十万(甚至数百万)的关注者,这不是最佳选择,但仍然是最有效的选择。
- 使用该列表,您可以进行 Querying User Details 查询。这里的情况更糟,因为 comma-separated 用户 ID 的最大数量是 100。在这里你可以考虑跟踪 UserIDs 以根据上次扫描的 activity/date 对它们进行分类,以避免 re-visiting 用户你已经知道不活跃了。
- 最后一个查询将为您提供用户实体。每个 User 实体都有一个 Status 属性 表示用户的最新推文。一种想法可能是检查 CreatedAt 日期以确定是否进一步查询该用户。例如是上一条推文是N个月前,用户可能不活跃。
- 尽可能使用 ApplicationOnlyAuthorizer,因为它会提供更高的速率限制。
- 您的速率限制 windows 是 15 分钟。通过对限制执行特定查询类型来创建管道,并将结果排队以供链中的下一个任务使用。让下一个任务使用它的限制并从那里继续。
关于此的事情之一是您如何定义 "Active" 和 "Inactive",因为可能存在边缘情况。例如如果您的人推文不多,但他们会私信、收藏或转发,那该怎么办?您必须查询用户的 activity 才能提取额外数据。希望这将验证您已经知道的内容,或者可能添加一个或两个可能有用的想法。
注意:如果您愿意付费并避免速率限制,请考虑使用 Gnip。
Twitter API 允许的查询数量是有限的。另一方面,"inactive user" 的定义可能暗示对请求数有影响的不同算法。
我正在寻找查询数量和质量 "inactivity" 方面最有效的方法,以使用 LINQ to Twitter 查找不活跃的关注者。
您现在一定已经了解到,rate-limits 和计数限制阻止了 Twitter API 上的许多操作。由于这些限制,大多数答案都不够充分,但这是我会使用的一般方法:
- 获取所有关注者 ID 的列表,使用 Listing Followers 查询。确保将 Count 最大化为 5000 以减少查询数量。如果您的用户拥有数十万(甚至数百万)的关注者,这不是最佳选择,但仍然是最有效的选择。
- 使用该列表,您可以进行 Querying User Details 查询。这里的情况更糟,因为 comma-separated 用户 ID 的最大数量是 100。在这里你可以考虑跟踪 UserIDs 以根据上次扫描的 activity/date 对它们进行分类,以避免 re-visiting 用户你已经知道不活跃了。
- 最后一个查询将为您提供用户实体。每个 User 实体都有一个 Status 属性 表示用户的最新推文。一种想法可能是检查 CreatedAt 日期以确定是否进一步查询该用户。例如是上一条推文是N个月前,用户可能不活跃。
- 尽可能使用 ApplicationOnlyAuthorizer,因为它会提供更高的速率限制。
- 您的速率限制 windows 是 15 分钟。通过对限制执行特定查询类型来创建管道,并将结果排队以供链中的下一个任务使用。让下一个任务使用它的限制并从那里继续。
关于此的事情之一是您如何定义 "Active" 和 "Inactive",因为可能存在边缘情况。例如如果您的人推文不多,但他们会私信、收藏或转发,那该怎么办?您必须查询用户的 activity 才能提取额外数据。希望这将验证您已经知道的内容,或者可能添加一个或两个可能有用的想法。
注意:如果您愿意付费并避免速率限制,请考虑使用 Gnip。