如何使用 Python 获取前 200 个 Facebook 用户的姓名？

Question

我正在尝试获取前 200 位 Facebook 用户的姓名。我正在使用 Python 和 BeautifulSoup

我使用的方法是不使用图形 API，而是尝试使用网页标题获取名称。（个人资料网页的标题是这个人）

第一个用户是扎克伯格(id:4)。我想要 200 之前的名字。

这是我试过的方法。

import urllib2
from BeautifulSoup import BeautifulSoup

x=4

while(x<=200):
    print BeautifulSoup(urllib2.urlopen("https://www.facebook.com/"+str(x))).title.string
    x+=1

有人可以帮忙吗？

Answer 1

好吧，我同意其他评论者的观点，即几乎没有足够的信息来找出问题所在。但是稍微读一下字里行间，我想 OP 期望

等页面的结果

https://www.facebook.com/4 它被重定向到 https://www.facebook.com/zuck, Mark Zuckerberg's page, and https://www.facebook.com/5 它被重定向到另一位早期 Facebook 员工 https://www.facebook.com/ChrisHughes，将继续为 OP 插入的更多任意用户 ID 工作。事实上，我相信这个技巧在过去确实有用......直到有人发布了某个地方的前 2000 名 Facebook 用户的电子表格，并且 Facebook 压制了这个漏洞（这是来自记忆，我敢打赌如果有人想挖掘的话会有新闻报道）。

无论如何，尝试 URL 中的更多用户 ID，例如： https://www.facebook.com/7 现在给出 "Sorry, this page isn't available" 响应。对于 OP，我认为您没有任何简单的方法可以围绕此进行编码——Zuck 显然不在乎您正在收获他自己的页面，但我猜他并不热衷于让您抓取整个 Facebook 用户列表.对不起。

更新：您可能仍然可以使用 Facebook 的图表 API 进行此类收集 - 看起来像 https://graph.facebook.com/100 will work for most User IDs. You should be able to script up what you need from there (if I were Facebook, I would have rate-limiting in place to prevent mass harvesting, but you'll have to try and see what you get for yourself.) Here's a script 这样的页面的 GET类似于您要执行的操作。

如何使用 Python 获取前 200 个 Facebook 用户的姓名？

How to get names of first 200 Facebook users using Python?

python

facebook