如何使用 Python 获取前 200 个 Facebook 用户的姓名?
How to get names of first 200 Facebook users using Python?
我正在尝试获取前 200 位 Facebook 用户的姓名。
我正在使用 Python 和 BeautifulSoup
我使用的方法是不使用图形 API,而是尝试使用网页标题获取名称。(个人资料网页的标题是这个人)
第一个用户是扎克伯格(id:4)。我想要 200 之前的名字。
这是我试过的方法。
import urllib2
from BeautifulSoup import BeautifulSoup
x=4
while(x<=200):
print BeautifulSoup(urllib2.urlopen("https://www.facebook.com/"+str(x))).title.string
x+=1
有人可以帮忙吗?
好吧,我同意其他评论者的观点,即几乎没有足够的信息来找出问题所在。但是稍微读一下字里行间,我想 OP 期望
等页面的结果
https://www.facebook.com/4
它被重定向到 https://www.facebook.com/zuck, Mark Zuckerberg's page, and https://www.facebook.com/5
它被重定向到另一位早期 Facebook 员工 https://www.facebook.com/ChrisHughes,将继续为 OP 插入的更多任意用户 ID 工作。事实上,我相信这个技巧在过去确实有用......直到有人发布了某个地方的前 2000 名 Facebook 用户的电子表格,并且 Facebook 压制了这个漏洞(这是来自记忆,我敢打赌如果有人想挖掘的话会有新闻报道)。
无论如何,尝试 URL 中的更多用户 ID,例如:
https://www.facebook.com/7 现在给出 "Sorry, this page isn't available" 响应。对于 OP,我认为您没有任何简单的方法可以围绕此进行编码——Zuck 显然不在乎您正在收获他自己的页面,但我猜他并不热衷于让您抓取整个 Facebook 用户列表.对不起。
更新:您可能仍然可以使用 Facebook 的图表 API 进行此类收集 - 看起来像 https://graph.facebook.com/100 will work for most User IDs. You should be able to script up what you need from there (if I were Facebook, I would have rate-limiting in place to prevent mass harvesting, but you'll have to try and see what you get for yourself.) Here's a script 这样的页面的 GET类似于您要执行的操作。
我正在尝试获取前 200 位 Facebook 用户的姓名。 我正在使用 Python 和 BeautifulSoup
我使用的方法是不使用图形 API,而是尝试使用网页标题获取名称。(个人资料网页的标题是这个人)
第一个用户是扎克伯格(id:4)。我想要 200 之前的名字。
这是我试过的方法。
import urllib2
from BeautifulSoup import BeautifulSoup
x=4
while(x<=200):
print BeautifulSoup(urllib2.urlopen("https://www.facebook.com/"+str(x))).title.string
x+=1
有人可以帮忙吗?
好吧,我同意其他评论者的观点,即几乎没有足够的信息来找出问题所在。但是稍微读一下字里行间,我想 OP 期望
等页面的结果https://www.facebook.com/4 它被重定向到 https://www.facebook.com/zuck, Mark Zuckerberg's page, and https://www.facebook.com/5 它被重定向到另一位早期 Facebook 员工 https://www.facebook.com/ChrisHughes,将继续为 OP 插入的更多任意用户 ID 工作。事实上,我相信这个技巧在过去确实有用......直到有人发布了某个地方的前 2000 名 Facebook 用户的电子表格,并且 Facebook 压制了这个漏洞(这是来自记忆,我敢打赌如果有人想挖掘的话会有新闻报道)。
无论如何,尝试 URL 中的更多用户 ID,例如: https://www.facebook.com/7 现在给出 "Sorry, this page isn't available" 响应。对于 OP,我认为您没有任何简单的方法可以围绕此进行编码——Zuck 显然不在乎您正在收获他自己的页面,但我猜他并不热衷于让您抓取整个 Facebook 用户列表.对不起。
更新:您可能仍然可以使用 Facebook 的图表 API 进行此类收集 - 看起来像 https://graph.facebook.com/100 will work for most User IDs. You should be able to script up what you need from there (if I were Facebook, I would have rate-limiting in place to prevent mass harvesting, but you'll have to try and see what you get for yourself.) Here's a script 这样的页面的 GET类似于您要执行的操作。