当我发出 GET 请求时(在 Python 中),我得到了翻译的文本。如何获取英文内容?

I get translated text when I do a GET request (in Python). How to get English content?

我正在尝试网络抓取 this page 来找乐子。

脚本工作正常,但是 一些 电影的名称被翻译成罗马尼亚语(例如,"Beauty and the Beast""Frumoasa si Bestia").

我猜测服务器正在根据我的 IP 向我发送请求的内容。

但是,在我的浏览器中,无论我使用我的 IP 还是通过浏览器的扩展程序激活 VPN,我都只能看到英文名称。可能是因为浏览器语言设置为英文,翻译选项关闭。

我的问题是:如何获取所有的英文名字?

我可以在 GET 请求中指定一些参数吗?

import requests
page = requests.get(some_URL)

我也在考虑使用服务器 VPN(不仅仅是浏览器扩展),但我 运行 在 Lubuntu 上,安装免费 VPN 似乎很头疼(帐户是制作等)。

如果有帮助,我会使用 Jupyter Notebook 来编码。

我猜这个站点正在根据浏览器语言提供页面。尝试根据要求进行设置:

import requests

url = r"http://www.imdb.com/search/title?release_date=2017&page=1&ref_=adv_nxt"
headers = {"Accept-Language": "en-US,en;q=0.5"}
r = requests.get(url, headers=headers)

顺便说一句。检查 imdb 网络抓取的政策。