您如何使用 beautifulsoup 或某些 Python 库从重定向 link 中抓取或检索真实网站 URL?示例如下:
How do you use beautifulsoup or some Python library to scrape or retrieve the real website URL from a redirect link? Example below:
I have a redirect link here: https://www.capterra.com/external_click/category-upgraded-visit-website-button/1/1000551/194873/uc/aHR0cHM6Ly93d3cucGdpLmNvbS9nb3BnaS91Y2Fhcy1kZW1vLXJlcXVlc3Q*dXRtX3NvdXJjZT1jYXB0ZXJyYSZ1dG1fbWVkaXVtPWNwYyZ1dG1fY2FtcGFpZ249TkE6REc6VUNhYVNDYXB0ZXJyYSZ1dG1fY29udGVudD1MUA==?ds=356501d23992f743aad5c9481391c74d92edd624
当您点击它时,它会将您带到实际网站 link 此处:https://www.pgi.com/gopgi/ucaas-demo-request/?utm_source=capterra&utm_medium=cpc&utm_campaign=NA:DG:UCaaSCapterra&utm_content=LP
我还有成千上万个这样的 link,我想知道是否有一种方法可以使用代码去每个重定向 link,然后得到实际的网站 link 访问网站一次。提前感谢您的宝贵时间!
只需使用requests
模块:
import requests
r = requests.get('your redirect link')
print(r.url) # this prints the actual website link after redirection
注意
不要忘记在命令行中使用 pip install resqests
安装 requests
模块
I have a redirect link here: https://www.capterra.com/external_click/category-upgraded-visit-website-button/1/1000551/194873/uc/aHR0cHM6Ly93d3cucGdpLmNvbS9nb3BnaS91Y2Fhcy1kZW1vLXJlcXVlc3Q*dXRtX3NvdXJjZT1jYXB0ZXJyYSZ1dG1fbWVkaXVtPWNwYyZ1dG1fY2FtcGFpZ249TkE6REc6VUNhYVNDYXB0ZXJyYSZ1dG1fY29udGVudD1MUA==?ds=356501d23992f743aad5c9481391c74d92edd624
当您点击它时,它会将您带到实际网站 link 此处:https://www.pgi.com/gopgi/ucaas-demo-request/?utm_source=capterra&utm_medium=cpc&utm_campaign=NA:DG:UCaaSCapterra&utm_content=LP
我还有成千上万个这样的 link,我想知道是否有一种方法可以使用代码去每个重定向 link,然后得到实际的网站 link 访问网站一次。提前感谢您的宝贵时间!
只需使用requests
模块:
import requests
r = requests.get('your redirect link')
print(r.url) # this prints the actual website link after redirection
注意
不要忘记在命令行中使用 pip install resqests
安装 requests
模块