如何使用 Java 从 cookie 驱动的网站获取网页源代码

How to get web page source from a cookie drived web site using Java

如果有正则url就很容易得到网页源

这是一个答案: How to get a web page's source code from Java

但是有些网站,比如 Sobeys。他们要求您先输入您的位置,然后您可以获得不同位置的不同传单。好像是根据你的喜好设置cookie,然后你可以得到相同的传单内容,直到你关闭你的浏览器。

我的问题是,对于这种网页,我如何使用 Java 获取特定传单的网页来源(例如,我想从 Danforth Toronto 的 Sobeys 获取 flayers)?我不能使用 https://www.sobeys.com/en/flyer,因为它似乎一直都一样。但是我如何获得我的传单的特定网页源代码呢?

尝试使用 java 访问 https://www.sobeys.com/en/stores/sobeys-danforth/preferred 因为它设置了你想要的 cookie,否则 returns 这个 cookie

_carrot-core_session=bCt5WnJadHluUWdlbEVPYkVmb3JQbDc1a2dLWHFYUWw5NlVFVUtUblpRRHJLUEEyZ1MzamN2UjVIWGlSZzBEZDlDUTRxM2JkaEpZeUdNVHh2NUFvVjVxQWM4L015Zm1kaG5wVU5nUytocGRhdzhFMGZvc0pFM090ek41OTVVTy96d2ovTmNBOEdqUDk2dmllUjZoR1BDMEF3S2VCR21SM2thMmlidW01UmIyWmNaRm5sbEZkMjNhRElmakpLd3NvUGxPUTcvdDdlZTZ2UGFWN3BucXZUNkxwWW5ENjZ1TEc1WFpmTlBIT2JsODBkNlI4VHV0S3BuZy81b1JRdytoOS0tdGFpWUIydDNRb1BCeWJPN2psbGxkQT09--b4e4aab475a9d016944bcf0e1207c561e7568b78; domain=.sobeys.com; path=/; HttpOnly

试试看这里:

抱歉,我不能再帮忙了。