获取构成网页的 json 文件

get a json file that a webpage is made of

我不熟悉网络开发,但我相信这个网页的文字内容 https://almath123.github.io/semstyle_examples/ 由其中提到的两个 JSON 文件组成(semstyle_results.jsonsemstyle_results.json)并且 JSON 文件完全存在于 ram 中(如果这是引用它的正确术语) 因为当我断开互联网时,我仍然可以浏览页面并查看文本内容。

我想下载 semstyle_results.json 文件。那可能吗?我该怎么做?

从技术上讲,如果您访问一个网站,您就是 "downloading" 的内容。您的浏览器发送信息请求,服务器通过向您发送信息来响应。您正在本地查看该信息。动态网站会在您浏览时轮询或提出进一步的请求,以保持数据更新和相关,但它会发送给您。

如果您想轻松地从网站下载任何内容,一个简单的方法是打开开发工具(CTRL + SHFT + I on windows 对于 Firefox 和 Chrome),转到源文件并单击 save asnetwork 选项卡显示已发出的请求,其中不仅包括 json 等文件,还包括请求的详细信息。

这是在基于 Chrome 的浏览器 (Brave) 中找到 json 文件之一的屏幕截图

网页可能并不总是显示它们将支持 json 或 xml return 数据。例如,如果您使用上述方法检查此网页 SEC EDGAR database,它不会显示 json link,但如果您在 link 的末尾附加 index.json它将 return 相同的数据以 json 格式或 xml 格式,如果你愿意的话。

即:same website but with json endpoint

因此,查看网站是否包含开发人员信息始终是个好主意。例如,SEC EDGAR 提供的开发人员工具提到可以通过 HTML、XML 或 JSON.

访问目录结构

SEC developer information