使用 BeautifulSoup 从网页中抓取 javascript / json 对象?
Scraping a javascript / json object from a webpage using BeautifulSoup?
我正在使用 BeautifulSoup 获取网页的 HTML。到目前为止效果很好。但我真正想要的是 HTML 内的 javascript 块的内容,它用 <script type="text/javascript">
封装,然后在那个标签内,最终有一个巨大的数组东西,有很多{}
个括号,我相信这是一个 JSON 数组?
有什么方法可以尝试从 HTML 中提取整个数组?
您正在查找函数 json.loads
。
>>> import json
>>> obj = json.loads('{"a": 12, "b": null}')
>>> obj
{'b': None, 'a': 12}
我正在使用 BeautifulSoup 获取网页的 HTML。到目前为止效果很好。但我真正想要的是 HTML 内的 javascript 块的内容,它用 <script type="text/javascript">
封装,然后在那个标签内,最终有一个巨大的数组东西,有很多{}
个括号,我相信这是一个 JSON 数组?
有什么方法可以尝试从 HTML 中提取整个数组?
您正在查找函数 json.loads
。
>>> import json
>>> obj = json.loads('{"a": 12, "b": null}')
>>> obj
{'b': None, 'a': 12}