如何获取 Instagram 图片的详细信息
How to get Instagram image details
我正在开发一个应用程序,通过使用 selenium 和 python 从 Instagram 获取图像详细信息。
driver.execute_script(SCROLL_TOP)
driver.execute_script(SCROLL_BOTTOM)
在结果中,所有发布的图片和标题都可以从 driver.page_source
但是当我试图获取有关图像的更多信息(例如,喜欢的数量、图像发布日期)时。我需要访问
<script type="text/javascript">window._sharedData = {...}</script>
前面代码中的'...'是一个JSON块。它包含前 12 个媒体的详细信息。有没有办法在 window._shareData JSON 块中获取所有图像的详细信息?
感谢您的建议
看看 ,它解决了您的问题,但 php。无论如何,你可以用 python:
做同样的事情
通过 http 从 url 加载 json:https://www.instagram.com/nasa/?__a=1
(将 nasa
替换为任何 public 用户名)。
从 json 中获取 12 个媒体详细信息:user->media->nodes
。
从 json 获取额外的媒体信息:user->media->page_info
。有 has_next_page
(布尔值)和 end_cursor
(整数)。使用它来获取 url https://www.instagram.com/nasa/?__a=1&max_id=[VALUE-FROM-end_cursor]
.
的下 12 个媒体
- 重复 2-3。
我正在开发一个应用程序,通过使用 selenium 和 python 从 Instagram 获取图像详细信息。
driver.execute_script(SCROLL_TOP)
driver.execute_script(SCROLL_BOTTOM)
在结果中,所有发布的图片和标题都可以从 driver.page_source
但是当我试图获取有关图像的更多信息(例如,喜欢的数量、图像发布日期)时。我需要访问
<script type="text/javascript">window._sharedData = {...}</script>
前面代码中的'...'是一个JSON块。它包含前 12 个媒体的详细信息。有没有办法在 window._shareData JSON 块中获取所有图像的详细信息?
感谢您的建议
看看
通过 http 从 url 加载 json:
https://www.instagram.com/nasa/?__a=1
(将nasa
替换为任何 public 用户名)。从 json 中获取 12 个媒体详细信息:
user->media->nodes
。从 json 获取额外的媒体信息:
user->media->page_info
。有has_next_page
(布尔值)和end_cursor
(整数)。使用它来获取 urlhttps://www.instagram.com/nasa/?__a=1&max_id=[VALUE-FROM-end_cursor]
. 的下 12 个媒体
- 重复 2-3。