循环 url 链接并在 Python 中另存为 pdf 文件
Loop url links and save as pdf files in Python
给定一个数据帧 df
如下:
projectCode url
0 FCZZZZCQ2021020200921 https://www.cspea.com.cn/list/c01/FCZZZZCQ2021020200921
1 GR2021BJ1000351 https://www.cspea.com.cn/list/c01/GR2021BJ1000351
2 GR2021QD1000030 https://www.cspea.com.cn/list/c01/GR2021QD1000030
3 GR2021BJ1000186 https://www.cspea.com.cn/list/c01/GR2021BJ1000186
4 FCZZCQ2020123011487 https://www.cspea.com.cn/list/c01/FCZZCQ2020123011487
我想使用 pdfkit
打包将每个 url
link 保存为 pdf 文件,并使用 projectCode
作为文件名:
import pdfkit
import pandas as pd
data = []
urls = df.url.tolist()
for url_link in urls:
pdfkit.from_url(url, 'out.pdf')
我该怎么做?谢谢。
你应该zip
列来使用它:
for a, url in zip(df['projectCode'], df['url']):
pdfkit.from_url(url, f'{a}.pdf')
给定一个数据帧 df
如下:
projectCode url
0 FCZZZZCQ2021020200921 https://www.cspea.com.cn/list/c01/FCZZZZCQ2021020200921
1 GR2021BJ1000351 https://www.cspea.com.cn/list/c01/GR2021BJ1000351
2 GR2021QD1000030 https://www.cspea.com.cn/list/c01/GR2021QD1000030
3 GR2021BJ1000186 https://www.cspea.com.cn/list/c01/GR2021BJ1000186
4 FCZZCQ2020123011487 https://www.cspea.com.cn/list/c01/FCZZCQ2020123011487
我想使用 pdfkit
打包将每个 url
link 保存为 pdf 文件,并使用 projectCode
作为文件名:
import pdfkit
import pandas as pd
data = []
urls = df.url.tolist()
for url_link in urls:
pdfkit.from_url(url, 'out.pdf')
我该怎么做?谢谢。
你应该zip
列来使用它:
for a, url in zip(df['projectCode'], df['url']):
pdfkit.from_url(url, f'{a}.pdf')