如何使用源代码中的 BeautifulSoup 获取数组数据?
How to get Array Data using BeautifulSoup from a Source Code?
我想在这里做的是“=>”之后的那些值
可以用 BeautifulSoup 制作吗?
这是源代码中的内容:
<!-- <pre style="text-align: left">Array
(
[vl_lance_order] => R$ 34.000
[data_leilao] => 17-07-2015 - 10h00
[nm_identificacao] =>
[incremento_minimo] => 2000
[incremento_sistema] => 2000.00
[mensagem] => FOTOS ATUALIZADAS
[segmento_id] => 667740
[dt_inicioleilaoonline] => 2015-07-13
[nm_img] => C667740A.JPG;C667740B.JPG;C667740C.JPG;C667740D.JPG;C667740E.JPG;C667740F.JPG
[nu_contadorvisita] => 921
[vl_multiplo] => 0.00
[ordenacao] => 0
[nm_deposito] => Curitiba
[numlances] => 14
[cli] => 1230
[nm_cliente] => BANCO MERCEDES-BENZ S.A
[link] => /leilao/12240/lote/1485951/segmento/veiculos/ordenacao/data_leilao/tipo-ordenacao/crescente/qtde-itens/15/visualizacao/visual_imagem/item-atual/1/pagina/1/
)
</pre> -->
是的,有评论。
我目前拥有的是:
url = 'https://www.example.com'
source_code = requests.get(url)
soup = BeautifulSoup(source_code.content, "html5lib")
欢迎使用 BeautifulSoup 以外的其他解决方案。
谢谢
你为什么不这样做呢?
- 遍历所有行。
- 找到包含
=>
符号的行。
- 然后在
=>
符号上进行拆分,然后打印拆分列表的索引 1。
如果源代码总是与您提供的格式相同,您为什么不考虑将其分成几行,然后用 "=>"
再次拆分?
for line in src.split("\n"):
segs = line.split("=>")
if len(segs) == 2:
key = segs[0].strip().replace("[", "").replace("]", "")
value = segs[1].strip()
我想在这里做的是“=>”之后的那些值 可以用 BeautifulSoup 制作吗?
这是源代码中的内容:
<!-- <pre style="text-align: left">Array
(
[vl_lance_order] => R$ 34.000
[data_leilao] => 17-07-2015 - 10h00
[nm_identificacao] =>
[incremento_minimo] => 2000
[incremento_sistema] => 2000.00
[mensagem] => FOTOS ATUALIZADAS
[segmento_id] => 667740
[dt_inicioleilaoonline] => 2015-07-13
[nm_img] => C667740A.JPG;C667740B.JPG;C667740C.JPG;C667740D.JPG;C667740E.JPG;C667740F.JPG
[nu_contadorvisita] => 921
[vl_multiplo] => 0.00
[ordenacao] => 0
[nm_deposito] => Curitiba
[numlances] => 14
[cli] => 1230
[nm_cliente] => BANCO MERCEDES-BENZ S.A
[link] => /leilao/12240/lote/1485951/segmento/veiculos/ordenacao/data_leilao/tipo-ordenacao/crescente/qtde-itens/15/visualizacao/visual_imagem/item-atual/1/pagina/1/
)
</pre> -->
是的,有评论。
我目前拥有的是:
url = 'https://www.example.com'
source_code = requests.get(url)
soup = BeautifulSoup(source_code.content, "html5lib")
欢迎使用 BeautifulSoup 以外的其他解决方案。 谢谢
你为什么不这样做呢?
- 遍历所有行。
- 找到包含
=>
符号的行。 - 然后在
=>
符号上进行拆分,然后打印拆分列表的索引 1。
如果源代码总是与您提供的格式相同,您为什么不考虑将其分成几行,然后用 "=>"
再次拆分?
for line in src.split("\n"):
segs = line.split("=>")
if len(segs) == 2:
key = segs[0].strip().replace("[", "").replace("]", "")
value = segs[1].strip()