为什么 <div class=\"gn_topmenulist\"> ?是什么 \

why <div class=\"gn_topmenulist\"> ? what is the \

背景是我用scrapy爬取weibo.com,但是我发现html爬取的标签中包含'\' 看起来像标题:,导致我无法使用xpath获取信息,所以出现\的原因。

反斜杠用于转义引号,否则第一个引号将结束字符串,从而结束输出,因此其余部分可能不会出现,或者如果您正在使用输出则会中断在一个程序中。

简而言之:字符串文字可以用匹配的单引号 (') 或双引号 (") 括起来。它们也可以用三个单引号或双引号组成的匹配组括起来(这些通常称为三重引号-quoted 字符串)。反斜杠 (\) 字符用于转义其他具有特殊含义的字符,例如换行符、反斜杠本身或引号字符。

Python参考手册:String literals