如何抓取首发投手并导入 excel?

How do I scrape the starting pitchers and import to excel?

如何抓取首发投手并导入到 excel?

到目前为止,这是我的代码。

from urllib.request import urlopen
from lxml import html

response = urlopen("https://www.baseball-reference.com/previews/index.shtml")
content = response.read()
tree = html.fromstring(content)

我会帮助你开始。首先你要使用 cssselect 除非你喜欢 xpath:

import cssselect

然后你只需找出你想要迭代的东西的css:

for div in tree.cssselect('.game_summaries'):
  for a in div.cssselect('table:nth-child(2) a'):
    print(a.text)

您可以从浏览器的元素检查器中找到 css(最好是 chrome)。