Rails Nokogiri gem - 使用 itemprop 抓取数据
Rails Nokogiri gem - scrape data using itemprop
我有一个 div,如下所示,我正在尝试使用 itemprop
抓取数据,但我似乎无法让它工作。
<div class="information">
<h1 itemprop="title">Some title here</h1>
<span itemprop="addressLocality">St. Inigoes</span>,
<span itemprop="addressRegion">MD</span>
<span itemprop="addressCountry">US</span>
</div>
没有 itemprop 我可以获取数据 data.css('.information').css('h1').try(:text)
但是如果我尝试以下我得到空值 data.css('meta[@itemprop="title"]')
和响应我得到它空值。
所以我的问题是如何使用 itemprop
抓取所有 span
和 h1
的数据
您应该能够使用以下技术进行抓取
title = data.at("//h1[@itemprop = 'title']").children.text
addressLocality = data.at("//span[@itemprop = 'addressLocality']").children.text
addressRegion = data.at("//span[@itemprop = 'addressRegion']").children.text
addressCountry = data.at("//span[@itemprop = 'addressCountry']").children.text
我有一个 div,如下所示,我正在尝试使用 itemprop
抓取数据,但我似乎无法让它工作。
<div class="information">
<h1 itemprop="title">Some title here</h1>
<span itemprop="addressLocality">St. Inigoes</span>,
<span itemprop="addressRegion">MD</span>
<span itemprop="addressCountry">US</span>
</div>
没有 itemprop 我可以获取数据 data.css('.information').css('h1').try(:text)
但是如果我尝试以下我得到空值 data.css('meta[@itemprop="title"]')
和响应我得到它空值。
所以我的问题是如何使用 itemprop
span
和 h1
的数据
您应该能够使用以下技术进行抓取
title = data.at("//h1[@itemprop = 'title']").children.text
addressLocality = data.at("//span[@itemprop = 'addressLocality']").children.text
addressRegion = data.at("//span[@itemprop = 'addressRegion']").children.text
addressCountry = data.at("//span[@itemprop = 'addressCountry']").children.text