使用 phantomjs 获取 link 地址
Getting link address using phantomjs
我正在尝试获取此页面上每个 div 的文章网址:https://www.google.com/trends/home/all/IN
我能够获取图像 link 和标题,但是对于文章 link 它给出了
Traceback (most recent call last):
File "google.py", line 25, in getGooglerends
print s.find_elements_by_class_name('image-wrapper').get_attribute('href')
AttributeError: 'list' object has no attribute 'get_attribute'
代码:
driver = webdriver.PhantomJS('/usr/local/bin/phantomjs')
driver.set_window_size(1124, 850)
driver.get("https://www.google.com/trends/home/all/IN")
trend = {}
def getGooglerends():
try:
#Does this line makes any sense
#element = WebDriverWait(driver, 20).until(lambda driver: driver.find_elements_by_class_name('md-list-block ng-scope'))
for s in driver.find_elements_by_class_name('md-list-item-block'):
print s.find_element_by_tag_name('img').get_attribute('src')
print s.find_element_by_tag_name('img').get_attribute('alt')
print s.find_elements_by_class_name('image-wrapper').get_attribute('href')
except:
import traceback
print traceback.format_exc()
getGooglerends()
关于从锚标记获取文章 link 的任何建议?
WebDriver.find_elements_by_class_name
returns 元素列表,而不是单个元素。
s.find_elements_by_class_name('image-wrapper')
^
使用WebDriver.find_element_by_class_name
代替WebDriver.find_elements_by_class_name
。
s.find_element_by_class_name('image-wrapper')
我正在尝试获取此页面上每个 div 的文章网址:https://www.google.com/trends/home/all/IN 我能够获取图像 link 和标题,但是对于文章 link 它给出了
Traceback (most recent call last):
File "google.py", line 25, in getGooglerends
print s.find_elements_by_class_name('image-wrapper').get_attribute('href')
AttributeError: 'list' object has no attribute 'get_attribute'
代码:
driver = webdriver.PhantomJS('/usr/local/bin/phantomjs')
driver.set_window_size(1124, 850)
driver.get("https://www.google.com/trends/home/all/IN")
trend = {}
def getGooglerends():
try:
#Does this line makes any sense
#element = WebDriverWait(driver, 20).until(lambda driver: driver.find_elements_by_class_name('md-list-block ng-scope'))
for s in driver.find_elements_by_class_name('md-list-item-block'):
print s.find_element_by_tag_name('img').get_attribute('src')
print s.find_element_by_tag_name('img').get_attribute('alt')
print s.find_elements_by_class_name('image-wrapper').get_attribute('href')
except:
import traceback
print traceback.format_exc()
getGooglerends()
关于从锚标记获取文章 link 的任何建议?
WebDriver.find_elements_by_class_name
returns 元素列表,而不是单个元素。
s.find_elements_by_class_name('image-wrapper')
^
使用WebDriver.find_element_by_class_name
代替WebDriver.find_elements_by_class_name
。
s.find_element_by_class_name('image-wrapper')