如何查看 html 是否改变了?
How to check whether the html has changed?
抱歉,如果那是错误的地方,但不知道去哪里问。
我们正在构建适用于选定网站的 Firefox 插件。现在,因为那些网站往往会偶尔更改一次,我想每天 运行 一个 javascript 脚本来检查代码的特定部分是否已更改,如果已更改,我们会收到一些 return 消息(最好直接发送到我的电子邮件)。
最简单、最简单的方法是什么?我读过有关 webcrawlers、webscrapers 的文章,但他们所做的似乎远远超出了我们的需要。我们基本上想 运行 从我们连接到互联网的 PC 上一个小脚本,它会进行简单的检查,并在 html body 的特定部分发生更改后立即向我们发送电子邮件检测到(或更具体地说 - 未找到所选元素)。
非常感谢任何帮助
基本上,您可以设置 Google 电子表格以使用 xpath 通过 IMPORTXML function (here with an example) 抓取页面的各个部分。然后在电子表格中设置通知:工具 -> 通知规则
现在每次抓取功能 (IMPORTXML) 获取与之前不同的内容时,电子表格都会触发一封邮件给您。
作为现成的替代方案,我也可能会推荐 some tools 跟踪页面的 and/or 它们的部分(!)更改,包括通过电子邮件通知。
抱歉,如果那是错误的地方,但不知道去哪里问。
我们正在构建适用于选定网站的 Firefox 插件。现在,因为那些网站往往会偶尔更改一次,我想每天 运行 一个 javascript 脚本来检查代码的特定部分是否已更改,如果已更改,我们会收到一些 return 消息(最好直接发送到我的电子邮件)。
最简单、最简单的方法是什么?我读过有关 webcrawlers、webscrapers 的文章,但他们所做的似乎远远超出了我们的需要。我们基本上想 运行 从我们连接到互联网的 PC 上一个小脚本,它会进行简单的检查,并在 html body 的特定部分发生更改后立即向我们发送电子邮件检测到(或更具体地说 - 未找到所选元素)。
非常感谢任何帮助
基本上,您可以设置 Google 电子表格以使用 xpath 通过 IMPORTXML function (here with an example) 抓取页面的各个部分。然后在电子表格中设置通知:工具 -> 通知规则
现在每次抓取功能 (IMPORTXML) 获取与之前不同的内容时,电子表格都会触发一封邮件给您。
作为现成的替代方案,我也可能会推荐 some tools 跟踪页面的 and/or 它们的部分(!)更改,包括通过电子邮件通知。