检测是否请求 PDF 文件

detect if requests to PDF files

我想检测对 PDF 文件的请求是否来自机器人。我们在网站上有 PDF 文件,并使用插入数据库记录 PDF 文件的流量以进行报告。我们存储 HTTP_USER_AGENT、HTTP_SESSION 和 LogDate。从数据库来看,这看起来像是来自机器人,但我不确定如何检测?

Is there a way to detect if request are bot vs users?

    04:08:07.680    1.pdf   87f6fdb7-c1a9-4d9d-876f-e800d0fe619a    SameIPAddress   192.168.3.201   Mozilla/5.0 (compatible; MSIE 7.0; Windows) 2020-01-02
    04:08:11.213    2.pdf   87b18096-dc95-4ab4-a67d-22c08fdb22af    SameIPAddress   192.168.3.201   Mozilla/5.0 (compatible; MSIE 7.0; Windows) 2020-01-02
    04:08:12.493    3.pdf   55cd5c40-c167-4059-971f-b6aec54a1673    SameIPAddress   192.168.3.201   Mozilla/5.0 (compatible; MSIE 7.0; Windows) 2020-01-02
    04:08:14.903    4.pdf   49001c85-3a4d-47dc-8632-fb681cb26d2a    SameIPAddress   192.168.3.201   Mozilla/5.0 (compatible; MSIE 7.0; Windows) 2020-01-02
    04:08:15.293    5.pdf   a7fe9350-7470-48b3-ad12-7f7dd61c1896    SameIPAddress   192.168.3.201   Mozilla/5.0 (compatible; MSIE 7.0; Windows)

您可以使用用户代理信息或 IP 地址 - 安全地假设在几毫秒内从同一 IP 多次点击是机器人,但理想的做法是在将信息存储在数据库。像验证码或其他验证。

更多信息在这里:

https://security.stackexchange.com/questions/51091/how-to-detect-bots-clicking-a-link