按内容比较大量图像

Comparing a large set of images by content

我是运行一个使用Flask(Python)的服务器,允许用户上传图片。 (最终图像将被发送到 S3 存储桶;目前,它们只是保存到磁盘。)但是,我想防止重复和相似的图像。

这意味着每次用户尝试上传图像时,我都必须搜索数据库(以类似于 tineye 的方式)。如果存在类似的结果,应用程序将不会上传图像。这种类型的 "reverse image search" 仅使用 Python 图像库是否可行?是否有其他 Python 框架已用于完成类似任务?或者亚马逊工具?

使用图像库创建一个独特的指纹 images.If 新图像对照指纹进行检查并做出适当的决定。

指纹识别参考这个 https://realpython.com/blog/python/fingerprinting-images-for-near-duplicate-detection/

如果你想把AI带到这里, 留意自动编码器。