将扫描的 (pdf,tiff,jpeg) 文件存储在 MongoDB 中。

storing a scanned (pdf,tiff,jpeg) file in MongoDB .

我必须在 mongodb 中存储一个 tiff(标签图像文件格式)或 pdf 扫描文件,该文件应该可以进行文本搜索。就像如果我们想搜索 "on base of text" 它应该能够搜索。

我打算将 .net mvc 或 java 与 mongodb 一起使用。

那么我如何存储这个 pdf 文件然后从数据库中检索。

如有任何建议,我们将不胜感激。

感谢

我认为你应该将文件保存在服务器的文件系统上以及文件的路径和文件中的字符串 MongoDB, 从服务器文件系统读取文件然后从 MongoDB.

加载文件效率更高

另一种选择是将文件保存为二进制数据,但这样您将无法在文件内部进行搜索。

您可以使用 MongoDb GridFs 存储文件,如 this question and extract texts from a PDF file by using some features those described in this question 中所述。 ;).

HTH