MongoDB GridFS

 
GridFS 是 MongoDB 的一种规范,用于存储和检索大型文件,如图像、音频、视频等。GridFS 也是一种存储文件的文件系统,但其数据是存储在 MongoDB 集合中的,GridFS 甚至可以存储超过 16MB 的文件。在存储文件时 GridFS 可以将一个文件分为多个数据块,并将每个数据块存储在一个单独的文档中,每个文档最大为 255KB。

默认情况下,GridFS 使用 fs.files 和 fs.chunks 两个集合来存储文件的元数据和块。每个区块都由其唯一的 ObjectId(_id)字段标识。fs.files 用作父文档,fs.chunks 文档中的 files_id 字段将块链接到其父级。

下面展示了一个简单的 fs.files 集合文档:
{
    "filename": "test.txt",
    "chunkSize": NumberInt(261120),
    "uploadDate": ISODate("2014-04-13T11:32:33.557Z"),
    "md5": "7b762939321e146569b07f72c62cca4f",
    "length": NumberInt(646)
}
该文档指定了文件的文件名、块大小、上传日期和长度。下面展示了一个简单的 fs.chunks 集合文档:
{
    "files_id": ObjectId("534a75d19f54bfec8a2fe44b"),
    "n": NumberInt(0),
    "data": "Mongo Binary Data"
}

将文件添加到 GridFS

想要将文件添加到 GridFS 中,可以使用 put 命令。下面的示例中演示了使用 put 命令在 GridFS 中存储 mp3 文件的过程。在存储文件时我们需要使用 mongofiles.exe,它在 MongoDB 安装目录下的 bin 目录中。

打开命令行工具,跳转到 mongofiles.exe 所在的目录并输入以下代码:

C:\Users\79330>mongofiles.exe -d gridfs put F:/code/music/song.mp3
2021-03-09T09:38:22.271+0800    connected to: localhost
2021-03-09T09:38:22.333+0800    added file: F:/code/music/song.mp3

提示:若已经将 MongoDB 安装目录下的 bin 目录添加到了 Path 环境变量中,则可以省略跳转到 bin 目录的步骤,直接在命令行工具中输入以上命令即可。

上面命令中 gridfs 为要存储文件的数据库名称,如果数据库不存在,那么 MongoDB 会自动创建;F:/code/music/song.mp3 为要存储文件的路径以及名称。

若要查看我们上面保存在数据库中的文档,可以使用 find() 命令:
> db.fs.files.find().pretty()
{
        "_id" : ObjectId("6046d18e01ef664194f5a78c"),
        "chunkSize" : 261120,
        "uploadDate" : ISODate("2021-03-09T01:38:22.341Z"),
        "length" : 4148442,
        "md5" : "cc3495f49ece8212906ef5c59e7440f0",
        "filename" : "F:/code/music/song.mp3"
}
我们还可以通过上面查询中返回的文档 ID 来查看 fs.chunks 集合中与存储文件相关的所有数据:
> db.fs.chunks.find({files_id:ObjectId('6046d18e01ef664194f5a78c')})
上面的查询返回了 15 个文档的数据,这意味着前面我们存储的 song.mp3 文件被存储到了 15 个区块中。