在NodeJS中将许多文件中的JSON对象插入MongoDB的最有效方法

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了在NodeJS中将许多文件中的JSON对象插入MongoDB的最有效方法相关的知识,希望对你有一定的参考价值。

我正在寻找将JSON对象从文件导入MongoDB集合的最有效方法。

文件看起来像这样:

[ { ... }, { ... } ]

每个文件大约有200个对象,有100个文件,总计20.000个对象。我尝试了很多方法,很多图书馆......

我目前的工作范例是:

const fs = require('fs');
const JSONStream = require('JSONStream');
const es = require('event-stream');
const MongoClient = require('mongodb').MongoClient;
const glob = require('glob');

const url = 'mongodb://localhost:27017/inventory';

console.time('import');

MongoClient.connect(url, function(err, database) {
    const db = database.db('inventory');
    const collection = db.collection('storage');

    let importer = [];

    glob('../data/*.json', function (error, files) {
        files.forEach(function (filename) {
            importer.push(new Promise(function (resolve) {
                fs.createReadStream(filename).pipe(JSONStream.parse('*')).pipe(es.map(function (document) {
                    collection.insertOne(document).then(resolve);
                }));
            }));
        });

        Promise.all(importer).then(function () {
            console.timeEnd('import');
        });
    });
});

在我的本地机器上平均需要20s(20074.834ms)。好吧,20多岁是好的,但我想改善这里的表现。

答案

以及这个代码没有完全优化,我不在这里做任何错误处理,但它假设减少插入的时间。(你的主要瓶颈)

const fs = require('fs');
const JSONStream = require('JSONStream');
const es = require('event-stream');
const MongoClient = require('mongodb').MongoClient;
const glob = require('glob');

const url = 'mongodb://localhost:27017/inventory';

console.time('import');

MongoClient.connect(url, function(err, database) {
    const db = database.db('inventory');
    const collection = db.collection('storage');

    let importer = [];

    glob('../data/*.json', function (error, files) {
        files.forEach(function (filename) {
            const documents = JSON.parse(fs.readFileSync(filename, 'utf8'));
            importer.push(collection.insertMany(documents),{w:0,ordered:false});
          });
        });

        Promise.all(importer).then(function () {
            console.timeEnd('import');
        });
    });
});

以上是关于在NodeJS中将许多文件中的JSON对象插入MongoDB的最有效方法的主要内容,如果未能解决你的问题,请参考以下文章

在 Nodejs 中解析大型 JSON 文件

如何在Nodejs中将json对象数组转换为String?

如何在Nodejs中将字符串作为读取流对象传递?

使用 MongoDB 和 Nodejs 插入和查询日期

在Nodejs中将流解析为对象

在 NodeJS 中将 200'000 行以上的大型 csv 文件插入 MongoDB