gulp源码解析—— vinyl-fs

Posted VaJoy技术博客

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了gulp源码解析—— vinyl-fs相关的知识,希望对你有一定的参考价值。

上一篇文章我们对 Stream 的特性及其接口进行了介绍,gulp 之所以在性能上好于 grunt,主要是因为有了 Stream 助力来做数据的传输和处理。

那么我们不难猜想出,在 gulp 的任务中,gulp.src 接口将匹配到的文件转化为可读(或 Duplex/Transform)流,通过 .pipe 流经各插件进行处理,最终推送给 gulp.dest 所生成的可写(或 Duplex/Transform)流并生成文件。

本文将追踪 gulp(v4.0)的源码,对上述猜想进行验证。

为了分析源码,我们打开 gulp 仓库下的入口文件 index.js,可以很直观地发现,几个主要的 API 都是直接引用 vinyl-fs 模块上暴露的接口的:

var util = require(\'util\');
var Undertaker = require(\'undertaker\');
var vfs = require(\'vinyl-fs\');
var watch = require(\'glob-watcher\');

//略...

Gulp.prototype.src = vfs.src;
Gulp.prototype.dest = vfs.dest;
Gulp.prototype.symlink = vfs.symlink;

//略...

因此了解 vinyl-fs 模块的作用,便成为掌握 gulp 工作原理的关键之一。需要留意的是,当前 gulp4.0 所使用的 vinyl-fs 版本是 v2.0.0

vinyl-fs 其实是在 vinyl 模块的基础上做了进一步的封装,在这里先对它们做个介绍:

一. Vinyl

Vinyl 可以看做一个文件描述器,通过它可以轻松构建单个文件的元数据(metadata object)描述对象。依旧是来个例子简洁明了:

//ch2-demom1
var Vinyl = require(\'vinyl\');

var jsFile = new Vinyl({
    cwd: \'/\',
    base: \'/test/\',
    path: \'/test/file.js\',
    contents: new Buffer(\'abc\')
});

var emptyFile = new Vinyl();

console.dir(jsFile);
console.dir(emptyFile);

上述代码会打印两个File文件对象:

简而言之,Vinyl 可以创建一个文件描述对象,通过接口可以取得该文件所对应的数据(Buffer类型)、cwd路径、文件名等等:

//ch2-demo2
var Vinyl = require(\'vinyl\');

var file = new Vinyl({
    cwd: \'/\',
    base: \'/test/\',
    path: \'/test/newFile.txt\',
    contents: new Buffer(\'abc\')
});


console.log(file.contents.toString());
console.log(\'path is: \' + file.path);
console.log(\'basename is: \' + file.basename);
console.log(\'filename without suffix: \' + file.stem);
console.log(\'file extname is: \' + file.extname);

打印结果:

更全面的 API 请参考官方描述文档,这里也对 vinyl 的源码贴上解析注释:

var path = require(\'path\');
var clone = require(\'clone\');
var cloneStats = require(\'clone-stats\');
var cloneBuffer = require(\'./lib/cloneBuffer\');
var isBuffer = require(\'./lib/isBuffer\');
var isStream = require(\'./lib/isStream\');
var isNull = require(\'./lib/isNull\');
var inspectStream = require(\'./lib/inspectStream\');
var Stream = require(\'stream\');
var replaceExt = require(\'replace-ext\');

//构造函数
function File(file) {
    if (!file) file = {};

    //-------------配置项缺省设置
    // history是一个数组,用于记录 path 的变化
    var history = file.path ? [file.path] : file.history;
    this.history = history || [];

    this.cwd = file.cwd || process.cwd();
    this.base = file.base || this.cwd;

    // 文件stat,它其实就是 require(\'fs\').Stats 对象
    this.stat = file.stat || null;

    // 文件内容(这里其实只允许格式为 stream 或 buffer 的传入)
    this.contents = file.contents || null;

    this._isVinyl = true;

}

//判断是否 this.contents 是否 Buffer 类型
File.prototype.isBuffer = function() {
    //直接用 require(\'buffer\').Buffer.isBuffer(this.contents) 做判断
    return isBuffer(this.contents);
};

//判断是否 this.contents 是否 Stream 类型
File.prototype.isStream = function() {
    //使用 this.contents instanceof Stream 做判断
    return isStream(this.contents);
};

//判断是否 this.contents 是否 null 类型(例如当file为文件夹路径时)
File.prototype.isNull = function() {
    return isNull(this.contents);
};

//通过文件 stat 判断是否为文件夹
File.prototype.isDirectory = function() {
    return this.isNull() && this.stat && this.stat.isDirectory();
};

//克隆对象,opt.deep 决定是否深拷贝
File.prototype.clone = function(opt) {
    if (typeof opt === \'boolean\') {
        opt = {
            deep: opt,
            contents: true
        };
    } else if (!opt) {
        opt = {
            deep: true,
            contents: true
        };
    } else {
        opt.deep = opt.deep === true;
        opt.contents = opt.contents !== false;
    }

    // 先克隆文件的 contents
    var contents;
    if (this.isStream()) {  //文件内容为Stream
        //Stream.PassThrough 接口是 Transform 流的一个简单实现,将输入的字节简单地传递给输出
        contents = this.contents.pipe(new Stream.PassThrough());
        this.contents = this.contents.pipe(new Stream.PassThrough());
    } else if (this.isBuffer()) {  //文件内容为Buffer
        /** cloneBuffer 里是通过
         * var buf = this.contents;
         * var out = new Buffer(buf.length);
         * buf.copy(out);
         * 的形式来克隆 Buffer
        **/
        contents = opt.contents ? cloneBuffer(this.contents) : this.contents;
    }

    //克隆文件实例对象
    var file = new File({
        cwd: this.cwd,
        base: this.base,
        stat: (this.stat ? cloneStats(this.stat) : null),
        history: this.history.slice(),
        contents: contents
    });

    // 克隆自定义属性
    Object.keys(this).forEach(function(key) {
        // ignore built-in fields
        if (key === \'_contents\' || key === \'stat\' ||
            key === \'history\' || key === \'path\' ||
            key === \'base\' || key === \'cwd\') {
            return;
        }
        file[key] = opt.deep ? clone(this[key], true) : this[key];
    }, this);
    return file;
};

/**
 * pipe原型接口定义
 * 用于将 file.contents 写入流(即参数stream)中;
 * opt.end 用于决定是否关闭 stream
 */
File.prototype.pipe = function(stream, opt) {
    if (!opt) opt = {};
    if (typeof opt.end === \'undefined\') opt.end = true;

    if (this.isStream()) {
        return this.contents.pipe(stream, opt);
    }
    if (this.isBuffer()) {
        if (opt.end) {
            stream.end(this.contents);
        } else {
            stream.write(this.contents);
        }
        return stream;
    }

    // file.contents 为 Null 的情况不往stream注入内容
    if (opt.end) stream.end();
    return stream;
};

/**
 * inspect原型接口定义
 * 用于打印出一条与文件内容相关的字符串(常用于调试打印)
 * 该方法可忽略
 */
File.prototype.inspect = function() {
    var inspect = [];

    // use relative path if possible
    var filePath = (this.base && this.path) ? this.relative : this.path;

    if (filePath) {
        inspect.push(\'"\'+filePath+\'"\');
    }

    if (this.isBuffer()) {
        inspect.push(this.contents.inspect());
    }

    if (this.isStream()) {
        //inspectStream模块里有个有趣的写法——判断是否纯Stream对象,先判断是否Stream实例,
        //再判断 this.contents.constructor.name 是否等于\'Stream\'
        inspect.push(inspectStream(this.contents));
    }

    return \'<File \'+inspect.join(\' \')+\'>\';
};

/**
 * 静态方法,用于判断文件是否Vinyl对象
 */
File.isVinyl = function(file) {
    return file && file._isVinyl === true;
};

// 定义原型属性 .contents 的 get/set 方法
Object.defineProperty(File.prototype, \'contents\', {
    get: function() {
        return this._contents;
    },
    set: function(val) {
        //只允许写入类型为 Buffer/Stream/Null 的数据,不然报错
        if (!isBuffer(val) && !isStream(val) && !isNull(val)) {
            throw new Error(\'File.contents can only be a Buffer, a Stream, or null.\');
        }
        this._contents = val;
    }
});

// 定义原型属性 .relative 的 get/set 方法(该方法几乎不使用,可忽略)
Object.defineProperty(File.prototype, \'relative\', {
    get: function() {
        if (!this.base) throw new Error(\'No base specified! Can not get relative.\');
        if (!this.path) throw new Error(\'No path specified! Can not get relative.\');
        //返回 this.path 和 this.base 的相对路径
        return path.relative(this.base, this.path);
    },
    set: function() {
        //不允许手动设置
        throw new Error(\'File.relative is generated from the base and path attributes. Do not modify it.\');
    }
});

// 定义原型属性 .dirname 的 get/set 方法,用于获取/设置指定path文件的文件夹路径。
// 要求初始化时必须指定 path <或history>
Object.defineProperty(File.prototype, \'dirname\', {
    get: function() {
        if (!this.path) throw new Error(\'No path specified! Can not get dirname.\');
        return path.dirname(this.path);
    },
    set: function(dirname) {
        if (!this.path) throw new Error(\'No path specified! Can not set dirname.\');
        this.path = path.join(dirname, path.basename(this.path));
    }
});

// 定义原型属性 .basename 的 get/set 方法,用于获取/设置指定path路径的最后一部分。
// 要求初始化时必须指定 path <或history>
Object.defineProperty(File.prototype, \'basename\', {
    get: function() {
        if (!this.path) throw new Error(\'No path specified! Can not get basename.\');
        return path.basename(this.path);
    },
    set: function(basename) {
        if (!this.path) throw new Error(\'No path specified! Can not set basename.\');
        this.path = path.join(path.dirname(this.path), basename);
    }
});

// 定义原型属性 .extname 的 get/set 方法,用于获取/设置指定path的文件扩展名。
// 要求初始化时必须指定 path <或history>
Object.defineProperty(File.prototype, \'extname\', {
    get: function() {
        if (!this.path) throw new Error(\'No path specified! Can not get extname.\');
        return path.extname(this.path);
    },
    set: function(extname) {
        if (!this.path) throw new Error(\'No path specified! Can not set extname.\');
        this.path = replaceExt(this.path, extname);
    }
});

// 定义原型属性 .path 的 get/set 方法,用于获取/设置指定path。
Object.defineProperty(File.prototype, \'path\', {
    get: function() {
        //直接从history出栈
        return this.history[this.history.length - 1];
    },
    set: function(path) {
        if (typeof path !== \'string\') throw new Error(\'path should be string\');

        // 压入history栈中
        if (path && path !== this.path) {
            this.history.push(path);
        }
    }
});

module.exports = File;
View Code

二. Vinyl-fs

Vinyl 虽然可以很方便地来描述一个文件、设置或获取文件的内容,但还没能便捷地与文件系统进行接入。

我的意思是,我们希望可以使用通配符的形式来简单地匹配到咱想要的文件,把它们转为可以处理的 Streams,做一番加工后,再把这些 Streams 转换为处理完的文件。

Vinyl-fs 就是实现这种需求的一个 Vinyl 适配器,我们看看它的用法:

var map = require(\'map-stream\');
var fs = require(\'vinyl-fs\');

var log = function(file, cb) {
  console.log(file.path);
  cb(null, file);
};

fs.src([\'./js/**/*.js\', \'!./js/vendor/*.js\'])
  .pipe(map(log))
  .pipe(fs.dest(\'./output\'));

如上方代码所示,Vinyl-fs 的 .src 接口可以匹配一个通配符,将匹配到的文件转为 Vinyl Stream,而 .dest 接口又能消费这个 Stream,并生成对应文件。

这里需要先补充一个概念 —— .src 接口所传入的“通配符”有个专有术语,叫做 GLOB,我们先来聊聊 GLOB。

GLOB 可以理解为我们给 gulp.src 等接口传入的第一个 pattern 参数的形式,例如“./js/**/*.js”,另外百度百科的“glob模式”描述是这样的:

所谓的 GLOB 模式是指 shell 所使用的简化了的正则表达式:
⑴ 星号(*)匹配零个或多个任意字符;
⑵ [abc]匹配任何一个列在方括号中的字符(这个例子要么匹配一个 a,要么匹配一个 b,要么匹配一个 c);
⑶ 问号(?)只匹配一个任意字符;
⑷ 如果在方括号中使用短划线分隔两个字符,表示所有在这两个字符范围内的都可以匹配(比如 [0-9] 表示匹配所有 0 到 9 的数字)。

在 vinyl-fs 中,是使用 glob-stream <v5.0.0>通过算法minimatch来解析 GLOB 的,它会拿符合上述 GLOB 模式规范的 pattern 参数去匹配相应的文件,:

var gs = require(\'glob-stream\');

var stream = gs.create(\'./files/**/*.coffee\', {options});

stream.on(\'data\', function(file){
  // file has path, base, and cwd attrs
});

而 glob-stream 又是借助了 node-glob 来匹配文件列表的:

//ch2-demo3
var Glob = require("glob").Glob;
var path = require(\'path\');

var pattern = path.join(__dirname, \'/*.txt\');
var globber = new Glob(pattern, function(err, matches){
    console.log(matches)
});
globber.on(\'match\', function(filename) {
    console.log(\'matches file: \' + filename)
});

打印结果:

这里也贴下 glob-stream 的执行流程和源码注解:

\'use strict\';

var through2 = require(\'through2\');
var Combine = require(\'ordered-read-streams\');
var unique = require(\'unique-stream\');

var glob = require(\'glob\');
var micromatch = require(\'micromatch\');
var resolveGlob = require(\'to-absolute-glob\');
var globParent = require(\'glob-parent\');
var path = require(\'path\');
var extend = require(\'extend\');

var gs = {
    // 为单个 glob 创建流
    createStream: function(ourGlob, negatives, opt) {

        // 使用 path.resolve 将 golb 转为绝对路径(加上 cwd 前缀)
        ourGlob = resolveGlob(ourGlob, opt);
        var ourOpt = extend({}, opt);
        delete ourOpt.root;

        // 通过 glob pattern 生成一个 Glob 对象(属于一个事件发射器<EventEmitter>)
        var globber = new glob.Glob(ourGlob, ourOpt);

        // 抽取出 glob 的根路径
        var basePath = opt.base || globParent(ourGlob) + path.sep;

        // Create stream and map events from globber to it
        var stream = through2.obj(opt,
            negatives.length ? filterNegatives : undefined);

        var found = false;

        //Glob 对象开始注册事件
        globber.on(\'error\', stream.emit.bind(stream, \'error\'));
        globber.once(\'end\', function() {
            if (opt.allowEmpty !== true && !found && globIsSingular(globber)) {
                stream.emit(\'error\',
                    new Error(\'File not found with singular glob: \' + ourGlob));
            }

            stream.end();
        });

        //注册匹配到文件时的事件回调
        globber.on(\'match\', function(filename) {
            //标记已匹配到文件(filename 为文件路径)
            found = true;
            //写入流(触发 stream 的 _transform 内置方法)
            stream.write({
                cwd: opt.cwd,
                base: basePath,
                path: path.normalize(filename)
            });
        });

        return stream;

        //定义 _transform 方法,过滤掉排除模式所排除的文件
        function filterNegatives(filename, enc, cb) {
            //filename 是匹配到的文件对象
            var matcha = isMatch.bind(null, filename);
            if (negatives.every(matcha)) {
                cb(null, filename); //把匹配到的文件推送入缓存(供下游消费)
            } else {
                cb(); // 忽略
            }
        }
    },

    // 为多个globs创建流
    create: function(globs, opt) {
        //预设参数处理
        if (!opt) {
            opt = {};
        }
        if (typeof opt.cwd !== \'string\') {
            opt.cwd = process.cwd();
        }
        if (typeof opt.dot !== \'boolean\') {
            opt.dot = false;
        }
        if (typeof opt.silent !== \'boolean\') {
            opt.silent = true;
        }
        if (typeof opt.nonull !== \'boolean\') {
            opt.nonull = false;
        }
        if (typeof opt.cwdbase !== \'boolean\') {
            opt.cwdbase = false;
        }
        if (opt.cwdbase) {
            opt.base = opt.cwd;
        }

        //如果 glob(第一个参数)非数组,那么把它转为 [glob],方便后续调用 forEach 方法
        if (!Array.isArray(globs)) {
            globs = [globs];
        }

        var positives = [];
        var negatives = [];

        var ourOpt = extend({}, opt);
        delete ourOpt.root;

        //遍历传入的 glob
        globs.forEach(function(glob, index) {
            //验证 glob 是否有效
            if (typeof glob !== \'string\' && !(glob instanceof RegExp)) {
                throw new Error(\'Invalid glob at index \' + index);
            }

            //是否排除模式(如“!b*.js”)
            var globArray = isNegative(glob) ? negatives : positives;

            // 排除模式的 glob 初步处理
            if (globArray === negatives && typeof glob === \'string\') {
                // 使用 path.resolve 将 golb 转为绝对路径(加上 cwd 前缀)
                var ourGlob = resolveGlob(glob, opt);
                //micromatch.matcher(ourGlob, ourOpt) 返回了一个方法,可传入文件路径作为参数,来判断是否匹配该排除模式的 glob(即返回Boolean)
                glob = micromatch.matcher(ourGlob, ourOpt);
            }

            globArray.push({
                index: index,
                glob: glob
            });
        });

        //globs必须最少有一个匹配模式(即非排除模式)的glob,否则报错
        if (positives.length === 0) {
            throw new Error(\'Missing positive glob\');
        }

        // 只有一条匹配模式,直接生成流并返回
        if (positives.length === 1) {
            return streamFromPositive(positives[0]);
        }

        // 创建 positives.length 个独立的流(数组)
        var streams = positives.map(streamFromPositive);

        // 这里使用了 ordered-read-streams 模块将一个数组的 Streams 合并为单个 Stream
        var aggregate = new Combine(streams);
        //对合成的 Stream 进行去重处理(以“path”属性为指标)
        var uniqueStream = unique(\'path\');
        var returnStream = aggregate.pipe(uniqueStream);

        aggregate.on(\'error\', function(err) {
            returnStream.emit(\'error\', err);
        });

        return returnStream;

        //返回最终匹配完毕(去除了排除模式globs的文件)的文件流
        function streamFromPositive(positive) {
            var negativeGlobs = negatives.filter(indexGreaterThan(positive.index))  //过滤,排除模式的glob必须排在匹配模式的glob后面
                .map(toGlob); //返回该匹配模式glob后面的全部排除模式globs(数组形式)
            return gs.createStream(positive.glob, negativeGlobs, opt);
        }
    }
};

function isMatch(file, matcher) {
    //matcher 即单个排除模式的 glob 方法(可传入文件路径作为参数,来判断是否匹配该排除模式的 glob)
    //此举是拿匹配到的文件(file)和排除模式GLOP规则做匹配,若相符(如“a/b.txt”匹配“!a/c.txt”)则为true
    if (typeof matcher === \'function\') {
        return matcher(file.path);
    }
    if (matcher instanceof RegExp) {
        return matcher.test(file.path);
    }
}

function isNegative(pattern) {
    if (typeof pattern === \'string\') {
        return pattern[0] === \'!\';
    }
    if (pattern instanceof RegExp) {
        return true;
    }
}

function indexGreaterThan(index) {
    return function(obj) {
        return obj.index > index;
    };
}

function toGlob(obj) {
    return obj.glob;
}

function globIsSingular(glob) {
    var globSet = glob.minimatch.set;

    if (globSet.length !== 1) {
        return false;
    }

    return globSet[0].every(function isString(value) {
        return typeof value === \'string\';
    });
}

module.exports = gs;
View Code

留意通过 glob-stream 创建的流中,所写入的数据:

    stream.write({
        cwd: opt.cwd,
        base: basePath,
        path: path.normalize(filename)
    });

是不像极了 Vinyl 创建文件对象时可传入的配置。

我们回过头来专注 vinyl-fs 的源码,其入口文件如下:

\'use strict\';

module.exports = {
  src: require(\'./lib/src\'),
  dest: require(\'./lib/dest\'),
  symlink: require(\'./lib/symlink\')
};

下面分别对这三个对外接口(也直接就是 gulp 的对应接口)进行分析。

2.1 gulp.src

该接口文件为 lib/src/index.js,代码量不多,但引用的模块不少。

主要功能是使用 glob-stream 匹配 GLOB 并创建 glob 流,通过 through2 写入 Object Mode 的 Stream 去,把数据初步加工为 Vinyl 对象,再按照预设项进行进一步加工处理,最终返回输出流:

代码主体部分如下:

function createFile(globFile, enc, cb) {
    //通过传入 globFile 来创建一个 vinyl 文件对象
    //并赋予 cb 回调(这个回调一看就是 transform stream 的格式,将vinyl 文件对象注入流中)
    cb(null, new File(globFile));
}

function src(glob, opt) {
    // 配置项初始化
    var options = assign({
        read: true,
        buffer: true,
        sourcemaps: false,
        passthrough: false,
        followSymlinks: true
    }, opt);

    var inputPass;

    // 判断是否有效的 glob pattern
    if (!isValidGlob(glob)) {
        throw new Error(\'Invalid glob argument: \' + glob);
    }

    // 通过 glob-stream 创建匹配到的 globStream
    var globStream = gs.create(glob, options);

    //加工处理生成输出流
    var outputStream = globStream
        //globFile.path 为 symlink的情况下,转为硬链接
        .pipe(resolveSymlinks(options))
        //创建 vinyl 文件对象供下游处理
        .pipe(through.obj(createFile));

    // since 可赋与一个 Date 或 number,来要求指定某时间点后修改过的文件
    if (options.since != null) {
        outputStream = outputStream
            // 通过 through2-filter 检测 file.stat.mtime 来过滤
            .pipe(filterSince(options.since));
    }

    // read 选项默认为 true,表示允许文件内容可读(为 false 时不可读 且将无法通过 .dest 方法写入硬盘)
    if (options.read !== false) {
        outputStream = outputStream
            //获取文件内容,写入file.contents 属性去。
            //预设为 Buffer 时通过 fs.readFile 接口获取
            //否则

以上是关于gulp源码解析—— vinyl-fs的主要内容,如果未能解决你的问题,请参考以下文章

gulp中pipe的作用和来源

gulp源码解析—— Stream详解

node升级7.0以上版本使用gulp时报错

nodejs vinyl-fs 处理文件时输入问题

gulp-eslint 无法解析可选链接语法

gulp常用插件之gulp-sourcemaps使用