lodash源码分析之缓存方式的选择

Posted FE前端专栏

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了lodash源码分析之缓存方式的选择相关的知识,希望对你有一定的参考价值。

每个人心里都有一团火,路过的人只看到烟。

——《至爱梵高·星空之谜》

本文为读 lodash 源码的第八篇,后续文章会更新到这个仓库中,欢迎 star:pocket-lodash

前言

在《lodash源码分析之Hash缓存》和《lodash源码分析之List缓存》介绍了 lodash 的两种缓存方式,这两种缓存方式都实现了和 Map 一致的数据管理接口,其中 List 缓存只在不支持 Map 的环境中使用,那何时使用 Hash缓存,何时使用 Map 或者 List 缓存呢?这就是 MapCache 类所需要做的事情。

缓存方式的选择

从之前的分析可以看出, Hash 缓存完全可以用 List 缓存或者 Map 来代替,为什么 lodash 不干脆统一用一种缓存方式呢?

原因是在数据量较大时,对象的存取比 Map 或者数组的性能要好。

因此,ladash 在能够用 Hash 缓存时,都尽量使用 Hash 缓存,而能否使用 Hash 缓存的关键是 key 的类型。

以下便为 lodash 决定使用缓存方式的流程:

首先,判断 key 的类型,以是否为 string/number/symbol/boolean 类型为成两拨,如果是以上的类型,再判断 key 是否等于 __proto__ ,如果不是 __proto__ ,则使用 Hash 缓存。不能为 __proto__ 的原因是,大部分 JS 引擎都以这个属性来保存对象的原型。

如果不是以上的类型,则判断 key 是否为 null,如果为 null ,则依然使用 Hash 缓存,其余的则使用 Map或者 List 缓存。

从上面的流程图还可以看到,在可以用 Hash 来缓存的 key 中,还以是否为 string 类型分成了两个 Hash 对象来缓存数据,为什么要这样呢?

我们都知道,对象的 key 如果不是字符串或者 Symbol 类型时,会转换成字符串的形式,因此如果缓存的数据中同时存在像数字 1 和字符串 '1' 时,数据都会储存在字符串 '1' 上。这两个不同的键值,最后获取的都是同一份数据,这明显是不行的,因此需要将要字符串的 key 和其他需要转换类型的 key 分开两个 Hash 对象储存。

作用与用法

MapCache 所做的事情有点像函数重载,其调用方式和 HashMapListCache 一致。

 
   
   
 
  1. new MapCache([

  2.  ['key', 'value'],

  3.  [{key: 'An Object Key'}, 1],

  4.  [Symbol(),2]

  5. ])

所返回的结果如下:

 
   
   
 
  1. {

  2.  size: 3,

  3.  __data__: {

  4.    string: {

  5.      ...

  6.    },

  7.    hash: {

  8.      ...

  9.    },

  10.    map: {

  11.      ...  

  12.    }

  13.  }

  14. }

可以看到, __data__ 里根据 key 的类型分成了 stringhashmap 三种类型来储存数据。其中 stringhash 都是 Hash 的实例,而 map 则是 mapListCache 的实例。

接口设计

MapCache 同样实现了跟 Map 一致的数据管理接口,如下:

依赖

 
   
   
 
  1. import Hash from './Hash.js'

  2. import ListCache from './ListCache.js'

《lodash源码分析之Hash缓存》

《lodash源码分析之List缓存》

源码分析

 
   
   
 
  1. function getMapData({ __data__ }, key) {

  2.  const data = __data__

  3.  return isKeyable(key)

  4.    ? data[typeof key == 'string' ? 'string' : 'hash']

  5.    : data.map

  6. }

  7. function isKeyable(value) {

  8.  const type = typeof value

  9.  return (type == 'string' || type == 'number' || type == 'symbol' || type == 'boolean')

  10.    ? (value !== '__proto__')

  11.    : (value === null)

  12. }

  13. class MapCache {

  14.  constructor(entries) {

  15.    let index = -1

  16.    const length = entries == null ? 0 : entries.length

  17.    this.clear()

  18.    while (++index < length) {

  19.      const entry = entries[index]

  20.      this.set(entry[0], entry[1])

  21.    }

  22.  }

  23.  clear() {

  24.    this.size = 0

  25.    this.__data__ = {

  26.      'hash': new Hash,

  27.      'map': new (Map || ListCache),

  28.      'string': new Hash

  29.    }

  30.  }

  31.  delete(key) {

  32.    const result = getMapData(this, key)['delete'](key)

  33.    this.size -= result ? 1 : 0

  34.    return result

  35.  }

  36.  get(key) {

  37.    return getMapData(this, key).get(key)

  38.  }

  39.  has(key) {

  40.    return getMapData(this, key).has(key)

  41.  }

  42.  set(key, value) {

  43.    const data = getMapData(this, key)

  44.    const size = data.size

  45.    data.set(key, value)

  46.    this.size += data.size == size ? 0 : 1

  47.    return this

  48.  }

  49. }

是否使用Hash

 
   
   
 
  1. function isKeyable(value) {

  2.  const type = typeof value

  3.  return (type == 'string' || type == 'number' || type == 'symbol' || type == 'boolean')

  4.    ? (value !== '__proto__')

  5.  : (value === null)

  6. }

这个函数用来判断是否使用 Hash 缓存。返回 true 表示使用 Hash 缓存,返回 false 则使用 Map 或者 ListCache 缓存。

这个在流程图上已经解释过,不再作详细的解释。

获取对应缓存方式的实例

 
   
   
 
  1. function getMapData({ __data__ }, key) {

  2.  const data = __data__

  3.  return isKeyable(key)

  4.    ? data[typeof key == 'string' ? 'string' : 'hash']

  5.    : data.map

  6. }

这个函数根据 key 来获取储存了该 key 的缓存实例。

__data__ 即为 MapCache 实例中的 __data__ 属性的值。

如果使用的是 Hash 缓存,则类型为字符串时,返回 __data__ 中的 string 属性的值,否则返回 hash 属性的值。这两者都为 Hash 实例。

否则返回 map 属性的值,这个可能是 Map 实例或者 ListCache 实例。

constructor

 
   
   
 
  1. constructor(entries) {

  2.  let index = -1

  3.  const length = entries == null ? 0 : entries.length

  4.  this.clear()

  5.  while (++index < length) {

  6.    const entry = entries[index]

  7.    this.set(entry[0], entry[1])

  8.  }

  9. }

构造器跟 HashListCache 一模一样,都是先调用 clear 方法,然后调用 set 方法,往缓存中加入初始数据。

clear

 
   
   
 
  1. clear() {

  2.  this.size = 0

  3.  this.__data__ = {

  4.    'hash': new Hash,

  5.    'map': new (Map || ListCache),

  6.    'string': new Hash

  7.  }

  8. }

clear 是为了清空缓存。

这里值得注意的是 __data__ 属性,使用 hashstringmap 来保存不同类型的缓存数据,它们之间的区别上面已经论述清楚。

这里也可以清晰地看到,如果在支持 Map 的环境中,会优先使用 Map ,而不是 ListCache

has

 
   
   
 
  1. has(key) {

  2.  return getMapData(this, key).has(key)

  3. }

has 用来判断是否已经有缓存数据,如果缓存数据已经存在,则返回 true

这里调用了 getMapData 方法,获取到对应的缓存实例( HashMap 或者 ListCache 的实例),然后调用的是对应实例中的 has 方法。

set

 
   
   
 
  1. set(key, value) {

  2.  const data = getMapData(this, key)

  3.  const size = data.size

  4.  data.set(key, value)

  5.  this.size += data.size == size ? 0 : 1

  6.  return this

  7. }

set 用来增加或者更新需要缓存的值。 set 的时候需要同时维护 size 和缓存的值。

这里除了调用对应的缓存实例的 set 方法来维护缓存的值外,还需要维护自身的 size 属性,如果增加值,则加 1

get

 
   
   
 
  1. get(key) {

  2.  return getMapData(this, key).get(key)

  3. }

get 方法是从缓存中取值。

同样是调用对应的缓存实例中的 get 方法。

delete

 
   
   
 
  1. delete(key) {

  2.  const result = getMapData(this, key)['delete'](key)

  3.  this.size -= result ? 1 : 0

  4.  return result

  5. }

delete 方法用来删除指定 key 的缓存。成功删除返回 true, 否则返回 false。 删除操作同样需要维护 size属性。

同样是调用对应缓存实例中的 delete 方法,如果删除成功,则需要将自身的 size 的值减少 1

参考

License

署名-非商业性使用-禁止演绎 4.0 国际 (CC BY-NC-ND 4.0)


以上是关于lodash源码分析之缓存方式的选择的主要内容,如果未能解决你的问题,请参考以下文章

lodash源码分析之Hash缓存

Lodash 源码分析Array

lodash源码分析之去重--uniq方法

lodash源码分析之compact中的遍历

mybatis源码分析之05一级缓存

mybatis源码分析之06二级缓存