如何编写高质量的 JS 函数 --函数式编程[实战篇]

Posted 2020-11-29

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了如何编写高质量的 JS 函数 --函数式编程[实战篇]相关的知识，希望对你有一定的参考价值。

本文首发于 vivo互联网技术微信公众号?
链接：https://mp.weixin.qq.com/s/ZoXYbjuezOWgNyJKmSQmTw
作者：杨昆

?【编写高质量函数系列】，往期精彩内容:

《如何编写高质量的 JS 函数（1） -- 敲山震虎篇》介绍了函数的执行机制，此篇将会从函数的命名、注释和鲁棒性方面，阐述如何通过 javascript 编写高质量的函数。

?《如何编写高质量的 JS 函数（2）-- 命名/注释/鲁棒篇》从函数的命名、注释和鲁棒性方面，阐述如何通过 JavaScript编写高质量的函数。

《如何编写高质量的 JS 函数（3）-- 函数式编程[理论篇]》通过背景加提问的方式，对函数式编程的本质、目的、来龙去脉等方面进行一次清晰的阐述。

本文会从如何用函数式编程思想编写高质量的函数、分析源码里面的技巧，以及实际工作中如何编写，来展示如何打通你的任督二脉。话不多说，下面就开始实战吧。

技术图片

一、如何用函数式编程思想编写高质量的函数

这里我通过简单的 demo 来说明一些技巧。技巧点如下：

1、注意函数中变量的类型和变量的作用域

（1）如果是值类型 -- 组合函数/高阶性

这可能是一个硬编码，不够灵活性，你可能需要进行处理了，如何处理呢？比如通过传参来干掉值类型的变量，下面举一个简单的例子。

代码如下：

document.querySelector(‘#msg‘).innerhtml = ‘<h1>Hello World‘</h1>‘

我们来欣赏一下上面的代码：

第一：硬编码味道很重，代码都是写死的。

第二：扩展性很差，复用性很低，难道我要在其他地方进行 crtl c ctrl v 然后再手工改？

第三：如果在 document.querySelector(‘#msg‘)获取对象后，不想 innerHTML ，我想做一些其他的事情，怎么办？

OK ，下面我就先向大家展示一下，如何完全重构这段代码。这里我只写 JS 部分：

代码如下：// 使用到了组合函数，运用了函数的高阶性等

const compose = (...fns) => value => fns.reverse().reduce((acc, fn) => fn(acc), value)

const documentWrite = document.write.bind(document)
const createNode = function(text) {
  return ‘<h1>‘ + text + ‘</h1>‘
}
const setText = msg => msg

const printMessage = compose(
  documentWrite,
  createNode,
  setText
)

printMessage(‘hi~ godkun‘)

效果如图所示：

技术图片

完整代码我放在了下面两个地址上，小伙伴可自行查看。

codepen:?codepen.io/godkun/pen/…

gist：gist.github.com/godkun/772c…

注意事项一：

compose?函数的执行顺序是从右向左，也就是数据流是从右向左流，可以把

const printMessage = compose(
  documentWrite,
  createNode,
  setText
)

看成是下面这种形式：

documentWrite(createNode(setText(value)))

注意事项二：

在 linux 世界里，是遵循 pipe (管道) 的思想，也就是数据从左向右流，那怎么把上面的代码变成 pipe 的形式呢？

很简单，只需要把 const compose = (...fns) => value => fns.reverse().reduce((acc, fn) => fn(acc), value)?中的 reverse 去掉就好了，写成：

const compose = (...fns) => value => fns.reduce((acc, fn) => fn(acc), value)

总结

是不是发现通过用函数式编程进行重构后，这个代码变得非常的灵活，好处大致有如下：

函数被拆成了一个个具有单一功能的小函数
硬编码被干掉了，变得更加灵活
使用了组合函数、高阶函数来灵活的组合各个小函数
职责越单一，复用性会越好，这些小函数，我们都可以在其他地方，通过组合不同的小函数，来实现更多的功能。

思考题：这里我甩贴一张小伙伴在群里分享的图：

技术图片

这是我送个大家的礼物，大家可以尝试把上面图片的代码用函数式进行完全重构，加油。

（2）如果是引用类型 -- 等幂性/引用透明性/数据不可变

代码 demo 如下：

let arr = [1,3,2,4,5]
function fun(arr) {
  let result = arr.sort()
  console.log(‘result‘, result)
  console.log(‘arr‘, arr)
}
fun(arr)

结果如下图所示：

技术图片

看上面，你会发现数组 arr 被修改了。由于 fun(arr)?函数中的参数 arr 是引用类型，如果函数体内对此引用所指的数据进行直接操作的话，就会有潜在的副作用，比如原数组被修改了，这种情况下，该怎么办呢？

很简单，在函数体内对 arr 这个引用类型进行创建副本。如下面代码：

let arr = [1,3,2,4,5]
function fun(arr) {
  let arrNew = arr.slice()
  let result = arrNew.sort()
  console.log(‘result‘, result)
  console.log(‘arr‘, arr)
}

fun(arr)

通过 slice 来创建一个新的数组，然后对新的数组进行操作，这样就达到了消除副作用的目的。这里只是举一个例子，但是核心思想已经阐述出来了，体现了理论卷中的数据不可变的思想了。

如果函数体内引用变量的变化，会造成超出其作用域的影响，比如上面代码中对 arr 进行操作，影响到了数组 arr 本身。这时就需要思考一下，要不要采用不可变的思想，对引用类型进行处理。

（3）注意有没有明显的命令式编程 -- 声明式/抽象/封装

注意函数里面有没有大量的?for?循环

为什么说这个呢，因为这个很好判断。如果有的话，就要思考一下需不需要对 for 循环进行处理，下文有对 for 循环的专门介绍。

注意函数里面有没有过多的?if/else

也是一样的思想，过多的 if/else 也要根据情况去做相应的处理。

（4）将代码本身进行参数化 -- 声明式/抽象/封装

标题的意识其实可以这样理解，对函数进行高阶化处理。当把函数当成参数的时候，也就是把代码本身当成参数了。

什么情况下要考虑高阶化呢。

当优化到一定地步后，发现还是不够复用性，这时就要考虑将参数进行函数化，这样将参数变成可以提供更多功能的函数。

函数的高阶化，往往在其他功能上得以体现，比如柯里化，组合。

（5）将大函数变成可组合的小函数

通过上面例子的分析，我也向大家展示了如何将函数最小化。通过将大函数拆成多个具有单一职责的小函数，来提高复用性和灵活性。

2、函数式编程的注意点

函数式编程?不是万能的，大家不要认为它很完美，它也有自己的缺点，如下两点：

（1）注意性能

进行?函数式编程?时, 如果使用不恰当，会造成性能问题。比如递归用的不恰当，比如柯里化嵌套的过多。

（2）注意可读性

在进行函数式编程时，不要过度的抽象，过度的抽象会导致可读性变差。

二、源码中的学习

1、看一下 Ramda.js 的源码

说到函数式编程，那一定要看看 Ramda.js 的源码。Ramda.js 的源码搞懂后，函数式编程的思想也就基本没什么问题了。

关于 Ramda.js 可以看一下阮大的博客：

Ramda 函数库参考教程

看完了，那开始执行：

git clone git@github.com:ramda/ramda.git

然后我们来分析源码，首先按照常规套路，看一下 source/index.js 文件。

如图所示：

技术图片

继续分析，看一下 add.js。

import _curry2 from ‘./internal/_curry2‘;
var add = _curry2(function add(a, b) {
  return Number(a) + Number(b);
});
export default add;

看上面代码，我们发现，add 函数被包了一个?_curry2 函数。下划线代表这是一个内部方法，不暴露成 API 。这时，再看其他函数，会发现都被包了一个?_curry1/2/3/N 函数。

如下图所示：

技术图片

从代码中可以知道，1/2/3/N 代表掉参数个数为 1/2/3/N 的函数的柯里化，而且会发现，所有的 ramda 函数都是经过柯里化的。

为什么 ramda.js 要对函数全部柯里化？

我们看一下普通的函数 f(a, b, c)?。如果只在调用的时候，传递 a 。会发现，JS 在运行调用时，会将 b 和 c 设置为 undefined 。

从上面可以知道，JS 语言不能原生支持柯里化。非柯里化函数会导致缺少参数的实参变成 undefined 。ramda.js 对函数全部柯里化的目的，就是为了优化上面的场景。

下面，我们看一下?_curry2 代码，这里为了可读性，我对代码进行了改造，我把?_isPlaceholder 去掉了，假设没有占位符，同时把?_curry1 放在函数内，并且对过程进行了相应注释。

二元参数的柯里化，代码如下：

function _curry2(fn) {
  return function f2(a, b) {
    switch (arguments.length) {
      case 0:
        return f2;
      case 1:
        return _curry1(function (_b) {
          // 将参数从右到左依次赋值 1 2
          // 第一次执行时，是 fn(a, 1)
          return fn(a, _b);
        });
      default:
        // 参数长度是 2 时 直接进行计算
        return fn(a, b);
    }
  };
}

function _curry1(fn) {
  return function f1(a) {
    // 对参数长度进行判断
    if (arguments.length === 0) {
      return f1;
    } else {
      // 通过 apply 来返回函数 fn(a, 1)
      return fn.apply(this, arguments);
    }
  };
}

const add = _curry2(function add(a, b) {
  return Number(a) + Number(b);
});

// 第一次调用是 fn(a, 1)
let r1  = add(1)
// 第二次调用是 fn(2,1)
let r2 = r1(2)
console.log(‘sss‘, r2)

完整代码地址如下：

gist：gist.github.com/godkun/0d22…

codeopen：codepen.io/godkun/pen/…

看了上面对 ramda.js 源码中柯里化的分析，是不是有点收获，就像上面说的，柯里化的目的是为了优化在 JS 原生下的一些函数场景。好处如下：

从上面 add 函数可以知道，通过柯里化，可以让函数在真正需要计算的时候进行计算，起到了延迟的作用，也可以说体现了惰性思想。
通过对参数的处理，做到复用性，从上面的 add 函数可以知道，柯里化把多元函数变成了一元函数，通过多次调用，来实现需要的功能，这样的话，我们就可以控制每一个参数，比如提前设置好不变的参数，从而让代码更加灵活和简洁。

柯里化命名的由来

技术图片

关于 ramda 中的 compose 和 pipe -- 组合函数/管道函数

本文一开始，我就以一个例子向大家展示了组合函数 compose 和 pipe 的用法。

关于 ramda 中，compose 和 pipe 的实现这里就不再分析了，小伙伴自己看着源码分析一下。这里我就简洁说一下组合函数的一些个人看法。

在我看来，组合是函数式编程的核心，函数式编程的思想是要函数尽可能的小，尽可能的保证职责单一。这就直接确定了组合函数在?函数式编程中的地位，玩好了组合函数，函数式编程?也就基本上路了。

和前端的组件进行对比来深刻的理解组合函数

函数的组合思想是面向过程的一种封装，而前端的组件思想是面对对象的一种封装。

三、实际工作中的实践

1、写一个集成错误，警告，以及调试信息的 tap 函数

故事的背景

实际工作中，会遇到下面这种接收和处理数据的场景。

代码如下：

// 伪代码
res => {
  // name 是字符串，age 是数字
  if (res.data && res.data.name && res.data.age) {
    // TODO:
  }
}

上面这样写，看起来好像也没什么问题，但是经不起分析。比如 name 是数字，age 返回的不是数字。这样的话， if 中的判断是能通过的，但是实际结果并不是想要的。

那该怎么办呢？问题不大，跟着我一步步的优化就 OK 了。

（1）进行第一次优化

res => {
  if (res.data && typeof res.data.name === ‘string‘ && typeof res.data.age === ‘number‘) {
    // TODO:
  }
}

看起来是够鲁棒了，但是这段代码过于命令式，无法复用到其他地方，在其他的场景中，还要重写一遍这些代码。

（2）进行第二次优化

//?is?是一个对象函数?伪代码
res => {
  if (is.object(res.data) && is.string(res.data.name) && is.number(res.data.age)) {
    // TODO:
  }
}

将过程抽象掉的行为也是一种函数式思想。上面代码，提高了复用性，将判断的过程抽象成了 is 的对象函数中，这样在其他地方都可以复用这个 is 。

但是，代码还是有问题，一般来说，各个接口的返回数据都是 res.data 这种类型的。所以如果按照上面的代码，我们会发现，每次都要写 is.object(res.data)?这是不能容忍的一件事。我们能不能做到不写这个判断呢？

当然可以，你完全可以在 is 里面加一层对 data 的判断，当然这个需要你把 data 作为参数传给 is 。

（3）第三次优化

//?is?是一个对象函数?伪代码
res => {
  if (is.string(res.data, data.name) && is.number(res.data, data.age)) {
    // TODO:
  }
}

按照上面的写法，is 系列函数会对第一个参数进行 object 类型判断，会再次提高复用性。

好像已经很不错了，但其实还远远不够。

（4）总结上面三次优化

有 if 语句存在，可能会有人说，if 语句存在有什么的啊。现在我来告诉你，这块有 if 为什么不好。是因为 if 语句的?()?里面，最终的值都会表现成布尔值。所以这块限制的很死，需要解决 if 语句的问题。
is 函数功能单一，只能做到返回布尔值，无法完成调试打印错误处理等功能，如果你想打印和调试，你又得在条件分支里面各种 console.log ，然后这些代码依旧过于命令式，无法重用。其实，我们想一下，可以知道，这也是因为用了 if 语句造成的。

说完这些问题，那下面我们来解决吧。

（1）进行函数式优化--第一阶段

如果要做到高度抽象和复用的话，首先把需要的功能罗列一下，大致如下：

第一个功能：检查类型

第二个功能：调试功能，可以自定义 console 的输出形式

第三个功能：处理异常的功能(简单版)

看到上面功能后，我们想一下函数式思想中有哪些武器可以被我们使用到。首先怎么把不同的函数组合在一起。

现在，如何将小函数组合成一个完成特定功能的函数呢？

想一下，你会发现，这里需要用到函数的高阶性，要将函数作为参数传入多功能函数中。ok ，现在我们知道实现的大致方向了，下面我们来尝试一下吧。

这里我直接把我的实现过程贴出来了，有相应的注释，代码如下：

/** * 多功能函数 * @param {Mixed} value 传入的数据 * @param {Function} predicate 谓词，用来进行断言 * @param {Mixed} tip 默认值是 value */
function tap(value, predicate, tip = value) {
  if(predicate(value)) {
    log(‘log‘, `{type: ${typeof value}, value: ${value} }`, `额外信息:${tip}`)
  }
}

const is = {
  undef       : v => v === null || v === undefined,
  notUndef    : v => v !== null && v !== undefined,
  noString    : f => typeof f !== ‘string‘,
  noFunc      : f => typeof f !== ‘function‘,
  noNumber    : n => typeof n !== ‘number‘,
  noArray     : !Array.isArray,
};

function log(level, message, tip) {
  console[level].call(console, message, tip)
}

const res1 = {data: {age: ‘‘, name: ‘godkun‘}}
const res2 = {data: {age: 66, name: ‘godkun‘}}

// 函数的组合，函数的高阶
tap(res1.data.age, is.noNumber)
tap(res2.data.age, is.noNumber)

结果图如下:

技术图片

会发现当，age 不是 Number 类型的时候，就会打印对应的提示信息，当是 Number 类型的时候，就不会打印信息。

这样的话，在业务中就可以直接写:

res => {
  tap(res.data.age, is.noNumber)
  // TODO: 处理 age
}

不用 if 语句，如果有异常，看一下打印信息，会一目了然的。

当然这样写肯定不能放到生产上的，因为 tap 不会阻止后续操作，我这样写的原因是：这个 tap 函数主要是用来开发调试的。

但是，如果需要保证不符合的数据需要直接在 tap 处终止，那可以在 tap 函数里面加下 return false return true 。然后写成下面代码的形式：

res => {
  // if 语句中的返回值是布尔值
  if (tap(res.data.age, is.noNumber)) {
    // TODO: 处理 age
  }
}

但是这样写，会有个不好的地方。那就是用到了 if 语句，用 if 语句也没什么不好的。但退一步看 tap 函数，你会发现，还是不够复用，函数内，还存在硬编码的行为。

如下图所示：

技术图片

存在两点问题：

第一点：把 console 的行为固定死了，导致不能设置 console.error()?等行为。

第二点：不能抛出异常，就算类型不匹配，也阻止不了后续步骤的执行。

怎么解决呢？

进行函数式优化--第二阶段

简单分析一下，这里先采用惰性的思想，让一个函数确定好几个参数，然后再让这个函数去调用其他不固定的参数。这样做的好处是减少了相同参数的多次 coding ，因为相同的参数已经内置了，不用再去传了。

分析到这，你会发现，这样的行为其实就是柯里化，通过将多元函数变成可以一元函数。同时，通过柯里化，可以灵活设置好初始化需要提前确定的参数，大大提高了函数的复用性和灵活性。

对于柯里化，由于源码分析篇，我已经分析了 ramda 的柯里化实现原理，这里我为了节省代码，就直接使用 ramda 了。

代码如下：

const R = require(‘ramda‘)
// 其实这里你可以站在一个高层去把它们想象成函数的重载
// 通过传参的不同来实现不同的功能
const tapThrow = R.curry(_tap)(‘throw‘, ‘log‘)
const tapLog = R.curry(_tap)(null, ‘log‘)

function _tap(stop, level, value, predicate, error=value) {
  if(predicate(value)) {
    if (stop === ‘throw‘) {
      log(`${level}`, ‘uncaught at check‘, error)
      throw new Error(error)
    }
    log(`${level}`, `{type: ${typeof value}, value: ${value} }`, `额外信息:${error}`)
  }
}

const is = {
  undef       : v => v === null || v === undefined,
  notUndef    : v => v !== null && v !== undefined,
  noString    : f => typeof f !== ‘string‘,
  noFunc      : f => typeof f !== ‘function‘,
  noNumber    : n => typeof n !== ‘number‘,
  noArray     : !Array.isArray,
};

function log(level, message, error) {
  console[level].call(console, message, error)
}

const res = {data: {age: ‘66‘, name: ‘godkun‘}}

function main() {
  // 不开启异常忽略，使用 console.log 的 tapLog 函数
  // tapLog(res.data.age, is.noNumber)

  // 开启异常忽略，使用 console.log 的 tapThrow 函数
  tapThrow(res.data.age, is.noNumber)
  console.log(‘能不能走到这‘)
}

main()

代码地址如下：

gist:?gist.github.com/godkun/d394…

关键注释，我已经在代码中标注了。上面代码在第一次进行函数式优化的时候，在组合和高阶的基础上，加入了柯里化，从而让函数变得更有复用性。

PS: 具有柯里化的函数，在我看来，也是体现了函数的重载性。

执行结果如下图所示：

技术图片

会发现使用 tapThrow 函数时，当类型不匹配的时候，会阻止后续步骤的执行。

我通过多次优化，向大家展示了，如何一步步的去优化一个函数。从开始的命令式优化，到后面的函数式优化，从开始的普通函数，到后面的逐步使用了高阶、组合、柯里的特性。从开始的有 if/else 语句到后面的逐步干掉它，来获得更高的复用性。通过这个实战，大家可以知道，如何循序渐进的使用函数式编程，让代码变得更加优秀。

2、为什么要干掉 for 循环

之前就有各种干掉 for 循环的文章。各种讨论，这里按照我的看法来解释一下，为什么会存在干掉 for 循环这一说。

代码如下：

let arr = [1,2,3,4]
for (let i = 0; i < arr.length; i++) {
  // TODO: ...
}

我们看上面这段代码，我来问一个问题：上面这段代码如何复用到其他的函数中？

稍微想一下，大家肯定可以很快的想出来，那就是封装成函数，然后在其他函数中进行调用。

因为 for 循环是一种命令控制结构，它很难被插入到其他操作中，也发现了 for 循环很难被复用的现实。

当你在封装 for 循环时，就是在抽象 for 循环，把它隐藏掉。就是在告诉用户，你只需要调封装的函数，而不需要关心内部实现。

于是乎，JS 就诞生了诸如 map filter reduce 等这种将循环过程隐藏掉的函数。底层本质上还是用 for 实现的，只不过是把 for 循环隐藏了，如果按照业界内的说话逼格，就是把 for 循环干掉了。这就是声明式编程在前端中的应用之一。

你是如何处理数组变换的

三种方式：

第一种：传统的循环结构 - 比如 for 循环

第二种：链式

第三种：函数式组合

3、如何利用函数的纯洁性来进行缓存

在编写函数时，要考虑缓存是为了避免计算重复值。计算就意味着消耗各种资源，而做重复的计算，就是在浪费各种资源。

纯洁性和缓存有什么关系？我们想一下可以知道，纯函数总是为给定的输入返回相同的输出，那既然如此，我们当然要想到可以缓存函数的输出。

那如何做函数的缓存呢？记住一句话：给计算结果赋予唯一的键值并持久化到缓存中。

大致 demo 代码：

function mian(key) {
  let cache = {}
  cache.hasOwnProperty(key) ?
    main(key) :
    cache[key] = main(key)
}

上面代码是一种最简单的利用纯函数来做缓存的例子。下面实现一个非常完美的缓存函数。

给原生?JS?函数加上自动记忆化的缓存机制

代码如下：

Function.prototype.memorized = () => {
  let key = JSON.stringify(arguments)

  // 缓存实现
  this._cache = this._cache || {}
  this._cache[key] = this._cache[key] || this.apply(this, arguments)
  return this._cache[key]

}

Function.prototype.memorize = () => {
  let fn = this
  // 只记忆一元函数
  if (fn.length === 0 || fn.length > 1) return fn
  return () => fn.memorized.apply(fn, arguments)
}

代码地址如下：

gist:?gist.github.com/godkun/5251…

通过扩展 Function 对象，我们就可以充分利用函数的记忆化来实现函数的缓存。

上面函数缓存实现的好处有以下两点：

第一：消除了可能存在的全局共享的缓存

第二：将缓存机制抽象到了函数的内部，使其完全与测试无关，只需要关系函数的行为即可