array_map、array_walk 和 array_filter 的区别

Posted

技术标签:

【中文标题】array_map、array_walk 和 array_filter 的区别【英文标题】:Difference between array_map, array_walk and array_filter 【发布时间】:2011-03-26 19:48:39 【问题描述】:

array_maparray_walkarray_filter 之间到底有什么区别。我从文档中看到的是,您可以传递一个回调函数来对提供的数组执行操作。但我似乎没有发现它们之间有什么特别的区别。

它们执行相同的操作吗? 它们可以互换使用吗?

如果它们完全不同,我将感谢您提供说明性示例的帮助。

【问题讨论】:

这是通过 array_reduce() 进行命名数组处理的一个很酷的技巧。如果您正在研究 array_map、array_walk 和 array_filter,值得一读。 ***.com/questions/11563119/… 【参考方案1】: 更改值: array_map 不能更改输入数组中的值,而 array_walk 可以;特别是,array_map 从不改变它的论点。 数组键访问: array_map不能用数组键操作,array_walk可以。 返回值: array_map 返回一个新数组,array_walk 只返回 true。因此,如果您不想因为遍历一个数组而创建一个数组,您应该使用array_walk。 迭代多个数组: array_map 也可以接收任意数量的数组,并且可以并行迭代它们,而array_walk 只对一个数组进行操作。 将任意数据传递给回调: array_walk 可以接收额外的任意参数以传递给回调。自 php 5.3 以来(引入 anonymous functions 时),这几乎无关紧要。 返回数组的长度: array_map 的结果数组与最大输入数组的长度相同; array_walk 不返回数组但同时不能改变原始数组的元素个数; array_filter 根据过滤函数仅选取数组元素的子集。它确实保留了密钥。

例子:

<pre>
<?php

$origarray1 = array(2.4, 2.6, 3.5);
$origarray2 = array(2.4, 2.6, 3.5);

print_r(array_map('floor', $origarray1)); // $origarray1 stays the same

// changes $origarray2
array_walk($origarray2, function (&$v, $k)  $v = floor($v); ); 
print_r($origarray2);

// this is a more proper use of array_walk
array_walk($origarray1, function ($v, $k)  echo "$k => $v", "\n"; );

// array_map accepts several arrays
print_r(
    array_map(function ($a, $b)  return $a * $b; , $origarray1, $origarray2)
);

// select only elements that are > 2.5
print_r(
    array_filter($origarray1, function ($a)  return $a > 2.5; )
);

?>
</pre>

结果:

Array
(
    [0] => 2
    [1] => 2
    [2] => 3
)
Array
(
    [0] => 2
    [1] => 2
    [2] => 3
)
0 => 2.4
1 => 2.6
2 => 3.5
Array
(
    [0] => 4.8
    [1] => 5.2
    [2] => 10.5
)
Array
(
    [1] => 2.6
    [2] => 3.5
)

【讨论】:

PHP 手册说:“array_walk(): 只有数组的值可能会改变;” “array_map 无法使用数组键操作”这不是真的:array_map(callback($key, $value), array_keys($array), $array) 它仍然没有访问任何数组的键,它正在访问您放入从键创建的数组中的值。这是一种解决方法,它不会否定该声明。 虽然 array_map 不会隐式更改值,但通过将结果分配给同一个数组,它基本上会更改它,而对同一数组本身进行操作的“自相矛盾”的 array_walk 不会直接更改其值,除非通过引用传递值(数组遍历可能会通过传递原始数组的匿名函数 use 子句间接将索引/元素删除为 array_filter,但这是一种解决方法)。因此,总而言之,改变值,或者一个值是否返回或通过引用传递的效果差异较小,但数组遍历与索引和数组映射一起使用多个数组 此外,无论数组遍历将第一个数组参数作为引用,当一个人想要更改它时,他还必须将回调项值作为引用传递【参考方案2】:

mapping 数据数组的函数的想法来自函数式编程。您不应该将array_map 视为foreach 循环,它在数组的每个元素上调用一个函数(即使它是这样实现的)。它应该被认为是独立地将函数应用于数组中的每个元素。

理论上,诸如函数映射之类的事情可以并行完成,因为应用于数据的函数应该只影响数据而不影响全局状态。这是因为array_map 可以选择将函数应用于其中的项目的任何顺序(即使在 PHP 中没有)。

array_walk 另一方面,它与处理数据数组的方法完全相反。它不是单独处理每个项目,而是使用状态 (&amp;$userdata) 并且可以就地编辑项目(很像 foreach 循环)。因为每次一个项目都应用了$funcname,它可能会改变程序的全局状态,因此需要一个正确的方式来处理这些项目。

回到 PHP 领域,array_maparray_walk 几乎相同,除了 array_walk 让您可以更好地控制数据的迭代,并且通常用于就地“更改”数据而不是返回一个新的“已更改” " 数组。

array_filter实际上是array_walk(或array_reduce)的一个应用程序,它或多或少只是为了方便而提供的。

【讨论】:

+1 为您的第二段洞察“理论上,函数映射等事情可以并行完成,因为应用于数据的函数应该只影响数据而不是全局状态。”对于我们并行程序员来说,记住这一点很有用。 您能解释一下如何使用array_walk() 实现array_filter() 吗?【参考方案3】:

从文档中,

bool array_walk ( 数组 &$array , 回调 $funcname [, 混合 $userdata ] )

array_walk 接受一个数组和一个函数F 并通过用F(x) 替换每个元素x 来修改它。

array array_map (回调 $callback , 数组 $arr1 [, 数组 $... ] )

array_map 做了完全相同的事情除了,它不会就地修改,而是返回一个包含转换后元素的新数组。

数组 array_filter ( 数组 $input [, 回调 $callback ] )

array_filter 与函数 F,而不是转换元素,将删除任何 F(x) 不正确的元素

【讨论】:

无法弄清楚为什么我的数组值消失了。查看文档,我假设array_walk 返回了一个类似array_map 的数组,并认为问题出在我的函数中。直到我看到这个才意识到返回类型是布尔值。【参考方案4】:

其他答案很好地证明了array_walk(就地修改)和array_map(返回修改后的副本)之间的区别。但是,他们并没有真正提到array_reduce,这是理解array_map 和array_filter 的一种启发性方式。

array_reduce 函数接受一个数组、一个双参数函数和一个“累加器”,如下所示:

array_reduce(array('a', 'b', 'c', 'd'),
             'my_function',
             $accumulator)

数组的元素使用给定的函数一次与累加器组合。上面调用的结果和这样做是一样的:

my_function(
  my_function(
    my_function(
      my_function(
        $accumulator,
        'a'),
      'b'),
    'c'),
  'd')

如果您更喜欢从循环的角度来考虑,这就像执行以下操作(实际上,当 array_reduce 不可用时,我将其用作后备):

function array_reduce($array, $function, $accumulator) 
  foreach ($array as $element) 
    $accumulator = $function($accumulator, $element);
  
  return $accumulator;

这个循环版本清楚地说明了为什么我将第三个参数称为“累加器”:我们可以使用它来累积每次迭代的结果。

那么这与array_map 和array_filter 有什么关系呢?事实证明它们都是一种特殊的array_reduce。我们可以这样实现它们:

array_map($function, $array)    === array_reduce($array, $MAP,    array())
array_filter($array, $function) === array_reduce($array, $FILTER, array())

忽略 array_map 和 array_filter 以不同顺序获取参数的事实;这只是 PHP 的另一个怪癖。重要的一点是,除了我称为 $MAP 和 $FILTER 的函数之外,右侧是相同的。那么,它们长什么样子呢?

$MAP = function($accumulator, $element) 
  $accumulator[] = $function($element);
  return $accumulator;
;

$FILTER = function($accumulator, $element) 
  if ($function($element)) $accumulator[] = $element;
  return $accumulator;
;

如您所见,这两个函数都接收 $accumulator 并再次返回它。这些功能有两个区别:

$MAP 将始终附加到 $accumulator,但 $FILTER 只有在 $function($element) 为 TRUE 时才会这样做。 $FILTER 附加原始元素,但 $MAP 附加 $function($element)。

请注意,这远非无用的琐事;我们可以用它来提高我们的算法效率!

我们经常可以看到类似这两个例子的代码:

// Transform the valid inputs
array_map('transform', array_filter($inputs, 'valid'))

// Get all numeric IDs
array_filter(array_map('get_id', $inputs), 'is_numeric')

使用 array_map 和 array_filter 代替循环使这些示例看起来非常漂亮。但是,如果 $inputs 很大,它可能会非常低效,因为第一次调用(map 或 filter)将遍历 $inputs 并构建一个中间数组。这个中间数组直接传递给第二次调用,它会再次遍历整个东西,然后中间数组需要被垃圾回收。

我们可以利用 array_map 和 array_filter 都是 array_reduce 的例子来摆脱这个中间数组。通过组合它们,我们只需在每个示例中遍历 $inputs 一次:

// Transform valid inputs
array_reduce($inputs,
             function($accumulator, $element) 
               if (valid($element)) $accumulator[] = transform($element);
               return $accumulator;
             ,
             array())

// Get all numeric IDs
array_reduce($inputs,
             function($accumulator, $element) 
               $id = get_id($element);
               if (is_numeric($id)) $accumulator[] = $id;
               return $accumulator;
             ,
             array())

注意:我上面的array_map 和array_filter 的实现与PHP 的行为不完全一样,因为我的array_map 一次只能处理一个数组,而我的array_filter 不会使用“空”作为其默认的$ 函数。此外,两者都不会保留密钥。

让它们表现得像 PHP 并不难,但我觉得这些复杂性会使核心思想更难被发现。

【讨论】:

【参考方案5】:

以下修订旨在更清楚地描述 PHP 的 array_filer()、array_map() 和 array_walk(),它们都源自函数式编程:

array_filter() 过滤掉数据,生成一个新的数组,只保存前一个数组的所需项,如下所示:

<?php
$array = array(1, "apples",2, "oranges",3, "plums");

$filtered = array_filter( $array, "ctype_alpha");
var_dump($filtered);
?>

直播代码here

所有数值都从 $array 中过滤掉,而 $filtered 中只剩下水果的类型。

array_map() 也创建了一个新数组,但与 array_filter() 不同的是,结果数组包含输入 $filtered 的 每个 元素,但由于对每个元素应用了回调,因此具有更改的值,如下所示:

<?php

$nu = array_map( "strtoupper", $filtered);
var_dump($nu);
?>

直播代码here

本例中的代码使用内置的 strtoupper() 应用回调,但用户定义的函数也是另一个可行的选择。回调适用于 $filtered 的每个项目,从而产生 $nu 其元素包含大写值。

在下一个 sn-p 中,数组 walk() 遍历 $nu 并针对引用运算符 '&' 对每个元素进行更改。无需创建额外的数组即可进行更改。每个元素的值都会在适当的位置更改为一个信息量更大的字符串,指定它的键、类别和值。

<?php

$f = function(&$item,$key,$prefix) 
    $item = "$key: $prefix: $item";
; 
array_walk($nu, $f,"fruit");
var_dump($nu);    
?>    

见demo

注意:关于array_walk() 的回调函数有两个参数,当被array_walk() 调用时,它们也会自动获取元素的值及其键并按此顺序。 (查看更多here)。

【讨论】:

请注意,函数 $lambda$callback 只是现有函数的 eta 扩展,因此完全是多余的。通过传递底层函数(名称)可以获得相同的结果:$filtered = array_filter($array, 'ctype_alpha');$nu = array_map('strtoupper', $filtered);

以上是关于array_map、array_walk 和 array_filter 的区别的主要内容,如果未能解决你的问题,请参考以下文章

PHP:数组操作函数array_walk()和array_map()

PHP:数组操作函数array_walk()和array_map()

PHP:数组操作函数array_walk()和array_map()

array_map、array_walk 和 array_filter 的区别

php中array_map和array_walk的使用对比

array_walk与array_map的区别