Erlang的split_binary函数的实现
Posted
技术标签:
【中文标题】Erlang的split_binary函数的实现【英文标题】:Implementation of split_binary function of Erlang 【发布时间】:2021-02-11 00:06:17 【问题描述】:我是 Erlang 世界的新手。我正在尝试实现函数 split_binary。该函数将 (list, index) 作为输入,并根据索引将列表拆分为两个列表。
split(Lst, N) when N>=list:lenght(Lst) -> Lst;
split(Lst, N) when N<list:lenght(Lst) -> splitHelper(list:reverse(Lst), 0, N, []).
splitHelper([H|T], X, N, Acc) ->
if
X>=N ->
(list:reverse([H|T]), list:reverse(Acc));
X<N ->
splitHelper(T, X+1, N, [H|Acc])
end.
如何改进我的代码?
【问题讨论】:
【参考方案1】:我是 Erlang 世界的新手。我正在尝试实现该功能 拆分二进制。该函数作为输入(列表,索引)并拆分 根据索引将列表分为两个列表。
根据split_binary/2 的erlang 文档,这两个参数是binary
,它不是一个列表,以及您要在其中拆分二进制文件的bytes
的数量。
首先,您需要对什么是二进制文件有一个基本的了解。二进制是一个字节序列,其中每个字节是 8 位,表示某个整数,例如
0010 0001
这是33
。下面是一个二进制示例:
<<1, 2, 3>>
当您不为每个整数指定大小时,默认情况下每个整数将占用一个字节。如果您希望 2
占用两个字节,即 0000 0000 0000 0010
,即 16 位,那么您可以这样写:
<<1, 2:16, 3>>
shell 将显示为:
<<1,0,2,3>>
嗯?那个 0 是从哪里来的? shell逐字节显示二进制,整数0000 0000 0000 0010
的第一个字节是0000 0000
,也就是0。
接下来,您可以像处理列表一样单步执行二进制文件,从二进制文件的前面一次提取任意数量的位。碰巧split_binary/2
每次从二进制文件的头部提取 8 位或 1 个字节。
学习如何逐步执行二进制文件有几个技巧:
对于列表,[]
表示一个空列表,对于二进制文件,<<>>
表示一个空二进制文件。
对于列表,您编写 [Head|Tail]
以提取列表的头部,对于二进制文件,您编写 <<Bits:3, Rest/binary>>
以从二进制文件的前面提取 3 位。在您的情况下,您需要从二进制文件的前面提取 8 位。
以下是您可以执行的操作的示例:
-module(a).
-compile(export_all).
split_b(Bin, N) ->
split_b(Bin, N, _Acc = <<>>).
split_b( Bin, _N = 0, Acc) -> [Acc, Bin];
split_b(<<Bits:8, Rest/binary>>, N, Acc) ->
split_b(Rest, N-1, <<Acc/binary, Bits>>).
在外壳中:
40> c(a).
a.erl:2: Warning: export_all flag enabled - all functions will be exported
ok,a
41> a:split_b(<<5,6,7>>, 1).
[<<5>>,<<6,7>>]
42> a:split_b(<<5,6,7>>, 2).
[<<5,6>>,<<7>>]
请注意,在构建二进制文件时,二进制文件的一个段可以是另一个二进制文件:
23> Bin = <<1, 2, 3>>.
<<1,2,3>>
24> Acc = <<Bin/binary, 4>>.
<<1,2,3,4>>
如果你真的想实现lists:split/2,你可以这样做:
-module(a).
-compile(export_all).
split_l(N, List) ->
split_l(N, List, _Acc=[]).
split_l(_N=0, List, Acc) ->
[lists:reverse(Acc), List];
split_l(N, [H|T], Acc) ->
split_l(N-1, T, [H|Acc]).
在外壳中:
2> c(a).
a.erl:2: Warning: export_all flag enabled - all functions will be exported
ok,a
3> a:split_l(1, [10, 20, 30]).
["\n",[20,30]]
4> shell:strings(false).
true
5> a:split_l(1, [10, 20, 30]).
[[10],[20,30]]
6> a:split_l(2, [10, 20, 30]).
[[10,20],[30]]
【讨论】:
【参考方案2】:我认为@7stud 的答案是最好的,但我想添加一些关于你的代码的小细节,而不是实际检查它是否有效……
list:lenght/1
不存在(除非您还创建了自己的 list
模块。
list
模块,则不能在警卫中使用它。那里只允许使用 BIF。
如果您尝试使用stdlib
的函数来检查列表的长度,那么您应该使用erlang:length/1
或只使用length/1
。
在 Erlang 中使用snake_case
(例如split_helper
)而不是camelCase
(例如splitHelper
)更惯用模块名称、函数名称和一般原子。 p>
您可以直接使用模式匹配,而不是编写 if
作为函数的唯一表达式……
split_helper([H|T], X, N, Acc) when X > N ->
(list:reverse([H|T]), list:reverse(Acc));
split_helper([H|T], X, N, Acc) when X<N ->
split_helper(T, X+1, N, [H|Acc]).
元组用大括号而不是圆括号表示:list:reverse([H|T]),…
。顺便说一句......这应该阻止你的代码编译。错误应该看起来像syntax error before: ','
另外,您可能已经编写了自己的 list
模块,但如果没有,并且如果您尝试使用 stdlib
功能,则它是 lists:reverse/1
而不是 list:reverse/1
。
最后,除此之外,我强烈建议您为您的代码编写一些简单的测试。 This article 可以帮到你。
【讨论】:
以上是关于Erlang的split_binary函数的实现的主要内容,如果未能解决你的问题,请参考以下文章