在 Prolog 中更快地实现口头算术
Posted
技术标签:
【中文标题】在 Prolog 中更快地实现口头算术【英文标题】:Faster implementation of verbal arithmetic in Prolog 【发布时间】:2012-06-11 02:56:01 【问题描述】:我已经在 Prolog 中制作了一个通用的 verbal arithmetic 求解器,但它太慢了。运行简单的表达式 S E N D + M O R E = M O N E Y 需要 8 分钟。有人可以帮我让它运行得更快吗?
/* verbalArithmetic(List,Word1,Word2,Word3) where List is the list of all
possible letters in the words. The SEND+MORE = MONEY expression would then
be represented as
verbalArithmetic([S,E,N,D,M,O,R,Y],[S,E,N,D],[M,O,R,E],[M,O,N,E,Y]). */
validDigit(X) :- member(X,[0,1,2,3,4,5,6,7,8,9]).
validStart(X) :- member(X,[1,2,3,4,5,6,7,8,9]).
assign([H|[]]) :- validDigit(H).
assign([H|Tail]) :- validDigit(H), assign(Tail), fd_all_different([H|Tail]).
findTail(List,H,T) :- append(H,[T],List).
convert([T],T) :- validDigit(T).
convert(List,Num) :- findTail(List,H,T), convert(H,HDigit), Num is (HDigit*10+T).
verbalArithmetic(WordList,[H1|Tail1],[H2|Tail2],Word3) :-
validStart(H1), validStart(H2), assign(WordList),
convert([H1|Tail1],Num1),convert([H2|Tail2],Num2), convert(Word3,Num3),
Sum is Num1+Num2, Num3 = Sum.
【问题讨论】:
【参考方案1】:考虑使用finite domain constraints,例如,在 SWI-Prolog 中:
:- use_module(library(clpfd)).
puzzle([S,E,N,D] + [M,O,R,E] = [M,O,N,E,Y]) :-
Vars = [S,E,N,D,M,O,R,Y],
Vars ins 0..9,
all_different(Vars),
S*1000 + E*100 + N*10 + D +
M*1000 + O*100 + R*10 + E #=
M*10000 + O*1000 + N*100 + E*10 + Y,
M #\= 0, S #\= 0.
查询示例:
?- time((puzzle(As+Bs=Cs), label(As))).
% 5,803 inferences, 0.002 CPU in 0.002 seconds (98% CPU, 3553582 Lips)
As = [9, 5, 6, 7],
Bs = [1, 0, 8, 5],
Cs = [1, 0, 6, 5, 2] ;
% 1,411 inferences, 0.001 CPU in 0.001 seconds (97% CPU, 2093472 Lips)
false.
【讨论】:
【参考方案2】:这里表现不佳是由于在检查是否可行之前形成所有可能的字母分配。
我的建议是“尽早失败,经常失败”。也就是说,尽早将尽可能多的失败检查推送到分配步骤中,从而修剪搜索树。
Klas Lindbäck 提出了一些很好的建议。作为概括,当添加两个数字时,每个位置最多有一个进位。因此,可以检查从左到右对字母的不同数字的分配,同时考虑到在最右边的位置可能存在尚未确定的进位。 (当然在最后的“单位”处,是没有进位的。)
要考虑的东西很多,这就是为什么约束逻辑,正如 mat 所建议的那样(你已经用 fd_all_different/1 讨论过)如此方便。
补充:这是一个没有约束逻辑的Prolog解决方案,只使用一个辅助谓词omit/3:
omit(H,[H|T],T).
omit(X,[H|T],[H|Y]) :- omit(X,T,Y).
它既从列表中选择一个项目,又生成没有该项目的缩短列表。
下面是 sendMoreMoney/3 的代码,它通过从左到右求和来进行搜索:
sendMoreMoney([S,E,N,D],[M,O,R,E],[M,O,N,E,Y]) :-
M = 1,
omit(S,[2,3,4,5,6,7,8,9],PoolO),
(CarryS = 0 ; CarryS = 1),
%% CarryS + S + M = M*10 + O
O is (CarryS + S + M) - (M*10),
omit(O,[0|PoolO],PoolE),
omit(E,PoolE,PoolN),
(CarryE = 0 ; CarryE = 1),
%% CarryE + E + O = CarryS*10 + N
N is (CarryE + E + O) - (CarryS*10),
omit(N,PoolN,PoolR),
(CarryN = 0 ; CarryN = 1),
%% CarryN + N + R = CarryE*10 + E
R is (CarryE*10 + E) - (CarryN + N),
omit(R,PoolR,PoolD),
omit(D,PoolD,PoolY),
%% D + E = CarryN*10 + Y
Y is (D + E) - (CarryN*10),
omit(Y,PoolY,_).
我们通过观察 M 必须是最左边数字和的非零进位来快速开始,因此是 1,并且 S 必须是其他一些非零数字。 cmets 显示了可以根据已经做出的选择确定性地为其他字母分配值的步骤。
已添加(2):这是一个用于两个加法的“通用”密码算法求解器,它们不需要具有相同的“位置”长度/数量。 length/2 的代码作为一个相当常见的内置谓词被省略,并接受 Will Ness 的建议,对 omit/3 的调用被替换为 select/3 方便 SWI-Prolog 用户。
我已经用 Amzi 测试过了!和 SWI-Prolog 使用那些字母表示例from Cryptarithms.com,其中涉及两个加法,每个加法都有一个独特的解决方案。我还用十几个解决方案组成了一个示例,I + AM = BEN,以测试正确的回溯。
solveCryptarithm([H1|T1],[H2|T2],Sum) :-
operandAlign([H1|T1],[H2|T2],Sum,AddTop,AddPad,Carry,TSum,Pool),
solveCryptarithmAux(H1,H2,AddTop,AddPad,Carry,TSum,Pool).
operandAlign(Add1,Add2,Sum,AddTop,AddPad,Carry,TSum,Pool) :-
operandSwapPad(Add1,Add2,Length,AddTop,AddPad),
length(Sum,Size),
( Size = Length
-> ( Carry = 0, Sum = TSum , Pool = [1|Peel] )
; ( Size is Length+1, Carry = 1, Sum = [Carry|TSum], Pool = Peel )
),
Peel = [2,3,4,5,6,7,8,9,0].
operandSwapPad(List1,List2,Length,Longer,Padded) :-
length(List1,Length1),
length(List2,Length2),
( Length1 >= Length2
-> ( Length = Length1, Longer = List1, Shorter = List2, Pad is Length1 - Length2 )
; ( Length = Length2, Longer = List2, Shorter = List1, Pad is Length2 - Length1 )
),
zeroPad(Shorter,Pad,Padded).
zeroPad(L,0,L).
zeroPad(L,K,P) :-
K > 0,
M is K-1,
zeroPad([0|L],M,P).
solveCryptarithmAux(_,_,[],[],0,[],_).
solveCryptarithmAux(NZ1,NZ2,[H1|T1],[H2|T2],CarryOut,[H3|T3],Pool) :-
( CarryIn = 0 ; CarryIn = 1 ), /* anticipatory carry */
( var(H1)
-> select(H1,Pool,P_ol)
; Pool = P_ol
),
( var(H2)
-> select(H2,P_ol,P__l)
; P_ol = P__l
),
( var(H3)
-> ( H3 is H1 + H2 + CarryIn - 10*CarryOut, select(H3,P__l,P___) )
; ( H3 is H1 + H2 + CarryIn - 10*CarryOut, P__l = P___ )
),
NZ1 \== 0,
NZ2 \== 0,
solveCryptarithmAux(NZ1,NZ2,T1,T2,CarryIn,T3,P___).
我认为这说明了从左到右搜索/评估的优势可以在“通用”求解器中获得,与早期的“定制”代码相比,推理次数大约增加了两倍。
【讨论】:
您的omit/3
是 SWI-Prolog 的 select/3
。各种称为del/3
、delete/3
等。使用它可以直接操作有限域(或“池”)。我的答案中的selectM/3
谓词将select/3
的多个调用组合为一个,以便更轻松、更短地编码。此外,您的代码采用了大量的人工推理。
@WillNess:SWI-Prolog 确实内置了该(等效)谓词。我试图说明从左到右评估的好处,感谢您的从右到左版本,我们可以进行比较。
所以我尝试了你的版本,它花费了 533(676) 推理/0.00 秒,而我的版本花费了 27,653(38,601) 推理/0.02 秒。 :) 考虑到您的代码中包含大量人工推理,这并不奇怪,相比之下,这要形式化要困难得多(毕竟,这就是原始 Q 的含义)。 WP 文章,例如无需任何代码即可得出完整的解决方案,将人类推理更进一步。
你太过分了!! :) :) 您的新代码确实看起来通用。经测试,它显示需要 833 次推理才能得出解决方案,并需要 1477 次推理才能充分探索搜索空间。
@WillNess:感谢您的好意和慷慨的奖励!我很欣赏“走廊代码审查”。【参考方案3】:
注意:此答案讨论了一种用于减少需要尝试的组合数量的算法。我不懂Prolog,所以无法提供任何代码sn-ps。
加速蛮力解决方案的诀窍是捷径。如果您可以识别出无效的组合范围,则可以大大减少组合的数量。
举个例子。当一个人解决它时,她立即注意到 MONEY 有 5 个数字,而 SEND 和 MORE 只有 4 个,所以 MONEY 中的 M 必须是数字 1。90% 的组合消失了!
在为计算机构建算法时,我们首先尝试使用适用于所有可能输入的快捷方式。如果它们未能提供所需的性能,我们将开始查看仅适用于特定输入组合的快捷方式。 所以我们暂时保留 M=1 快捷方式。
相反,我会关注最后一位数字。 我们知道 (D+E) mod 10 = Y。 我们尝试的组合数量减少了 90%。
这一步应该可以将执行时间缩短到不到一分钟。
如果这还不够,我们该怎么办? 下一步: 看倒数第二个数字! 我们知道 (N+R+carry from D+E) mod 10 = E。
由于我们正在测试最后一位数字的所有有效组合,因此对于每个测试,我们都会知道进位是 0 还是 1。 进一步减少要测试的组合数量的复杂情况(对于代码)是我们将遇到重复项(一个字母被映射到一个已经分配给另一个字母的数字)。当我们遇到重复时,我们可以前进到下一个组合,而无需再往下走。
祝你的任务好运!
【讨论】:
非常好的推理,+1!这正是 CLP(FD) 版本在幕后为您所做的。例如,当我查询:?- puzzle([S,E,N,D] + [M,O,R,E] = [M,O,N,E,Y]).
,然后我得到变量绑定:M = 1, O = 0, S = 9
,因此只需发布描述难题的 CLP(FD) 约束,就可以轻松地将 3 个变量固定为具体整数。正如我们从剩余目标中看到的那样,剩余变量的域也减少了:N in 5..8, E in 4..7, R in 2..8, Y in 2..8
。最后的搜索步骤找到唯一解作为所有 CLP(FD) 变量的具体整数绑定。【参考方案4】:
这是我的看法。我用clpfd,dcg,
和meta-predicatemapfoldl/5
:
:- meta_predicate mapfoldl(4,?,?,?,?).
mapfoldl(P_4,Xs,Zs, S0,S) :-
list_mapfoldl_(Xs,Zs, S0,S, P_4).
:- meta_predicate list_mapfoldl_(?,?,?,?,4).
list_mapfoldl_([],[], S,S, _).
list_mapfoldl_([X|Xs],[Y|Ys], S0,S, P_4) :-
call(P_4,X,Y,S0,S1),
list_mapfoldl_(Xs,Ys, S1,S, P_4).
让我们好好利用mapfoldl/5
,做一些口头算术!
:- use_module(library(clpfd)).
:- use_module(library(lambda)).
digits_number(Ds,Z) :-
Ds = [D0|_],
Ds ins 0..9,
D0 #\= 0, % most-significant digit must not equal 0
reverse(Ds,Rs),
length(Ds,N),
numlist(1,N,Es), % exponents (+1)
maplist(\E1^V^(V is 10**(E1-1)),Es,Ps),
scalar_product(Ps,Rs,#=,Z).
list([]) --> [].
list([E|Es]) --> [E], list(Es).
cryptarithexpr_value([V|Vs],X) -->
digits_number([V|Vs],X) ,
list([V|Vs]).
cryptarithexpr_value(T0,T) -->
functor(T0,F,A) ,
dif(F-A,'.'-2) ,
T0 =.. [F|Args0] ,
mapfoldl(cryptarithexpr_value,Args0,Args),
T =.. [F|Args] .
crypt_arith_(Expr,Zs) :-
phrase(cryptarithexpr_value(Expr,Goal),Zs0),
( member(Z,Zs0), \+var(Z)
-> throw(error(uninstantiation_error(Expr),crypt_arith_/2))
; true
),
sort(Zs0,Zs),
all_different(Zs),
call(Goal).
快速而肮脏的 hack 转储 所有解决方案:
solve_n_dump(Opts,Eq) :-
( crypt_arith_(Eq,Zs),
labeling(Opts,Zs),
format('Eq = (~q), Zs = ~q.~n',[Eq,Zs]),
false
; true
).
solve_n_dump(Eq) :- solve_n_dump([],Eq).
让我们试试吧!
?-solve_n_dump([S,E,N,D]+[M,O,R,E] #= [M,O,N,E,Y])。 Eq = ([9,5,6,7]+[1,0,8,5]#=[1,0,6,5,2]), Zs = [9,5,6,7,1, 0,8,2]。 真的。 ?-solve_n_dump([C,R,O,S,S]+[R,O,A,D,S] #= [D,A,N,G,E,R])。 Eq = ([9,6,2,3,3]+[6,2,5,1,3]#=[1,5,8,7,4,6]), Zs = [9,6, 2,3,5,1,8,7,4]。 真的。 ?-solve_n_dump([F,O,R,T,Y]+[T,E,N]+[T,E,N] #= [S,I,X,T,Y])。 Eq = ([2,9,7,8,6]+[8,5,0]+[8,5,0]#=[3,1,4,8,6]), Zs = [2, 9,7,8,6,5,0,3,1,4]。 真的。 ?-solve_n_dump([E,A,U]*[E,A,U] #= [O,C,E,A,N])。 方程 = ([2,0,3]*[2,0,3]#=[4,1,2,0,9]),Zs = [2,0,3,4,1,9]。 真的。 ?-solve_n_dump([N,U,M,B,E,R] #= 3*[P,R,I,M,E])。 % 等同于:[N,U,M,B,E,R] #= [P,R,I,M,E]+[P,R,I,M,E]+[P,R,I,我] Eq = (3*[5,4,3,2,8]#=[1,6,2,9,8,4]), Zs = [5,4,3,2,8,1,6, 9]。 真的。 ?-solve_n_dump(3*[C,O,F,F,E,E] #= [T,H,E,O,R,E,M])。 Eq = (3*[8,3,1,1,9,9]#=[2,4,9,3,5,9,7]), Zs = [8,3,1,9,2, 4,5,7]。 真的。让我们做更多,尝试一些不同的labeling options:
?- time(solve_n_dump([],[D,O,N,A,L,D]+[G,E,R,A,L,D] #= [R,O, B,E,R,T]))。 Eq = ([5,2,6,4,8,5]+[1,9,7,4,8,5]#=[7,2,3,9,7,0]), Zs = [ 5,2,6,4,8,1,9,7,3,0]。 % 35,696,801 次推理,3.929 个 CPU,3.928 秒(100% CPU,9085480 个嘴唇) 真的。 ?- time(solve_n_dump([ff],[D,O,N,A,L,D]+[G,E,R,A,L,D] #= [R,O ,B,E,R,T]))。 Eq = ([5,2,6,4,8,5]+[1,9,7,4,8,5]#=[7,2,3,9,7,0]), Zs = [ 5,2,6,4,8,1,9,7,3,0]。 % 2,902,871 推理,0.340 CPU 在 0.340 秒(100% CPU,8533271 唇) 真的。【讨论】:
【参考方案5】:Will Ness 风格,广义(但假设为 length(A) <= length(B)
)求解器:
money_puzzle(A, B, C) :-
maplist(reverse, [A,B,C], [X,Y,Z]),
numlist(0, 9, Dom),
swc(0, Dom, X,Y,Z),
A \= [0|_], B \= [0|_].
swc(C, D0, [X|Xs], [Y|Ys], [Z|Zs]) :-
peek(D0, X, D1),
peek(D1, Y, D2),
peek(D2, Z, D3),
S is X+Y+C,
( S > 9 -> Z is S - 10, C1 = 1 ; Z = S, C1 = 0 ),
swc(C1, D3, Xs, Ys, Zs).
swc(C, D0, [], [Y|Ys], [Z|Zs]) :-
peek(D0, Y, D1),
peek(D1, Z, D2),
S is Y+C,
( S > 9 -> Z is S - 10, C1 = 1 ; Z = S, C1 = 0 ),
swc(C1, D2, [], Ys, Zs).
swc(0, _, [], [], []).
swc(1, _, [], [], [1]).
peek(D, V, R) :- var(V) -> select(V, D, R) ; R = D.
性能:
?- time(money_puzzle([S,E,N,D],[M,O,R,E],[M,O,N,E,Y])).
% 38,710 inferences, 0.016 CPU in 0.016 seconds (100% CPU, 2356481 Lips)
S = 9,
E = 5,
N = 6,
D = 7,
M = 1,
O = 0,
R = 8,
Y = 2 ;
% 15,287 inferences, 0.009 CPU in 0.009 seconds (99% CPU, 1685686 Lips)
false.
?- time(money_puzzle([D,O,N,A,L,D],[G,E,R,A,L,D],[R,O,B,E,R,T])).
% 14,526 inferences, 0.008 CPU in 0.008 seconds (99% CPU, 1870213 Lips)
D = 5,
O = 2,
N = 6,
A = 4,
L = 8,
G = 1,
E = 9,
R = 7,
B = 3,
T = 0 ;
% 13,788 inferences, 0.009 CPU in 0.009 seconds (99% CPU, 1486159 Lips)
false.
【讨论】:
【参考方案6】:你有
convert([A,B,C,D]) => convert([A,B,C])*10 + D
=> (convert([A,B])*10+C)*10+D => ...
=> ((A*10+B)*10+C)*10+D
因此,您可以使用简单的线性递归来表达这一点。
更重要的是,当您从您的域0..9
中选择一个可能的数字时,您不应再使用该数字进行后续选择:
selectM([A|As],S,Z):- select(A,S,S1),selectM(As,S1,Z).
selectM([],Z,Z).
select/3
在 SWI Prolog 中可用。有了这个工具,您可以逐渐从您缩小的域中选择您的数字:
money_puzzle( [[S,E,N,D],[M,O,R,E],[M,O,N,E,Y]]):-
Dom = [0,1,2,3,4,5,6,7,8,9],
selectM([D,E], Dom,Dom1), add(D,E,0, Y,C1), % D+E=Y
selectM([Y,N,R],Dom1,Dom2), add(N,R,C1,E,C2), % N+R=E
select( O, Dom2,Dom3), add(E,O,C2,N,C3), % E+O=N
selectM([S,M], Dom3,_), add(S,M,C3,O,M), % S+M=MO
S \== 0, M \== 0.
我们可以将两个数字与进位相加,相加产生一个带有新进位的结果数字(例如,4+8 (0) = 2 (1)
,即 12):
add(A,B,C1,D,C2):- N is A+B+C1, D is N mod 10, C2 is N // 10 .
如此实现,money_puzzle/1
立即运行,这要归功于数字被挑选和测试的渐进性立即:
?- time( money_puzzle(X) ).
% 27,653 inferences, 0.02 CPU in 0.02 seconds (100% CPU, 1380662 Lips)
X = [[9, 5, 6, 7], [1, 0, 8, 5], [1, 0, 6, 5, 2]] ;
No
?- time( (money_puzzle(X),fail) ).
% 38,601 inferences, 0.02 CPU in 0.02 seconds (100% CPU, 1927275 Lips)
现在面临的挑战是使其通用化。
【讨论】:
以上是关于在 Prolog 中更快地实现口头算术的主要内容,如果未能解决你的问题,请参考以下文章