Haskell-将两个列表放入一个元组列表中
Posted
技术标签:
【中文标题】Haskell-将两个列表放入一个元组列表中【英文标题】:Haskell- Two lists into a list of tuples 【发布时间】:2013-03-25 10:44:19 【问题描述】:我正在尝试实现一个函数(如下所述),它接受两个列表(每个或两个都可能是无限的)并返回列表之间所有可能元素对的元组列表
zipInf :: [a] -> [b] -> [(a,b)]
(例如,输出应该是这样的,但不必完全是这样)
zipInf [0 .. 2] ['A' .. 'C'] ~> [(0,'A'),(1,'A'),(0,'B'),(1,'B'),(0,'C'),(2,'A'),(2,'B'),(1,'C'),(2,'C')]
zipInf [] [0 ..] ~> []
zipInf [0 ..] [] ~> []
take 9 (zipInf ['A'] [0 .. ]) ~> [('A',0),('A',1),('A',2),('A',3),('A',4),('A',5),('A',6),('A',7),('A',8)]
我已经开始这样实现它了:
zipInf :: [a] -> [b] -> [(a,b)]
zipInf [] _ = []
zipInf _ [] = []
zipInf
我想将列表输入到辅助函数中以生成列表,但我制作的列表无法编译并且不知道如何处理无限列表
辅助函数-
oneList :: [a] -> [b] [(a,b)]
oneList [] _ = []
oneList x:xs y:ys = [(x,y)] ++ oneList
【问题讨论】:
【参考方案1】:这是一个很棒的练习!
如果我们将您的输入对放在一个无限表中:
(0,A) (1,A) (2,A) (3,A) ...
(0,B) (1,B) (2,B) (3,B) ...
(0,C) (1,C) (2,C) (3,C) ...
(0,D) (1,D) (2,D) (3,D) ...
...
诀窍是以向上的对角线横穿表格。用眼睛追踪桌子。这张桌子的条纹是:
(0,A)
(0,B) (1,A)
(0,C) (1,B) (2,A)
(0,D) (1,C) (2,B) (3,A)
...
所有条纹都是有限的,但表格的每个元素都在其中一个中,因此如果将它们连接在一起,每个元素都将出现在连接结果中的有限位置。
这是我建议的游戏计划:
实现stripes :: [[a]] -> [[a]]
,它从像上面这样的无限数组中提取条纹列表(首先假设所有列表都是无限的,即不要担心[]
的情况;一旦你有这个工作,将其更正为处理可能是有限的列表)。
使用stripes
,实现连接所有条纹的diagonal :: [[a]] -> [a]
(这是单线)。
最后,通过应用特定 2D 表 [[(a,b)]]
的 diagonal
来实现您的功能,这是我开始回答此问题的表(并且可以使用嵌套列表推导以及其他各种方式构建)。
注意事项:
名称 zip 具有误导性。这更像是一个笛卡尔积。
你知道你可以在模式中匹配模式,对吧? IE。如果f :: [[a]] -> something
f ((x:xs):xss) = ...
将x
作为第一行的第一个元素,xs
是第一行的其余部分,xss
是表格的其余部分。
【讨论】:
【参考方案2】:这是您发布的辅助函数:
oneList :: [a] -> [b] [(a,b)]
oneList [] _ = []
oneList x:xs y:ys = [(x,y)] ++ oneList
以下是它包含的语法错误:
你在类型注解中遗漏了一个箭头;应该是
oneList :: [a] -> [b] -> [(a,b)]
你需要用括号括起来非平凡的模式,所以第二个等式应该开始
oneList (x:xs) (y:ys) =
oneList
在返回列表之前接受两个参数,但在第二个等式的 rhs 中,您尝试将其用作列表而不给它任何参数
(顺便说一句,如果您发布错误消息而不是仅仅说它无法编译,这通常会对我们有所帮助。将我在上面指出的错误与编译器给您的错误消息进行比较。)
但正如您所指出的,您的算法是错误的。
我感觉这是作业,所以我只是给你一个提示。
zipInf
应该是
zipInf :: [a] -> [b] -> [(a,b)]
zipInf xs ys = thread (expand xs ys)
thread
和 expand
是两个辅助函数,我让你写,带有类型签名
expand :: [a] -> [b] -> [[(a,b)]]
thread :: [[c]] -> [c]
expand
相当简单。 thread
是您必须小心以正确顺序包含元素的地方(因此您不能只说 thread zs = concat zs
,即使类型正确)。
【讨论】:
【参考方案3】:虽然这是了解列表和一般 Haskell 的一个很好的练习,但它也是了解 Applicative
类的全部内容的一个很好的练习。特别是[]
的Applicative
实例。您想要的zipInf
正是liftA2 (,)
λ: :t liftA2
liftA2 :: Applicative f => (a -> b -> c) -> f a -> f b -> f c
λ: :t (,)
(,) :: a -> b -> (a, b)
λ: :t liftA2 (,)
liftA2 (,) :: Applicative f => f a -> f b -> f (a, b)
我们只需要确保[]
是Applicative
。
λ: :i []
...
instance Applicative [] -- Defined in `Control.Applicative'
...
所以它是Applicative
。如果我们稍微注释一下我们的类型,可能会更容易理解
λ: :t liftA2 (,) `asAppliedTo` []
[a] -> [b] -> [(a, b)]
是的,那是同一类型。
λ: liftA2 (,) [0..2] ['A'..'C']
[(0,'A'),(0,'B'),(0,'C'),(1,'A'),(1,'B'),(1,'C'),(2,'A'),(2,'B'),(2,'C')]
看起来有效! 所以你不需要做任何事情来写这个,它可以说比递归定义更容易理解。此外,您不必像推出自己的解决方案那样担心边缘情况。
您也可以使用<$>
(或fmap
)和<*>
更惯用地编写它。
λ: (,) <$> [0..2] <*> ['A'..'C']
[(0,'A'),(0,'B'),(0,'C'),(1,'A'),(1,'B'),(1,'C'),(2,'A'),(2,'B'),(2,'C')]
λ: take 9 $ (,) <$> "A" <*> [0..]
[('A',0),('A',1),('A',2),('A',3),('A',4),('A',5),('A',6),('A',7),('A',8)]
或者您可以利用Monad
的全部功能(在这种情况下完全没有必要):
λ: do n <- [0..2]; c <- ['A'..'C']; return (n, c)
[(0,'A'),(0,'B'),(0,'C'),(1,'A'),(1,'B'),(1,'C'),(2,'A'),(2,'B'),(2,'C')]
此外,如果您想知道如何从 Applicative
中为 []
获得不同的语义,那么 Applicative
至少还有一个其他 List 实例:ZipList
λ: :i ZipList
newtype ZipList a = ZipList getZipList :: [a]
-- Defined in `Control.Applicative'
instance Functor ZipList -- Defined in `Control.Applicative'
instance Applicative ZipList -- Defined in `Control.Applicative'
此实例为其Applicative
实例提供压缩样式语义。
λ: getZipList $ (,) <$> ZipList [0..2] <*> ZipList ['A'..'C']
[(0,'A'),(1,'B'),(2,'C')]
这两个都是对Applicative
类型类的很好介绍,因为它们很容易获得,相当直观,有助于防止你犯错误,并表明在某些情况下,单个类型有多个实例类型类。
【讨论】:
asAppliedTo h x = let _=h x in h
?
... 但是,Prelude Control.Applicative> take 10 $ pure (,) <*> [1..] <*> [100,200..]
==> [(1,100),(1,200),(1,300),(1,400),(1,500),(1,600),(1,700),(1,800),(1,900),(1,1000)]
...
问题说该函数应该适用于无限列表,但其中一些不起作用,例如take 5 $ (,) <$> [0..] <*> [0..]
返回[(0,0),(0,1),(0,2),(0,3),(0,4)]
【参考方案4】:
您需要将oneList
应用到xs
和ys
。
oneList :: [a] -> [b] -> [(a, b)]
oneList [] _ = []
oneList (x:xs) (y:ys) = (x, y) : oneList xs ys
由于 Haskell 是惰性的,无限列表将自动工作。
【讨论】:
【参考方案5】:重要提示:请参阅下面 Will Ness 的评论。
您的问题暗示顺序无关紧要。 (但由于列表可能是无限的,因此顺序可能比您想象的更重要!)无论如何,如果顺序无关紧要,并且您遇到 列表推导,这是您可以使用的一种方法.这是一个例子。
λ> let xs = "abcdef"
λ> let ys = "ABCDEFGHI"
λ> [(x,y) | x <- xs, y <- ys]
[('a','A'),('a','B'),('a','C'),('a','D'),('a','E'),('a','F'),('a','G'),('a','H'),('a','I'),('b','A'),('b','B'),('b','C'),('b','D'),('b','E'),('b','F'),('b','G'),('b','H'),('b','I'),('c','A'),('c','B'),('c','C'),('c','D'),('c','E'),('c','F'),('c','G'),('c','H'),('c','I'),('d','A'),('d','B'),('d','C'),('d','D'),('d','E'),('d','F'),('d','G'),('d','H'),('d','I'),('e','A'),('e','B'),('e','C'),('e','D'),('e','E'),('e','F'),('e','G'),('e','H'),('e','I'),('f','A'),('f','B'),('f','C'),('f','D'),('f','E'),('f','F'),('f','G'),('f','H'),('f','I')]
请注意,首先打印所有涉及'a'
的元组,然后是涉及'b'
的元组,依此类推。为什么这很重要?好吧,假设列表是无限的。像这样的查询会立即返回:
(1,'a') `elem` [(x,y) | x <- [1..], y <- ['a'..]]
但是像这样需要很长时间:
(200000,'a') `elem` [(x,y) | x <- [1..], y <- ['a'..]]
如果顺序很重要,或者您没有遇到列表推导,或者不想使用它们,那么 luqui 的方法可能就是您正在寻找的。p>
【讨论】:
((2,'a') `elem` ...)
需要多长时间? (假设当然是无限字符类型(看起来确实如此))。
好点。如果任一列表是无限的,则需要永远。
只有第二个列表是无限的会导致问题。
@WillNess, Char
有很多值,但不是无限的。 (maxBound :: Char) --> '\1114111'
.【参考方案6】:
您可以通过使用列表推导非常简单地做到这一点。
zip :: [a] -> [b] -> [(a,b)]
zip [] _ = []
zip _ [] = []
zip as bs = [(a, b) | a <- as, b <- bs]
它适用于有限列表和无限列表。当然,您希望其中至少有一个是有限的,或者它只是 head as
和 bs
的所有组合。
> zip [0..2] ['A'..'C']
[(0,'A'),(0,'B'),(0,'C'),(1,'A'),(1,'B'),(1,'C'),(2,'A'),(2,'B'),(2,'C')]
> take 50 $ zip [0..] ['A'..'C']
[(0,'A'),(0,'B'),(0,'C'),(1,'A'),(1,'B'),(1,'C'),(2,'A'),(2,'B'),(2,'C'),(3,'A'),(3,'B'),(3,'C'),(4,'A'),(4,'B'),(4,'C'),(5,'A'),(5,'B'),(5,'C'),(6,'A'),(6,'B'),(6,'C'),(7,'A'),(7,'B'),(7,'C'),(8,'A'),(8,'B'),(8,'C'),(9,'A'),(9,'B'),(9,'C'),(10,'A'),(10,'B'),(10,'C'),(11,'A'),(11,'B'),(11,'C'),(12,'A'),(12,'B'),(12,'C'),(13,'A'),(13,'B'),(13,'C'),(14,'A'),(14,'B'),(14,'C'),(15,'A'),(15,'B'),(15,'C'),(16,'A'),(16,'B')]
> take 50 $ zip [0..] [1..]
[(0,1),(0,2),(0,3),(0,4),(0,5),(0,6),(0,7),(0,8),(0,9),(0,10),(0,11),(0,12),(0,13),(0,14),(0,15),(0,16),(0,17),(0,18),(0,19),(0,20),(0,21),(0,22),(0,23),(0,24),(0,25),(0,26),(0,27),(0,28),(0,29),(0,30),(0,31),(0,32),(0,33),(0,34),(0,35),(0,36),(0,37),(0,38),(0,39),(0,40),(0,41),(0,42),(0,43),(0,44),(0,45),(0,46),(0,47),(0,48),(0,49),(0,50)]
【讨论】:
不,这是不对的。见this answer above。另外,搜索“dovetailing”或“interleaving”。和"diagonals" 或“对角化”,例如here。还有this answer of mine.以上是关于Haskell-将两个列表放入一个元组列表中的主要内容,如果未能解决你的问题,请参考以下文章