scala huffman编码

Posted wqkant

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了scala huffman编码相关的知识,希望对你有一定的参考价值。

object HuffmanCode {

  private abstract sealed class Tree[A] {
    val freq: Int

    def toCode: List[(A, String)] = toCodePrefixed("")

    def toCodePrefixed(prefix: String): List[(A, String)]
  }

  private final case class InternalNode[A](left: Tree[A], right: Tree[A]) extends Tree[A] {
    val freq: Int = left.freq + right.freq

    override def toCodePrefixed(prefix: String): List[(A, String)] =
      left.toCodePrefixed(prefix + "0") ::: right.toCodePrefixed(prefix + "1")
  }

  private final case class LeafNode[A](element: A, freq: Int) extends Tree[A] {
    override def toCodePrefixed(prefix: String): List[(A, String)] = List((element, prefix))
  }

  //维护两个有序队列, 一个是子节点,一个是生成的节点
  def huffman[A](xs: List[(A, Int)]): List[(A, String)] = {
    import collection.immutable.Queue
    def dequeueSmallest(q1: Queue[Tree[A]], q2: Queue[Tree[A]]): (Tree[A], Queue[Tree[A]], Queue[Tree[A]]) = {
      if (q2.isEmpty) (q1.front, q1.dequeue._2, q2)
      else if (q1.isEmpty || q2.front.freq < q1.front.freq) (q2.front, q1, q2.dequeue._2)
      else (q1.front, q1.dequeue._2, q2)
    }

    def huffmanR(q1: Queue[Tree[A]], q2: Queue[Tree[A]]): List[(A, String)] = {
      if (q1.length + q2.length == 1) (if (q1.isEmpty) q2.front else q1.front).toCode
      else {
        val (v1, q3, q4) = dequeueSmallest(q1, q2)
        val (v2, q5, q6) = dequeueSmallest(q3, q4)
        huffmanR(q5, q6.enqueue(InternalNode(v1, v2)))
      }
    }
    huffmanR(Queue.empty.enqueue(xs sortBy (r => r._2)) map (e => LeafNode(e._1, e._2)), Queue.empty)
  }

  def main(args: Array[String]): Unit = {
    huffman(List(("a", 45), ("b", 13), ("c", 12), ("d", 16), ("e", 9), ("f", 5))) foreach(println)
  }

}

  

以上是关于scala huffman编码的主要内容,如果未能解决你的问题,请参考以下文章

搬家] 关于 Huffman 编码

huffman编码代码

学习数据结构笔记(10) --- [赫夫曼树(Huffman Tree)与赫夫曼编码(Huffman coding)]

编码译码基于matlab GUI霍夫曼Huffman编码译码含Matlab源码 1976期

贪心算法-Huffman编码

HDU 1053 [Entropy] Huffman编码