前k个高频单词

Posted 红颜莫知己

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了前k个高频单词相关的知识,希望对你有一定的参考价值。

692. 前K个高频单词

给一非空的单词列表,返回前 k 个出现次数最多的单词。

返回的答案应该按单词出现频率由高到低排序。如果不同的单词有相同出现频率,按字母顺序排序。

示例 1:

输入: [“i”, “love”, “leetcode”, “i”, “love”, “coding”], k = 2
输出: [“i”, “love”]
解析: “i” 和 “love” 为出现次数最多的两个单词,均为2次。
注意,按字母顺序 “i” 在 “love” 之前。

示例 2:

输入: [“the”, “day”, “is”, “sunny”, “the”, “the”, “the”, “sunny”, “is”, “is”], k = 4
输出: [“the”, “is”, “sunny”, “day”]
解析: “the”, “is”, “sunny” 和 “day” 是出现次数最多的四个单词,
出现次数依次为 4, 3, 2 和 1 次。

注意:

假定 k 总为有效值, 1 ≤ k ≤ 集合元素数。
输入的单词均由小写字母组成。

方法一:哈希

  1. 我们将所有单词放入哈希表中,单词为key,个数为value
  2. 将哈希表中的数据按照key值放入到ArrayList中
  3. 将ArrayList中的数据按照key键对应的value值排序
  4. 截取数组中索引0-k

java代码:

class Solution {
    public List<String> topKFrequent(String[] words, int k) {
        Map<String,Integer> map = new HashMap<String,Integer>();
		//将所有单词放入哈希表中,单词为key,个数为value
        for (String word : words) {
            map.put(word,map.getOrDefault(word , 0) + 1);
        }
		// 将哈希表中的数据按照key值放入到ArrayList中
        List<String> list = new ArrayList<String>();
        for (Map.Entry<String,Integer> entry : map.entrySet()) {
            list.add(entry.getKey());
        }
		//将ArrayList中的数据按照key键对应的value值排序
        Collections.sort(list,new Comparator<String>(){
            public int compare(String word1 , String word2){
                return map.get(word1) == map.get(word2) ? word1.compareTo(word2) : map.get(word2) - map.get(word1);
            }
        });
        return list.subList(0,k);
    }
}

可能会有一些学者不懂这几行代码,我解释一下

Collections.sort(list,new Comparator<String>(){
            public int compare(String word1 , String word2){
                return map.get(word1) == map.get(word2) ? word1.compareTo(word2) : map.get(word2) - map.get(word1);
            }
        });

public int compare(String word1 , String word2)这是一个比较的方法
返回正整数,说明第一个参数小于第二个参数
返回0,相等
返回负整数,大于

word1.compareTo(word2)

这行代码和上述意思区别不大,只不过这个方法是对字符串进行字典排序
若参数字符串(word2)在对象(word1)后面,返回负整数
若相等,返回0
否则,返回正整数

方法二:优先队列

对于前k小或者前k大等问题我们一般都使用优先队列解决

  1. 创建一个小跟优先队列
  2. 我们将每个字符串插入到优先队列中,如果优先队列大小超过k,那就将优先队列顶端的元素弹出
  3. 最后优先队列中剩余的k个元素就是符合要求的元素

java代码:

class Solution {
    public List<String> topKFrequent(String[] words, int k) {
        Map<String,Integer> map = new HashMap<String,Integer>();

        for (String word : words) {
            map.put(word,map.getOrDefault(word , 0) + 1);
        }

        PriorityQueue<Map.Entry<String,Integer>> pq = new PriorityQueue<Map.Entry<String,Integer>>(
            new Comparator<Map.Entry<String,Integer>>(){
                public int compare(Map.Entry<String, Integer> entry1, Map.Entry<String, Integer> entry2) {
                return entry1.getValue() == entry2.getValue() ? entry2.getKey().compareTo(entry1.getKey()) : 
                entry1.getValue() - entry2.getValue();
                }
            });

            for (Map.Entry<String, Integer> entry : map.entrySet()) {
            pq.offer(entry);
            if (pq.size() > k) {
                pq.poll();
            }
        }
        List<String> result = new ArrayList<String>();
        while (!pq.isEmpty()) {
            result.add(pq.poll().getKey());
        }
        Collections.reverse(result);
        return result;
    }
}

对于优先队列的题要理解性的背,它的思路几乎都是固定的,再怎么变也变不出什么花样,若不懂什么小顶堆,请转博客https://blog.csdn.net/qq_43413774/article/details/115317985,其实理解了就是一句话,每个节点的值都小于左右节点的值,堆顶的值永远是最小的。

若有误,请指教!!!

以上是关于前k个高频单词的主要内容,如果未能解决你的问题,请参考以下文章

前k个高频单词

前k个高频单词

前k个高频单词

前k个高频单词

leetcode 692. 前K个高频单词

《LeetCode之每日一题》:35. 前K个高频单词