前k个高频单词
Posted 红颜莫知己
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了前k个高频单词相关的知识,希望对你有一定的参考价值。
692. 前K个高频单词
给一非空的单词列表,返回前 k 个出现次数最多的单词。
返回的答案应该按单词出现频率由高到低排序。如果不同的单词有相同出现频率,按字母顺序排序。
示例 1:
输入: [“i”, “love”, “leetcode”, “i”, “love”, “coding”], k = 2
输出: [“i”, “love”]
解析: “i” 和 “love” 为出现次数最多的两个单词,均为2次。
注意,按字母顺序 “i” 在 “love” 之前。
示例 2:
输入: [“the”, “day”, “is”, “sunny”, “the”, “the”, “the”, “sunny”, “is”, “is”], k = 4
输出: [“the”, “is”, “sunny”, “day”]
解析: “the”, “is”, “sunny” 和 “day” 是出现次数最多的四个单词,
出现次数依次为 4, 3, 2 和 1 次。
注意:
假定 k 总为有效值, 1 ≤ k ≤ 集合元素数。
输入的单词均由小写字母组成。
方法一:哈希
- 我们将所有单词放入哈希表中,单词为key,个数为value
- 将哈希表中的数据按照key值放入到ArrayList中
- 将ArrayList中的数据按照key键对应的value值排序
- 截取数组中索引0-k
java代码:
class Solution {
public List<String> topKFrequent(String[] words, int k) {
Map<String,Integer> map = new HashMap<String,Integer>();
//将所有单词放入哈希表中,单词为key,个数为value
for (String word : words) {
map.put(word,map.getOrDefault(word , 0) + 1);
}
// 将哈希表中的数据按照key值放入到ArrayList中
List<String> list = new ArrayList<String>();
for (Map.Entry<String,Integer> entry : map.entrySet()) {
list.add(entry.getKey());
}
//将ArrayList中的数据按照key键对应的value值排序
Collections.sort(list,new Comparator<String>(){
public int compare(String word1 , String word2){
return map.get(word1) == map.get(word2) ? word1.compareTo(word2) : map.get(word2) - map.get(word1);
}
});
return list.subList(0,k);
}
}
可能会有一些学者不懂这几行代码,我解释一下
Collections.sort(list,new Comparator<String>(){
public int compare(String word1 , String word2){
return map.get(word1) == map.get(word2) ? word1.compareTo(word2) : map.get(word2) - map.get(word1);
}
});
public int compare(String word1 , String word2)这是一个比较的方法
返回正整数,说明第一个参数小于第二个参数
返回0,相等
返回负整数,大于
word1.compareTo(word2)
这行代码和上述意思区别不大,只不过这个方法是对字符串进行字典排序
若参数字符串(word2)在对象(word1)后面,返回负整数
若相等,返回0
否则,返回正整数
方法二:优先队列
对于前k小或者前k大等问题我们一般都使用优先队列解决
- 创建一个小跟优先队列
- 我们将每个字符串插入到优先队列中,如果优先队列大小超过k,那就将优先队列顶端的元素弹出
- 最后优先队列中剩余的k个元素就是符合要求的元素
java代码:
class Solution {
public List<String> topKFrequent(String[] words, int k) {
Map<String,Integer> map = new HashMap<String,Integer>();
for (String word : words) {
map.put(word,map.getOrDefault(word , 0) + 1);
}
PriorityQueue<Map.Entry<String,Integer>> pq = new PriorityQueue<Map.Entry<String,Integer>>(
new Comparator<Map.Entry<String,Integer>>(){
public int compare(Map.Entry<String, Integer> entry1, Map.Entry<String, Integer> entry2) {
return entry1.getValue() == entry2.getValue() ? entry2.getKey().compareTo(entry1.getKey()) :
entry1.getValue() - entry2.getValue();
}
});
for (Map.Entry<String, Integer> entry : map.entrySet()) {
pq.offer(entry);
if (pq.size() > k) {
pq.poll();
}
}
List<String> result = new ArrayList<String>();
while (!pq.isEmpty()) {
result.add(pq.poll().getKey());
}
Collections.reverse(result);
return result;
}
}
对于优先队列的题要理解性的背,它的思路几乎都是固定的,再怎么变也变不出什么花样,若不懂什么小顶堆,请转博客https://blog.csdn.net/qq_43413774/article/details/115317985,其实理解了就是一句话,每个节点的值都小于左右节点的值,堆顶的值永远是最小的。
若有误,请指教!!!
以上是关于前k个高频单词的主要内容,如果未能解决你的问题,请参考以下文章