字符串出现次数的TopK问题

Posted vector6_

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了字符串出现次数的TopK问题相关的知识,希望对你有一定的参考价值。

字符串出现次数的TopK问题

给定一个字符串数组,再给定整数k,请返回出现次数前k名的字符串和对应的次数。

返回的答案应该按字符串出现频率由高到低排序。如果不同的字符串有相同出现频率,按字典序排序。

对于两个字符串,大小关系取决于两个字符串从左到右第一个不同字符的 ASCII 值的大小关系。

比如"ah1x"小于"ahb",“231”<”32“

字符仅包含数字和字母

class Solution {
public:
    /**
     * return topK string
     * @param strings string字符串vector strings
     * @param k int整型 the k
     * @return string字符串vector<vector<>>
     */
    //自定义小顶堆
    struct cmp
    {
        bool operator()(pair<string, int> pair1, pair<string, int> pair2)
        {
            return (pair1.second>pair2.second) || (pair1.second==pair2.second && pair1.first<pair2.first);
        }
    };
    
    vector<vector<string> > topKstrings(vector<string>& strings, int k) {
        vector<vector<string>> res;
        if(strings.size() ==0 || k==0)
            return res;
        unordered_map<string, int> stringMap;
        priority_queue<pair<string, int>, vector<pair<string, int>>, cmp> pq;
        for(int i=0; i<strings.size(); ++i)
        {
            if(stringMap.find(strings[i]) == stringMap.end())
            {
                pair<string, int> newPair = make_pair(strings[i], 1);
                stringMap.insert(newPair);
            }
            else
            {
                stringMap[strings[i]]++;
            }
        }
        
        for(auto it = stringMap.begin(); it!= stringMap.end(); ++it)
        {
            if(pq.size()<k)
            {
                pair<string, int> newPair = make_pair(it->first, it->second);
                pq.emplace(newPair);
            }
            else if(it->second > pq.top().second || (it->second==pq.top().second && it->first<pq.top().first))
            {
                pq.pop();
                pair<string, int> newPair = make_pair(it->first, it->second);
                pq.emplace(newPair);
            }

        }
        while(!pq.empty())
        {
            vector<string> perres{pq.top().first,to_string(pq.top().second)};
            res.emplace_back(perres);
            pq.pop();
            }
        reverse(res.begin(), res.end());
        return res;
        
    }
};

以上是关于字符串出现次数的TopK问题的主要内容,如果未能解决你的问题,请参考以下文章

TopK高频重复 算法题

spark 例子wordcount topk

topK问题 前K个高频元素 leetcode692

topK问题 前K个高频元素 leetcode692

Spark发现匹配字符串的出现次数

web代码片段