hive中怎么求每个编号相同的中价格不超过最低价百分之30的数据

Posted 2023-05-12

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了hive中怎么求每个编号相同的中价格不超过最低价百分之30的数据相关的知识，希望对你有一定的参考价值。

hive中分组都是排序，去最大或最小几个，或者去分组内的和平均值等等，但是怎么求每一组数据中不超过最低百分之30的呢

参考技术A 先用子查询计算出每组的最低值

ccf-201909-04

技术图片

题意：有m个种类，每个种类有n个物品。每个物品有自己的种类、编号、分数。要在所有物品中选出不超过sum个的物品。

按以下方式选择：①按分数排序，分数大的在前 ②分数相同的，种类小的在前 ③分数相同，种类相同，编号小的在前

每个种类可以选择的物品数量不得超过count[i]个，总的可以选择的物品数量不得超过sum个

每个种类一行，输出该种类所选择的物品的编号。如何该种类没有物品被选，则输出-1

有三种操作：①增加结点　　②删除结点　　③输出所选择的物品编号

注意：m<=50，n<=30000，但是id<=10^9。虽然物品的种类只有50种，每类物品的个数只有30000，但是物品的编号有10^9个。（编号并不是按物品的个数来计算的）

　　　操作2只给type和id，所以需要映射。因为id<=1e9，所以用二维数组存a[type][id]=score是不可行的。要用unordered_map映射

思路：

①用 ID = type * 1e9 + id 唯一标识一个物品的编号，用set<Node> s存放所有的物品，在Node里定义 id, score, 以及set的排序方式。set会自动排序，所以不用sort一遍，否则会出错。

②用unordered_map<long long, set<Node>:: iterator> Map来存物品的ID和物品在set中的迭代器的映射，用来在删除set内部元素。向set增加元素时，用Map[ID]=s.insert(x).first来获取映射关系，时间复杂度O(1)。如果用遍历set的方法删除元素，O(n)，会超时。

③用vector来存每个type所选的物品的id。set的结构体里没有存type，id，那么要如何获取type和id？

因为ID = type * 1e9 + id，所以type = ID / 1e9, id = ID % 1e9，注意：因为ID是long long，所以设置const long long INF = 1e9

知识点：

*** insert函数的返回值是一个pair，first成员就是指向新插入的元素在set中位置的迭代器，second成员是一个bool表示这次插入操作是否成功

①关联容器包括：set、map
标准库提供set关联容器分为：
（1）按关键字有序保存元素：set(关键字即值，即只保存关键字的容器)；multiset(关键字可重复出现的set)；
（2）无序集合：unordered_set(用哈希函数组织的set)；unordered_multiset(哈希组织的set，关键字可以重复出现)。

②在set中每个元素的值都唯一，而且系统能根据元素的值自动进行排序。set中元素的值不能直接被改变。set内部采用的是一种非常高效的平衡检索二叉树：红黑树，也称为RB树(Red-Black Tree)。RB树的统计性能要好于一般平衡二叉树。

③set具备的特点：
（1）set中的元素都是排序好的
（2）set中的元素都是唯一的，没有重复的

④map:红黑树结构，自动排序

⑤map<class T1,class T2> ：存储T1->T2映射的键值对,map先按照T1升序排序，再按T2升序排序，其中T1,T2可以是任意类（如：int、string、char或自定义类）,T1值唯一，其插入删除的时间复杂度为O(log2)

⑥unordered_map<class T1,class T2>特性：仅存储T1->T2映射的键值对，T1值唯一，其插入和删除的时间复杂度为O(1)

⑦unordered_map 无序映射:比map快(用map会超时)

⑧unordered_map 在C++ 11 才可以用,否则会编译出错

#include <bits/stdc++.h> 
#define MAX 51

using namespace std;


struct Node{
    long long id;
    int score;
    bool operator < (const Node &b)    const{                //Set要内部排序,用struct写set，需要在struct内重写排序方法 
        if(score!=b.score)    return    score > b.score;
        else    return id < b.id; 
    }
};



set <Node> s;        //用set存放所有物品信息    
vector<int> r[MAX];
unordered_map<long long, set<Node>::iterator> Map;        //key:type*10^9 + id;  value:物品在set中的迭代器  ||用type * 1e9 +id 唯一标识一个物品的序号  
int m;        //物品种类 
int n;        //物品个数 
int sum;    //总的不能超过的个数 
int Count[MAX];        //每类物品不得超过的个数 
const long long INF = 1e9;　　　　　　//因为ID是long long，并且要取模,所以要将1e9也设置为long long 



void op(){
    int cont =0;
    for(int i=0;i<MAX;i++)
        r[i].clear(); 
    for(set<Node>::iterator it =s.begin();  it!=s.end(); it++){
        if(sum==0)    break;
        Node a=*it;
        int type =a.id / 1e9;
        int id =a.id % INF;            //long long % long long
        if(Count[type]>0){        //该种类还可以选 
            Count[type]--;
            r[type].push_back(id);
            sum--;
            }
        }    
    for(int i=0;i<m;i++){
        int len=r[i].size();
        if(len!=0){
            for(int j=0;j<len;j++){
                if(j!=len-1)    printf("%d ",r[i][j]);
                else printf("%d
",r[i][j]);
            }
        }
        else    printf("-1
");
    }
}


int main(){
    int type,id,score,c,q;
    Node x;
    while(scanf("%d %d",&m,&n)!=EOF){
        s.clear();
        memset(Count,0,sizeof(Count));
        for(int i=1;i<=n;i++){
            scanf("%d %d",&id,&score);    
            x.score=score;
            for(int j=0;j<m;j++){
                x.id=j*1e9 + id;    
                long long key=j*1e9+id;
                Map[key]=s.insert(x).first;
            }
        }
        scanf("%d",&q);
        for(int i=0;i<q;i++){
            scanf("%d",&c);
            if(c==1){
                scanf("%d %d %d",&type,&id,&score);
                x.id=type*1e9 + id;     x.score=score;
                long long key=type*1e9+id;
                Map[key]=s.insert(x).first;        //向Set插入元素 
            }
            else if(c==2){
                scanf("%d %d",&type,&id);                //set.erase()提供了4种重载，分别可以通过key，或者迭代器，或者迭代器范围来删除元素。
                long long k=type*1e9+id;
                s.erase(Map[k]);                //根据元素的迭代器，删除Set中的元素 
                Map.erase(k);                //删除物品在Map中的映射 
                                            //s.erase(Node{type,id,score});            //为什么出错？                        
            }
            else if(c==3){
                scanf("%d",&sum);
                for(int i=0;i<m;i++){
                    scanf("%d",&Count[i]);        //第i个种类不得超过count[i]个 
                }
                op();
            }
        }
    }
    return 0;
}

以上是关于hive中怎么求每个编号相同的中价格不超过最低价百分之30的数据的主要内容，如果未能解决你的问题，请参考以下文章

求最低价格

用oracle怎样查询每个部门的部门编号,部门名称,平均工资,最高工资和最低工资

有n个带编号的人和n个带编号的座位，求每个人都不坐在相同号码座位的方案数目

ccf-201909-04

在oracle中 “查询并显示每个部门的最高工资、最低工资、并按照部门编号降序排列” 怎么搞？

课堂练习---最低价格买书