日志统计

Posted chiweiming

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了日志统计相关的知识,希望对你有一定的参考价值。

标题:日志统计

小明维护着一个程序员论坛。现在他收集了一份"点赞"日志,日志共有N行。其中每一行的格式是:

ts id  

表示在ts时刻编号id的帖子收到一个"赞"。  

现在小明想统计有哪些帖子曾经是"热帖"。如果一个帖子曾在任意一个长度为D的时间段内收到不少于K个赞,小明就认为这个帖子曾是"热帖"。  

具体来说,如果存在某个时刻T满足该帖在[T, T+D)这段时间内(注意是左闭右开区间)收到不少于K个赞,该帖就曾是"热帖"。  

给定日志,请你帮助小明统计出所有曾是"热帖"的帖子编号。  

【输入格式】
第一行包含三个整数N、D和K。  
以下N行每行一条日志,包含两个整数ts和id。  

对于50%的数据,1 <= K <= N <= 1000  
对于100%的数据,1 <= K <= N <= 100000 0 <= ts <= 100000 0 <= id <= 100000  

【输出格式】
按从小到大的顺序输出热帖id。每个id一行。  

【输入样例】
7 10 2  
0 1  
0 10    
10 10  
10 1  
9 1
100 3  
100 3  

【输出样例】
1  
3  

资源约定:
峰值内存消耗(含虚拟机) < 256M
CPU消耗  < 1000ms


请严格按要求输出,不要画蛇添足地打印类似:“请您输入...” 的多余内容。

所有代码放在同一个源文件中,调试通过后,拷贝提交该源码。
不要使用package语句。不要使用jdk1.7及以上版本的特性。
主类的名字必须是:Main,否则按无效代码处理。

解题思路:

逐个id进行审查,将当前审查的id的时间点全部提取出来,进行升序排序后运用尺取法。

两个端点初始条件:l=r=0;

当点赞数等于K时,判断当前区间右端点是否小于(不能等于)区间左端点+D。

不满足区间条件的话左端点l自增,右端点r继续往前推进,当点赞数等于K同样再次判断即可。

可以用set集合计算一共有多少个不同的id,然后用iterator遍历set集合分别取出每个id对应的时间点放入ArrayList里面,

可以用Collections.sort(ArrayList)对ArrayList里面的元素进行排序。

import java.util.ArrayList;
import java.util.Collections;
import java.util.HashSet;
import java.util.Iterator;
import java.util.Scanner;

public class Main {
    
    private static int N;
    private static int D;
    private static int K;
    private static int array[][];

    public static void main(String[] args) {
        Scanner reader=new Scanner(System.in);
        N=reader.nextInt();
        D=reader.nextInt();
        K=reader.nextInt();
        array=new int[N][2];
        HashSet set=new HashSet();
        for(int i=0;i<N;i++){    //input data
            array[i][0]=reader.nextInt();
            array[i][1]=reader.nextInt();
            set.add(array[i][1]);    //统计id
        }
        Iterator ite=set.iterator();
        ArrayList list=new ArrayList();
        while(ite.hasNext()){
            int id=(int)ite.next();
            if(solve(id)){
                list.add(id);
            }
        }
        Collections.sort(list);
        for(int i=0;i<list.size();i++){
            System.out.println(list.get(i));
        }
    }
    
    public static boolean solve(int id){    //判断每个id的情况
        ArrayList list=new ArrayList();
        for(int i=0;i<N;i++){
            if(array[i][1]==id){
                list.add(array[i][0]);    //将相应点赞日志放入动态数组,方便使用尺取法
            }
        }
        Collections.sort(list);    //排序
        int l=0;
        int r=0;
        int num=0;
        while(true){
            while(r<list.size() && num<K){
                num++;
                r++;
            }
            if(num<K){
                return false;
            }else{    //判断区间长度
                if((int)list.get(r-1)<(int)list.get(l)+D){
                    return true;
                }else{    //不满足区间长度
                    l++;
                    num--;
                }
            }
            
        }
        
    }
}

自创测试数据:

10 2 2
0 1
10 1
20 1
30 1
40 1
50 1
60 1
61 1
70 1
80 1

输出:

1

有错误欢迎指正!

以上是关于日志统计的主要内容,如果未能解决你的问题,请参考以下文章

[ptyhon] 日志采集分析示例

我的Android进阶之旅NDK开发之在C++代码中使用Android Log打印日志,打印出C++的函数耗时以及代码片段耗时详情

c_cpp 快速代码片段,用于在统计(阻止)/ dev / rdsk中的设备时验证fstat64和stat64的行为。

python 来自nginx访问日志的HTTP状态代码统计信息

webstorm代码片段的创建

通过常用功能更新不同的阵列