Poseidon日志搜索平台调研笔记

Posted 杨鑫newlfe

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Poseidon日志搜索平台调研笔记相关的知识,希望对你有一定的参考价值。

简介

Poseidon 波塞冬,是希腊神话中的海神,在这里寓意着海量数据的主宰者。

Poseidon系统是一个日志搜索平台,可以在数百万亿条、数百万PB大小的日志数据中快速分析和检索特定字符串。

360公司是一个安全公司,在追踪APT(Advanced Persistent Threat,高级持续威胁)事件时,经常需要在海量的历史日志数据中检索这些信息,

例如某个恶意样本在某个时间段内的活动情况。在Poseidon系统出现之前,都是写Map/Reduce计算任务在Hadoop集群中中计算,

一次任务所需的计算时间从数小时到数天不等,大大制约了APT事件的追踪效率。

Poseidon系统就是解决这个需求,能在几秒钟内从数百亿条规模数据中找到我们需要的数据,大大提高了效率;同时,这些数据不需要额外的存储,依然存放在Hadoop系统中,节省了大量的存储和计算资源。该系统可以应用于任何结构化和非结构化海量(从万亿到千万亿规模)数据的查询检索需求。

系统架构图

所用技术

  • 倒排索引:构建日志搜索引擎的核心技术。

  • Hadoop:用于存放原始数据

以上是关于Poseidon日志搜索平台调研笔记的主要内容,如果未能解决你的问题,请参考以下文章

Poseidon 系统是一个日志搜索平台——认证看链接ppt,本质是索引的倒排列表和原始日志数据都存在HDFS,而文档和倒排的元数据都在NOSQL里,同时针对单个filed都使用了独立索引,使用MR来

POSEIDON: A New Hash Function for Zero-Knowledge Proof Systems 学习笔记

日志收集系统Flume调研笔记第2篇 - Flume配置及使用实例

ELK日志平台---老男孩教育笔记

基于Java的开源日志库log4j调研笔记

Spark调研笔记第1篇 - Spark简介