今日指数项目之ETL数据业务开发(功能实现)

Posted Maynor学长

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了今日指数项目之ETL数据业务开发(功能实现)相关的知识,希望对你有一定的参考价值。

重点:ETL架构设计

逻辑架构

ETL整体架构设计
ETL指的是 Extraction, Transformation 与 Loading。
Extraction 指的是如何将数从来源端 (Source System) 中截取出来;
Transformation 指的是在截取出来的数据格式与数据仓储所需要的数据做转换;
Loading 指的是将数据加载至大数据平台中;
ETL服务器的作用有
(1)从源端抽取数据;
(2)加载数据到大数据集群;
(3)向集群下达数据处理的指令;
(4)ETL任务调度;
(5)数据预处理。 部分数据会在ETL服务器上先做预处理

平台整个体系架构分为以下几个层次:
1)源数据层:数据是整个大数据平台架构规划的基础,存储的批量数据包括存储网关委托日志、成交日志、行情数据和持仓数据等。

  1. 数据采集/接入:大数接平台通过FTP服务采集上游数据接口文件,利用大数据分布式数据库集群数据导入组件装载到大数据平台。

  2. 数据存储:

以上是关于今日指数项目之ETL数据业务开发(功能实现)的主要内容,如果未能解决你的问题,请参考以下文章

今日指数项目之数据实时业务开发(功能实现)

今日指数项目之数据个股开发(秒级行情业务)

今日指数项目之数据实时业务开发(需求说明)

今日指数项目之行情数据业务开发

今日指数项目之板块任务开发

今日指数项目之数据分时行情数据备份和个股涨跌幅开发