快速注册

实时数据采集可以使用Maxwell开源工具

Entropy 2021-09-30 12:26:15

一、Maxwell：

二、数据的时序：

三、Hbase特征（将实时数据同时存如到Hbase中）：

四、Phoenex（凤凰，长生鸟）简介

支持SQL（是Hbase的上一层），避免开放者直接使用Hbase原生API（学习门槛和使用成本较高）
支持/Support Spark引擎；开放者操作数据流程开发者通过数据同步工具（如DataX，开源的）将通过业务数据到 Kafka -> 开放者通过 Spark SQL -> 使用Phoenex JDBC的环境将数据写到 -> Hbase（这样开放者就不用关心底层的Hbase逻辑），存计算结果到Redis，用户到Redis中快速的读取数据；

五、数据校验：通过数据量的对比分析

六、谓词下推 = Where 条件

七、Monitor，常见的运维监控工具

八、Hbase底层是HDFS文件系统

九、Zookeeper使用，使用Hbase肯定是要部署Zookeeper的，配套使用进行集群资源调度；

十、调度都是通过Shell脚本进行调度的（因为底层是Linux系统）

回应转发赞收藏

还没人赞这篇日记

Entropy (北京)

要微笑呀 🙂 自深深处一、已婚二、AB型三、混过几家上市公司，也就...

Entropy的最新日记 · · · · · · ( 全部 )