项目简介
本项目参考美团、OPPO、知乎等大数据实时数仓项目架构,采用当前主流的实时数据处理框架Flink进行搭建,对接多种数据源,并实现了对结果数据的实时展示,与离线数仓可以无缝对接,真正实现了流批一体,可以无缝满足企业实时数据处理需求。
项目架构
Nginx + SpringBoot + Flume1.9 + Kafka2.4.1 + Flink1.2 + Canal HA + Redis + ElasticSearch + HBase2.0.5 + Phoenix + ECharts + MySQL5.7 + Maxwell + Kibana + ClickHouse + DataV
项目场景
可满足各种行业、不同规模的企业的实时数据处理场景,例如实时分析新用户注册人群、实时显示交易额、实时对账、实时预警等。
技术点
通过分层处理,让实时计算复用性更好,结构更清晰;通过结合MySQL动态配置表实现数据的动态分流;使用HBase + Redis 实现维度数据的管理与关联查询;提供针对不同情境的双流Join解决方案,优化双流Join解决方案;结合keyed state实现数据的去重、计算等功能;实现对于所有需求提供Flink代码和Flink SQL代码两种解决方案,可满足不同的企业开发需求;使用Table Function 扩展FlinkSQL功能;使用Flink CEP实现不同用户行为模式的识别;使用Clickhouse 实现宽表数据的存储,提高数据查询效率,提供即席查询解决方案;结合Springboot对接百度sugar实现数据可视化大屏展示。
项目特色
本项目采用最新的实时数据处理框架Flink进行搭建,对接多种数据源,并实现了对结果数据的实时展示,与离线数仓可以无缝对接,真正实现了流批一体,可以无缝满足企业实时数据处理需求。通过分层处理,让实时计算复用性更好,结构更清晰。通过结合MySQL动态配置表实现数据的动态分流。使用HBase+Redis 实现维度数据的管理与关联查询;提供针对不同情境的双流join解决方案,优化双流join解决思路;结合keyed state实现数据的去重、计算等功能;实现对于所有需求提供Flink代码和Flink SQL代码两种解决方案,可满足不同的企业开发需求;使用Table Function 扩展FlinkSQL功能;使用Flink CEP实现不同用户行为模式的识别;使用Clickhouse 实现宽表数据的存储,提高数据查询效率,提供即席查询解决方案;结合SpringBoot对接百度sugar实现数
课程目录
├──502_尚硅谷大数据之Spark
| └──502_尚硅谷大数据之Spark
| | ├──视频
| | └──资料
├──503_尚硅谷大数据之实时项目
| └──视频
| | ├──PART1
| | ├──PART2
| | ├──PART3
| | └──PART4
├──701_在线教育实战项目
| └──4.视频
| | ├──CDH
| | └──在线教育项目
├──大数据就业相关
| └──大数据就业相关
| | ├──01_就业指导
| | ├──02_优秀数仓架构图(发给学生参考)
| | ├──03_大厂内部技术分享
| | ├──04_企业开发资料
| | ├──05_埋点
| | ├──06_各个班级就业问题反馈
| | ├──尚硅谷大数据技术之高频面试题7.8.docx 24.71M
| | ├──尚硅谷大数据技术之企业真题V1.1.1.doc 11.87M
| | └──作业.txt 0.39kb
└──就业答疑
| └──就业答疑
| | └──就业答疑第1次