当前位置:网站首页>五、业务数据分析
五、业务数据分析
2022-08-08 09:51:00 【TUJC】
一、项目背景
1、背景需求
前期将业务库中数据全部都落地到了Hbase当中的四张表(order_info", "renter_info", "driver_info", "opt_alliance_business)
里面去了,针对以上订单表,司机表,用户表,司管方表等,我们可以针对以上存储在Hbase当中的数据进行统计分析,
通过sparkSQL读取Hbase当中的数据,实现数据的统计分析,
然后将统计分析的结果,通过sparkSQL自定义输出源,保存到Hbase里面去。
这里涉及到技术点;
(1)自定义sparkSQL数据源来实现读取Hbase的数据,
(2)自定义sparkSQL的数据保存,将统计的结果保存到Hbase里面去
sql语句指标的统计:面试时候需要给别人说的
用户维度:新增用户,活跃用户,留存率,沉默用户
司机维度:订单完成率(平台完成率以及司机完成率)
热区订单统计:统计各个街道上面订单总数==> 使用街道编码
2、数据源描述
司机表driver_info:司机id ,电话,车辆id,、车辆类型、注册时间、
乘客表renter_info:乘客id, 乘客姓名,电话,注册时间
边栏推荐
- .json()的使用
- Kotlin协程:生命周期原理
- Code implementation of various kinds of attention
- 2万字50张图玩转Flink面试体系
- To make people's consumption safer, more assured and more satisfied
- 入职半个月的一些思考
- 安装oracle19c时报错DBT-50000
- English token preprocessing, used to process English sentences into words
- HMS Core分析服务智能运营6.5.1版本上线
- Elasticseach实践1
猜你喜欢
随机推荐
FRED应用:TMT MOBIE成像光谱仪的概念设计阶段杂散光分析
VMWare Esxi 虚拟系统数据存储扩容(增加容量)的简明教程
[Image Classification] 2021-CoAtNet NeurlPS
A concise tutorial on expanding (increasing capacity) of VMWare Esxi virtual system data storage
简单理解MVVM模型
22-08-06 西安 EasyExcel实现字典表导入、导出
mysql-cdc 换2.2.x 版本 怎么读不到 数据 咋回事
DOM操作--防抖和节流
Recommended download software
各位大佬想问下, flinkcdc采集oracle我看了下延迟大概两分钟左右,想问下有啥解决方法吗
Flink Record has Long.MIN_VALUE timestamp (= no timestamp marker). Is the time characteristic
Multi-scalar multiplication: state of the art & new ideas
hdu4635 Strongly connected(tarjan计算强连通通分量+缩点+思想)
斯坦福21秋季:实用机器学习【第5章】
LVS负载均衡群集及NAT模式群集
Go 函数与方法
MySQL中的锁机制详解
LeetCode:第305场周赛【总结】
软件测试的分类
MySQL redo log和undo log