当前位置：网站首页>一站制造项目及Spark核心面试，220808，，，

一站制造项目及Spark核心面试，220808，，，

2022-08-09 07:06:00 【啊六六六】

RANGE BETWEEN

row BETWEEN

用到了默认的windowframe

比率求值，

直接用where datediff( nlogindate-logindate)=n-1来判断也ok吧？

set开启本地模式，dg，

每个用户最大连续登陆次数

，

多看多练，规律sql题，，经验积累，，

把主讲的项目，写到最新日期吗？

对的，

项目时间逆序放，

RDD设计类似于Hive中表

返回值是不是一个RDD

reduce 触发

reduceByKey 转换

日志下载，放在hdfs，historyserver下，映射，，

driver只会在，客户端/从节点

每个stage中最后一个rdd的分区数

Stage中最后一个或者最小RDD分区数

1-Spark不是纯内存式计算，Shuffle过程依旧是使用磁盘的

2-只要是计算，都是基于内存计算

3-Spark积极使用内存，窄依赖都在内存中完成、允许内存中缓存RDD，相比MR，大部分的中间结果都是在内存中直接传递的

Wordcount代码是唯一一个面试中写的代码

Wordcount SQL,DSL,RDD算子代码，怎么写？？？？

举例子，设计个程序，spark资源管理？？？

reduceByKey、foldByKey，map端聚合，

设计谓词下推例子？？？

重新写代码，要么原有的上面修改，，

两年前：构建平台、平台产出价值

新需求：更好的管理，挖掘更多价值

RANGE BETWEEN？？？

row BETWEEN？？？

Wordcount SQL,DSL,RDD算子代码，怎么写？？？？

设计谓词下推例子？？？

产品表（100万），商品详情表名称（10万），

SET hive.optimize.ppd=true，先过滤再join

（明天问老师？？） spark set开启本地模式属性，dg，

版权声明
本文为[啊六六六]所创，转载请带上原文链接，感谢
https://blog.csdn.net/m0_48941160/article/details/126221215

边栏推荐

猜你喜欢

随机推荐