当前位置:网站首页>pyspark.sql之实现collect_list的排序
pyspark.sql之实现collect_list的排序
2022-08-09 14:55:00 【yisun123456】
通过利用pyspark.sql.Window实现collect_list的排序
from pyspark.sql.window import Window
window_ = Window.partitionBy("userid").orderBy("stay_start_time")
df42= df3.join(df41,'userid','inner').withColumn('lng_lat',concat_ws(',',col('stay_lng'),col('stay_lat')))\
.withColumn("lng_lats",F.collect_list("lng_lat").over(window_))\
.groupby('userid','lng','lat').agg(F.max("lng_lats").alias("lng_lats"))\
.withColumn("lng_lats",concat_ws(';',col('lng_lats')))\
.cache()
df42.show(truncate=False)
边栏推荐
猜你喜欢
随机推荐
cropperjs裁剪上传头像使用方法
[MySql] implement multi-table query - one-to-one, one-to-many
英语议论文读写02 Engineering
ImageWatch无法显示图像
.Net Core动态注入
你知道亚马逊代运营的成本是多少吗?
Simple analysis of regularization principle (L1 / L2 regularization)
二叉排序树的左旋与右旋
防关联浏览器对亚马逊测评有多重要?
PAT1027 打印沙漏
浅谈一下量化交易与程序化交易
NetCore 5.0连接MySql
LNK1123:转换到COFF期间失败:文件无效或损坏
众所周知亚马逊是全球最大的在线电子商务公司。如今,它已成为全球商品种类最多的在线零售商,日活跃买家约为20-25亿。另一方面,也有大大小小的企业,但不是每个人都能赚到刀! 做网店的同学都知道,
自定义指令,实现默认头像和用户上传头像的切换
Seize the opportunity of quantitative trading fund products, and quantitative investment has room for development?
对程序化交易系统接口有什么误区?
一些需要思考的物理问题
Talking about quantitative trading and programmatic trading
原子的核型结构及氢原子的波尔理论