当前位置:网站首页>pyspark columns merge into one row
pyspark columns merge into one row
2022-08-10 18:19:00 【51CTO】
将 dataframe
利用 pyspark
列合并为一行,类似于 sql
的 GROUP_CONCAT
函数.例如如下 dataframe
:
Need according to the same row d
将 s
合并,想要的结果为:
利用 groupby
去实现就好,spark
里面可以用 concat_ws
实现,可以看这个 Spark中SQL列合并为一行,而这里的 concat_ws
The merger of strange, 官方文档的实例为:
The authors attempt to get:
不是想要的效果.而 collect_list
能得到相同的效果:
得到的结果为:
如果需要collect_list
多列,那么可以这么写:
得到的结果为:
边栏推荐
猜你喜欢
机器人控制器编程实践指导书旧版-实践六 LCD液晶显示(点阵)
【FAQ】【Push Kit】 华为怎么设置角标
高手问答第 290 期 —— SaaS产品经理从菜鸟到专家
requires ‘angle‘ attribute to be a multiple of 45
组合模式
【接入指南 之 直接接入】手把手教你快速上手接入HONOR Connect平台(中)
Flexsim 发生器设置label和颜色
多线程与高并发(五)—— 源码解析 ReentrantLock
【图像去雾】基于颜色衰减先验的图像去雾附matlab代码
Toronto Research Chemicals BTK抑制剂丨ACP-5197
随机推荐
R语言使用ggpubr包的ggbarplot函数可视化柱状图、设置add参数为mean_se和jitter可视化不同水平均值的柱状图并为柱状图添加误差线(se标准误差)和抖动数据点分布
Selenium - 如何使用隐式、显示、强制元素等待?
同一块中出现两个 * 就不能正常显示
「业务架构」业务能力的热图是什么,有啥用?
微信小程序富文本标签rich-text
Toronto Research Chemicals 双(乙酰丙酮)铂(II)
Word里表格跨页时自动断开,表格后留有空白部分,未布满整页,如何操作让表格上下页均匀布满?
c语言进阶篇:柔性数组
Colocate Join :ClickHouse的一种高性能分布式join查询模型
EasyGBS连接mysql数据库提示“can’t connect to mysql server”,如何解决?
H3C_堆叠(IRF)及链路聚合在项目中的综合应用
oracle11g体系结构
Go 语言快速入门指南:第四篇 与数据为舞之数组
640. 求解方程
容器化 | 在 S3 实现定时备份
网络可观测性:让您的网络监控更上一层楼|TechGenix
Toronto Research Chemicals BTK甜味剂配方丨D-Abequose
R语言ggplot2可视化:使用ggpubr包的text_grob函数和as_ggplot函数可视化文本段落(将指定文本段落可视化出来、指定文本段可视化为图像)、face参数指定文本的字体样式
1001 A+B Format (string processing)
Scala中使用 Jackson API 进行JSON序列化和反序列化