当前位置:网站首页>pyspark列合并为一行
pyspark列合并为一行
2022-08-10 17:50:00 【51CTO】
将 dataframe
利用 pyspark
列合并为一行,类似于 sql
的 GROUP_CONCAT
函数。例如如下 dataframe
:
需要按照列相同的列 d
将 s
合并,想要的结果为:
利用 groupby
去实现就好,spark
里面可以用 concat_ws
实现,可以看这个 Spark中SQL列合并为一行,而这里的 concat_ws
合并缺很奇怪, 官方文档的实例为:
作者自己尝试得到:
不是想要的效果。而 collect_list
能得到相同的效果:
得到的结果为:
如果需要collect_list
多列,那么可以这么写:
得到的结果为:
边栏推荐
- FFmpeg花屏解决(修改源码,丢弃不完整帧)
- Flexsim 发生器设置label和颜色
- 瑞虎8 PRO产品性能分析,一文读懂究竟何为“全域动力科技旗舰”
- WebRTC source code analysis nack detailed explanation
- 测试接口出现“data“: “Full authentication is required to access this resource“凭证已过期
- 「企业架构」企业架构师,解决方案架构师和软件架构师有何不同
- 报告详解影响英特尔10/11/12代酷睿处理器的ÆPIC Leak安全漏洞
- Mysql index, transaction and storage engine
- 企业如何通过北森HR SaaS 自动化管理员工账号生命周期
- leet面试150
猜你喜欢
Making Pre-trained Language Models Better Few-Shot Learners
D-Wave成功上市!量子计算商业化正在加速
requires ‘angle‘ attribute to be a multiple of 45
电路板ROHS测试报告怎么办理?电路板ROHS检测流程
报告详解影响英特尔10/11/12代酷睿处理器的ÆPIC Leak安全漏洞
「企业架构」什么是Zachman框架?
Toronto Research Chemicals BTK甜味剂配方丨D-Abequose
【2011】【论文笔记】用THz-TDS观察水树——
DASCTF2022.07 empowerment competition WEB topic recurrence
go语言的性能基准测试、性能优化测试和性能调优
随机推荐
hping3的使用
R语言创建列表数据(list):根据名称索引列表元素、双方括号访问单个元素、单方括号访问子列表
期货开户前要第一时间确认手续费
「企业架构」什么是Zachman框架?
EasyGBS连接mysql数据库提示“can’t connect to mysql server”,如何解决?
【接入指南 之 直接接入】手把手教你快速上手接入HONOR Connect平台(中)
Wuling Hongguang MINI EV, the only drawback is safety
Toronto Research Chemicals霉菌毒素分析丨伏马菌素B2
eager模式和graph模式 Tensorflow
机器人控制器编程实践指导书旧版-实践三 直流电机(执行器)
Return the next higher prime number
JNDI and RMI, LDAP
机器人控制器编程实践指导书旧版-实践四 步进电机(执行器)
【独立站运营】做社交媒体营销的两大关键点
R语言ggplot2可视化:使用ggpubr包的ggscatter函数可视化分组散点图、stat_mean函数在分组数据点外侧绘制凸包并突出显示分组均值点、自定会均值点的大小以及透明度
讯飞翻译机抢镜背后,跨语种沟通迈入全新时代
Mysql索引、事务与存储引擎
Scala中使用 Jackson API 进行JSON序列化和反序列化
Flexsim 发生器和暂存区设定临时实体流颜色和端口
Toronto Research Chemicals农药检测丨Naled-d6