当前位置:网站首页>pyspark columns merge into one row
pyspark columns merge into one row
2022-08-10 18:19:00 【51CTO】
将 dataframe
利用 pyspark
列合并为一行,类似于 sql
的 GROUP_CONCAT
函数.例如如下 dataframe
:
Need according to the same row d
将 s
合并,想要的结果为:
利用 groupby
去实现就好,spark
里面可以用 concat_ws
实现,可以看这个 Spark中SQL列合并为一行,而这里的 concat_ws
The merger of strange, 官方文档的实例为:
The authors attempt to get:
不是想要的效果.而 collect_list
能得到相同的效果:
得到的结果为:
如果需要collect_list
多列,那么可以这么写:
得到的结果为:
边栏推荐
- 微服务架构-实现技术之六大基础组件:服务通信+事件驱动+负载均衡+服务路由+API网关+配置管理
- 施工企业数字化转型解决方案设计思路
- 容器化 | 在 S3 实现定时备份
- 【图像去雾】基于颜色衰减先验的图像去雾附matlab代码
- MySQL数据高级查询之连接查询、联合查询、子查询[通俗易懂]
- pip安装时 fatal error C1083 无法打开包括文件 “io.h” No such file or directory
- Scala中使用 Jackson API 进行JSON序列化和反序列化
- R语言创建列表数据(list):根据名称索引列表元素、双方括号访问单个元素、单方括号访问子列表
- 机器人控制器编程实践指导书旧版-实践七 无线通信(网络)
- Before opening a futures account, you must confirm the handling fee as soon as possible
猜你喜欢
随机推荐
【独立站运营】做社交媒体营销的两大关键点
Toronto Research Chemicals农药检测丨Naled-d6
redis分布式锁
企业如何通过北森HR SaaS 自动化管理员工账号生命周期
Mysql索引、事务与存储引擎
Allegro软件Shape菜单下的每个命令的含义
pip install fatal error C1083 cannot open include file "io.h" No such file or directory
文档标题能否支持公式
ZLMediaKit 服务器源码解读---RTSP推流拉流
机器人控制器编程实践指导书旧版-实践八 机器人综合设计
H3C_堆叠(IRF)及链路聚合在项目中的综合应用
Active users of mobile banking grew rapidly in June, hitting a half-year high
【2015】【论文笔记】等离子光混合器THz辐射的光谱——
CAS客户端对接
php7中使用“??”运算符
[JMeter]Beanshell解析Json格式的接口响应数据
EasyGBS连接mysql数据库提示“can’t connect to mysql server”,如何解决?
自动化测试 RobotFramework安装以及使用教程
1001 A+B Format (string processing)
【接入指南 之 直接接入】手把手教你快速上手接入HONOR Connect平台(中)