当前位置:网站首页>Meet Alluxio, the "middleman" in MRS
Meet Alluxio, the "middleman" in MRS
2022-08-05 22:41:00 【HUAWEI CLOUD Developer Alliance】
摘要:Alluxio在mrs的数据处理生态中处于计算和存储之间,为上层spark、presto、mapredue、hive计算框架提供了数据抽象层,计算框架可以通过统一的客户端api和全局命名空间访问底层的存储系统,并切提供内存级的I/O吞吐率.
1. Alluxio的简介
Alluxio在mrs的数据处理生态中处于计算和存储之间,为上层spark、presto、mapredue、hive计算框架提供了数据抽象层,计算框架可以通过统一的客户端api和全局命名空间访问底层的存储系统,并切提供内存级的I/O吞吐率.
2. Alluxio的架构

Alluxio Master主要负责管理元数据,执行分布式存储元数据操作,Secondary master用户checkpoint日志(journal)和容错

Alluxio Worker负责存储块数据,每个worker管理自己存储的块的元信息,执行底层基于数据的存储操作

Client是应用与Alluxio交互的工具

3. Alluxio的使用
3.1 统一的命名空间和统一的客户端API
Alluxio提供统一的命名空间,用作底层文件存储系统数据的缓存,在不同的UFS实现数据的有效管理.使用透明的挂载,将Alluxio的命名空间和UFS命名空间之间保持一致,通过Alluxio访问UFS中的数据和直接访问UFS的数据,结果是一致的.Alluxio提供了客户端API,可以通过Alluxio实现对不同UFS的访问

3.2 MRS Alluxio配置底层存储系统
3.2.1 根挂载点类型
配置HDFS作为Alluxio的底层文件系统(开启Kerberos认证的安全集群不支持该功能).登录mrs manager页面,进入Alluxio的“全部配置”页面.修改参数“alluxio.master.mount.table.root.ufs”的值为“hdfs://hacluster/XXX/”.然后保存配置,然后重启配置过期的服务.
配置OBS作为Alluxio的底层文件系统.首先给集群配置有OBS OperateAccess权限的委托,用于访问obs.登录mrs manager页面,进入Alluxio的“全部配置”页面.修改参数“alluxio.master.mount.table.root.ufs”的值为“obs://<OBS_BUCKET>/<OBS_DIRECTORY>/”.然后保存配置,然后重启配置过期的服务.
根挂载只有一个,并且只能在启动服务前配置.
- 内嵌挂载点
内嵌挂载点可以在Alluxio根目录下的任何目录,可以在服务启动之后,通过客户端命令挂载,可以有多个挂载点.
MRS集群创建后,默认的底层存储地址是hdfs://hacluster/,即将HDFS的根目录映射到Alluxio.首先给集群配置有OBS OperateAccess权限的委托,用于访问obs.使用Alluxio客户端执行如下命令,将OBS容器内部的目录挂载到Alluxio的/obs目录.
alluxio fs mount /obs obs://<OBS_BUCKET>/<OBS_DIRECTORY>/
3.3 通过数据应用访问Alluxio(参考https://support.huaweicloud.com/cmpntguide-mrs/mrs_01_0760.html)
3.4 Alluxio web访问
Mrs Alluxio并没有在manager页面直接提供Alluxio的web访问链接.但是可以参照开源的方案,使用http://{alluxio_master_active_ip}:19999访问web页面.
3.4.1如何确定哪个master节点是active?
登录manager页面,打开Alluxio服务进入master实例查看或者使用客户端命令aluxio fs leader查看.


3.4.2如何访问Alluxio web页面?
可以通过给该节点绑定弹性ip通过公网访问(注意:需要在安全组放开19999端口).或者通过创建一个windows ECS,打通该节点到这台window ECS的网络,然后通过私有ip访问.


3.5 Alluxio元数据的备份

3.6 Alluxio的常用文件操作和管理员命令
3.6.1 常用文件操作

3.6.2 管理员命令
3.6.2.1 validateEnv工具命令
检查本地环境是否存在导致Alluxio部署的问题
alluxio validateEnv master
alluxio validateEnv worker
alluxio validateEnv all
配置设置完整性检查
alluxio validateConf
3.6.2.2 文件系统管理功能

backup:备份Alluxio元数据,默认根挂载目录的/alluxio_backups路径,也可以指定存储路径.
doctor:检查master和worker配置不一致的地方,需要在服务运行时运行.
getBlockInfo:需要提供block的id,查询块的信息
report:生成一个Alluxio集群总体的健康状态
边栏推荐
猜你喜欢

动态内存管理

登录注册(无封装)flask

CAN-Oe channel configuration method

Redies(四) session共享的优化
![[GKCTF 2021]easycms](/img/8d/1d83f81f2130a44e98f2cf3dfcf71c.png)
[GKCTF 2021]easycms

Nanoprobes丨GoldiBlot 用于 His-tag 检测方案

捷报又至!牛辅材斩获“2022年度最佳影响力品牌”大奖!
![60: Chapter 5: Develop admin management services: 13: Develop new functions of [Add/Modify Friendship Links, Interfaces]; (Add data to MongoDB) (To operate the Dao layer interface of MongoDB, you must](/img/af/c102dea7ab6290443d809e276cb0d5.png)
60: Chapter 5: Develop admin management services: 13: Develop new functions of [Add/Modify Friendship Links, Interfaces]; (Add data to MongoDB) (To operate the Dao layer interface of MongoDB, you must

(27)Blender源码分析之顶层菜单的关于对话框

APS Solutions for Rubber Manufacturing
随机推荐
[GKCTF 2021]easycms
60: Chapter 5: Develop admin management services: 13: Develop new functions of [Add/Modify Friendship Links, Interfaces]; (Add data to MongoDB) (To operate the Dao layer interface of MongoDB, you must
OCCT示例学习笔记3--Modeling项目
[esp32]esp8266连接小爱同学控制继电器
智慧的仓库管家——WMS
C#调用 kernel32.dll
[Raspberry Pi] Install OpenWrt on Raspberry Pi
CDGA|政务部门这样进行数据治理真不错!!!
如何在面试中介绍自己的项目经验
ESP8266-Arduino编程实例-红外寻迹传感器驱动
为什么五千块天价加急费都无法保证交期?
Qt使用wget下载文件案例
Qt uses wget to download file case
【双11狂欢的背后】微服务注册中心如何承载大型系统的千万级访问?
网页提示此站点不安全,还能打开吗?
Ext.js项目(一)
Axure Rp Activation Code
How to add custom syntax to MySQL
使用C语言代码实现学生信息管理系统怎么写
七夕时如何拯救躁动不安的心