当前位置:网站首页>阿里云祝顺民:算力网络架构的新探索
阿里云祝顺民:算力网络架构的新探索
2022-08-08 20:49:00 【凌云时刻】
近日,2022 中国算力大会在济南举办。会上,阿里巴巴集团研究员、阿里云云网络产品线总经理、达摩院 XG 实验室负责人祝顺民进行了题为《新型算力网络,赋能东数西算》的专题演讲。本文进行核心观点的分享。
东数西算作为国家战略,实现大范围的算力调度需要更高效的网络。《“十四五”数字经济发展规划》中明确提出:“优化升级数字基础设施:加快实施‘东数西算’工程,推进云网协同发展,提升数据中心跨网络、跨地域数据交互能力,加强面向特定场景的边缘计算能力,强化算力统筹和智能调度”等要求。
落实东数西算,需要推进云网协同和算力网络建设,而算力网络本质是解决全局算力资源接入和调度的问题,根据业务需求,在云、网、边之间按需分配和灵活调度计算资源、存储资源以及网络资源的新型信息基础设施。因此,应对算力的泛在化、多样化、服务化,网络调度需要更加弹性、更加敏捷、更加智能。
网络连接分布式算力资源 全局统筹支撑业务按需调度
算力网络首先要解决的是全网算力资源和应用的连接问题。将现有的网络基础设施和新型算力网络进行统一融合,实现一网接入各级算力资源。这对网络提出了两点新的诉求:
一是需要网络无处不达,提供从中线到边缘以及更多的全场景接入能力,让算力资源可以便捷接入;
二是需要提供一致的网络体验、一致的管理能力,覆盖接入网络、跨地域互联网络以及云上网络,从而保障应用连接一致的丝滑体验。
算力的弹性调度 需要更加弹性可扩展的网络
算力网络也要解决算力资源和算力需求不均衡的问题。现有的算力主要由中心算力枢纽、边缘算力集群和其他算力节点组成,算力的分布从架构、地域上存在一定的不均衡性。
因此,需要算力网络提供跨域弹性调度的能力,连接云/本地-边-端多级算力池,并能够快速进行跨域扩展。另一方面,算力网络还要具备带宽的弹性扩展能力,来承载多种算力应用场景的宽带宽需求,例如 SLA 的高可靠性、规模的伸缩性、时段的高峰性等。
算力服务化 需要云原生的网络助力其快速交付
正如王坚博士所说,我们正处在一个最好的时代,从电力的时代来到了算力的时代。从经济的角度来看,我们从用电力衡量一个国家、地区经济发展的能力阶段,到了今天用算力来衡量一个地方的经济发展,这是一个巨大时代的转变,从工业经济到数字经济,实际就是从电力经济到算力经济。算力的服务化就是要让算力像水、电资源一样随取随用,使算力服务成为一种公共服务。
那么,基于云原生构建的网络正好可以满足随需随用的需求,打破交付速度的瓶颈,提升流量的弹性伸缩能力,实现灵活的算力调度。并且,云原生网络可以更好地适应企业数据中心基础设施管理,跨云多集群有着互联互通以及边缘高性能轻量化等场景。
算力高效使用 离不开智能化的网络调度和管理
在新型的算力网络架构中,网络具备着核心价值——连接、贯通和输送。就如西气东输和南水北调工程,资源的大规模远距离的高效输送是核心难题,因此,如何让算力资源可以高效地使用起来,网络的智能化调度和管理是必不可少的。
根据业务的属性和分布地区等特点,智能调度可以覆盖云-边-端三级算力,兼顾区域发展和网络时延,实现算力资源最优配置,起到因地制宜的作用。
例如,温冷产业向西部迁移,这就需要西部地区的算力枢纽与京津冀算力枢纽跨地域长距离的网络覆盖连接,其后台加工、离线分析、存储备份等这类非实时算力需求对时延性没有过高的要求。而像工业互联网、金融证券、灾害预警、移动医疗等时效性要求较高的业务需要网络具备低延时高可靠的属性。
除了智能的网络调度,智能化的网络智能管理也可以通过算力量化,通过构建全局算力网络地图,将算力更便捷地进行数据采集、统计分析,算力交易等。
阿里云洛神云网络 算力网络架构的有力探索
洛神云网络是阿里云飞天云操作系统的核心组件。可以说,飞天洛神云网络的发展和未来方向,与算力网络的愿景不谋而合。
算力网络从底层的算力资源池出发,进行算力标准化和算力抽象;通过应用感知的算力调度来进行统一算力服务,支撑顶层的算力交易平台服务行业应用。对应到洛神云网络的技术架构,最底层完整覆盖应用-云-边-端一体的算力网络产品。在之上的云企业网的全球化智能云网调度,通过深度融合应用的云网络产品能力,已经支撑了公共服务、行业创新、科研教育等客户服务。
其中,任意规模的分钟级全网链路监测可以实时监测算力节点在网情况,刷新全网算力资源地图;毫秒级虚拟网络拓扑查询可以快速排除算网故障,提高算力在网时间和使用效率。可以说,阿里云飞天洛神云网络,是算力网络架构的有力探索。
展望
未来,算力和应用应该具备无感知网络。用户侧可以一点接入,随用随取;算力资源侧可以一网接入,“并网”计算。通过构建算力一张网,打破地域位置、规模、弹性等限制,将多级算力资源池进行智能调度,满足多样化算力需求,保障算力高效使用。
边栏推荐
- Flask 教程 第八章:粉丝
- Kotlin笔记-ForEach与ForEachIndexed区别
- 学习笔记:第三章 栈与队列
- The new database is online | CnOpenData information transmission, software and information technology service industry basic information data of industrial and commercial registered enterprises
- WPF主窗体调用 User32的SetWindowPos 设置窗体置顶会导致与其他窗体抢夺焦点的问题
- Kotlin study notes
- 劳务派遣业务流程图
- Kotlin实用的一些框架
- Flask 教程 第七章:错误处理
- Kotlin - learn the fifth day of the Handler
猜你喜欢
随机推荐
第十三届蓝桥杯(Web 应用开发)线上模拟赛【第九题】(知乎首页数据动态化)
瑞吉外卖项目实战Day06--手机端
解决执行Command报错fork/exec /xxx/yy: no such file or directory
1259 Alice and Bob
自定义MVC
编译原理——LR(1)分析程序(C#)
Simple Swing interface notes
The WPF main form calls User32's SetWindowPos to set the form to the top, which will cause the problem of grabbing the focus with other forms
分门别类输入输出,Go lang1.18入门精炼教程,由白丁入鸿儒,go lang基本数据类型和输入输出EP03
箭头函数this指向的解释
Kotlin委托属性知识点
com.alibaba.fastjson.JSONException: default constructor not found. class
高数_复习_第3章:一元函数积分学
WPF主窗体调用 User32的SetWindowPos 设置窗体置顶会导致与其他窗体抢夺焦点的问题
IO in Kotlin flow
fillder4 keeps prompting the system proxy was changed, watch me solve it
实践篇1:深度学习之----LetNet之tensorflow2的实现
fillder4不间断提示the system proxy was change,看我解决
矩阵相乘
【分享】如何在集简云平台自己进行应用开发?