热点:

    开放架构浪潮之下的SONiC:构建动态可感知的智慧连接

      [  中关村在线 原创  ]   作者:徐鹏

          从万物互联到万物智联,无处不在的连接让指数级增长的数据有了可供分析的价值,而作为传输数据的管道,网络传输层的智能化、高性能、高可靠、高弹性逐渐成为各大厂商关注的焦点。对于腾讯、阿里这样的互联网巨头来说,超大规模的业务范围也带来了“超大规模”的挑战。其原因在于,用户的需求无时无刻都在变化,并且这种动态的需求不受时间、空间、地域的限制,需要基础设施具备“秒级”的反应能力。

          早在2016年的OCP峰会上,微软就发布了基于Debian GNU/Linux的开源交换机操作系统——SONiC,实现了数据控制面与转发面的分离,用户可以采购白牌交换机搭载SONiC实现不同的网络功能,SONiC使得用户能够更快的调试、修复并测试软件,通过改变软件策略和拓扑实现新的网络架构,让网络实践更为灵活。微软亚洲研究院首席研究员熊勇强在OCP China Day 2020上表示:“SONiC是业内第一个把服务容器化的技术,所有的网络服务如果越小,代码越容易维护,将来越容易升级,而且这些代码彼此之间是相互隔离的,有效避免了很多代码之间的耦合带来的质量和不可靠的问题。”

          数据显示,到2023年全球将有超过350亿台终端接入网络。5G的应用将给数据中心带来新的发展契机,也会对现有技术带来挑战。一方面更大规模的连接以及海量数据将推动云数据中心规模和设备密度的进一步加剧,另一方面,AI、视频等新兴应用普及很快,数据中心负载越来越多样和复杂,硬件在提高密度的同时,还需要具备更大的灵活性。

          社区协作持续技术领先

          要知道,每隔一年数据中心网络速度就会使吞吐量翻倍,从10Gbps增长到40Gb再到100Gb。2017年,100Gb端口的出货量超过40Gb。然而,云应用对网络吞吐的要求更高,以便实现扩展,400Gbps的规模商用不仅需要硅和光学器件的进步,更离不开软硬件的整体优化。例如在光纤通信方面,400G交换机既可以用在数据芯片中,也可以用在广域网上,广域网要求长距离传输进行支持。随着云计算对安全的要求越来越高,需要在长距离传输时对数据进行加密,要想提供完整的解决方案,不能只局限于芯片或是交换机,这就需要合作伙伴的协助。

          事实上,一直以来在数控分离层面的争议都没有间断,完全集中式或完全分布式的解决方案都被认为过于激进,让数控具备编程能力,同时又可以分离之后集中控制,是不少人都看好的一个方面,这或许也是SONiC的初衷之一。在微软首席项目经理刘欣看来,社区的协作对于SONiC的发展至关重要,“我们会吸纳社区成员的建议,开展了很多新的兴趣工作小组,每两个星期会讨论测试中发现的问题,发布小组非常专注的与社区成员在一起监督每一个版本的发布。”

          2016年正式上线的时候,SONiC的理念就是将传统交换机OS拆分成多个容器化组件,进而也定义了控制面的容器化架构,囊括了组件和编程接口。2017年微软对SONiC的性能进行了大幅升级,全面支持IDV,并且融合了更多的容器特性。之后,SONiC又逐渐开始在深度学习等AI特性上有了更多的尝试。

          此外,Microsoft Open Technologies开放了微软管理硬件操作的软件代码,例如服务器诊断,电源供应、风扇控制等等,这种开源的特性自然也延续到了SONiC,即所有软件功能模块都是开放的,可在GitHub上随时取用,不仅可以让用户在数小时内获得更新,还能够利用云端的能力进行深度遥测和自动化故障处理。可以看到,开源的技术路径延伸了SONiC的应用场景。

          支持Chassis就是一个很好的例子,由此能够满足广域网需求,获得更大速率和容量,以及更多的端口,以往复杂的部署环境可以通过SONiC的解耦形成标准网络协议来通信,便于用户使用网络监控的方式排查故障。在运维方面,SONiC把所有数据和配置都在数据库中进行了配置。

          在构建Chassis过程中,微软借鉴了很多传统Chassis的优点,例如把Chassis的功能放在红色的芯片上,让前端的SONiC互相通信,广播路由信息可能后端的SONiC完全不知道,如果前端SONiC互相知道路由信息,那么如何把包转发给彼此?微软使用了虚拟化隧道,根据每家网络的需求和痛点,在SONiC的开放平台上可以定制出一款让用户满意的解决方案。

          生态赋能加速产业实践

          近些年,有越来越多的合作伙伴加入了SONiC的生态,像Canonical使用SONiC作为Ubuntu的快照;Docker通过Swarm来管理SONiC容器,使其具备了大规模更新的能力;Mellanox使用SONiC来辅助Spectrum ASIC基于硬件的数据包生成功能,实现了故障诊断和故障排除。而作为SONiC的初期贡献者,英伟达也对SONiC提供了很多帮助。首先就是社区版SONiC,不仅为ASIC、Protocol都提供了支持,还为用户提供了丰富的OS选择。以满足不同应用的需求。

          “我们有一个‘双OS战略’。”英伟达(中国)网络产品事业部、中国区以太网产品总监王栋介绍称,“英伟达有自己的SONiC,这是立足于英伟达自己的硬件平台。用户如果使用这种双OS战略以后,可以进行一些测试,在相对适合的场景使用SONiC,为开放开源向OS演进提供一个起步点,我们希望这个模式可以更好的帮助用户向开源领域演化。”

          据了解,英伟达通过SONiC来释放Spectrum交换机中ASIC中基于硬件的数据包生成功能,解决了网络故障诊断和故障排除的准确性和效率问题。此外,浪潮开放网络交换机则是默认集成ONIE,支持按需加载OCP SONiC和其他网络操作系统,支持弹性的SPINE-LEAF网络架构,相对传统的3层网络架构,可靠性更高,可扩展更好。

          为了帮助客户向SONiC过渡,英伟达提供了测试、咨询、培训等全套的服务方案,并预计在今年晚些时候提供SONiC云服务,以提供大型的SONiC集群,帮助客户快速在L3层进行模拟。同时,英伟达也可以利用网络边缘或边缘计算紧凑型集群的交换机,以及用于AI领域200G为颗粒的交换机,满足这种大颗粒计算的需要。

          “我们可以向大家提供底层的全套解决方案,包括网卡、线缆、交换、软件等一系列的产品。在这之上,我们会构造一个高性能的基础设施。无论客户的基础设施是用于传统的云计算,还是新兴的机器学习和大数据,都能够满足需求。”王栋说,“我们还看到了更远的趋势,例如更先进的组网方式、端到端的无损应用,很多存储的解耦可以放在远端,让更多的系统可以快速访问,这些措施可以通过英伟达开放的硬件、开放的生态来实现,帮助客户获得高性能数据中心的价值。”

          从技术上来看,SONiC是基于SAI的,在没有SAI之前所有芯片都要通过自己的SDK与上层的软件通信,而SAI为SONiC提供了统一的API接口,向下可以对接不同的ASIC。有了SAI之后,适配ASIC的工作就由芯片厂商完成,使得白盒交换机厂商推出一款新产品所花费的时间大幅缩短, SONiC可以在确保与ASIC编程接口一致的情况下,不仅能提升速度和效率,还可以支持多个不同的ASIC,让ISP的硬件创新可以在不同平台上实现统一的软件优化。

          技术架构上的不断完善和完全在GitHub上开源,使得SONiC得到了OCP社区的广泛支持,也使云计算社区用户有了多样化的选择。其开放性使得客户能够灵活地在各平台或供应商之间切换,而无需更改软件栈。5年来,SONiC社区非常活跃,社群成员已经超过50个。与此同时,SONiC支持的平台以每年2-3倍的速度增长,已被超过10个云运营商和大型企业采纳,截至2020年初,装机容量已经接近400万个端口。

          多方协作探索未来应用

          早在2011年,腾讯就参与了OCP早期关于整机柜服务器技术标准的研讨。2018年2月,腾讯正式加入OCP开放计算项目。腾讯通过“凤凰项目”自研的NOS继承了SONiC的主要架构优点,相比传统交换机使用的嵌入式系统专用内核,其成熟的工具和良好的生态,给交换机的开发和维护工作带来了很多的便利。

          腾讯为数据中心应用设计了开放光网络,其专有硬件能够更好的适用于数据中心应用,构建标准化的管理体系,可以实现不同厂商设备的混合组网和统一管控,构建标准单元后,能够快速复制到整个数据中心的应用,以应对带宽的快速增长。不过随着系统部署越来越多,系统规模越来越大,腾讯的运营压力也随之增高。对此,腾讯希望通过构建常态化自动运行的光网络来缓解相应压力。

          这一过程中,自动化、持续演进、数据驱动的光网络特征至关重要。同时,腾讯还会对标准化的系统进行数据化改造,以提升系统的采集能力,使其具备一秒钟的集成能力,更加精细化的对系统进行全方位采集,实现整个系统的全景数据化。通过“数字引擎”,腾讯开放光网络实现了自动化控制架构,具备了控制、采集、感知和分析能力。

          “我们最终的目标是让系统能够高质量的运行,洞悉数据的真相。”腾讯科技(深圳)有限公司光网络架构师陈明刚表,“在算法方面,我们希望可以有更多的通用算法,包括硬件、系统分析、带宽的算法,并对这些算法进行分析,与数据中心获得数据进行打通。在这方面,我们希望可以与合作伙伴进行协作,发现数据背后的真相,一起来做更好的算法。”

          过去的六个月内,SONiC 社区已交付了约十几个新的功能集。 其中,有用于容器和主机通信的D-BUS、动态端口拆分、端口镜像等功能,还计划在未来六个月内交付更多新功能和增强功能。2020年3月,塔吉特百货、诺基亚、默升科技、Stordis、浪潮和是德科技加入了SONiC社区。未来,SONiC社区将会给业界呈现更多、更便捷的新功能,如支持400G网络、Chassis场景、Kubernetes管理、高速RDMA和安全模块等等。可以看到,从纯软件到快速的硬件演进,再到软硬件的高度融合,一个崭新的网络基础设施的技术时代正在来临。

    本文属于原创文章,如若转载,请注明来源:开放架构浪潮之下的SONiC:构建动态可感知的智慧连接//server.zol.com.cn/758/7581277.html

    server.zol.com.cn true //server.zol.com.cn/758/7581277.html report 8004       从万物互联到万物智联,无处不在的连接让指数级增长的数据有了可供分析的价值,而作为传输数据的管道,网络传输层的智能化、高性能、高可靠、高弹性逐渐成为各大厂商关注的焦点。对于腾讯、阿里这样的互联网巨头来说,超大规模的业务范围也带来了“...
    • 猜你喜欢
    • 最新
    • 精选
    • 相关
    0

    下载ZOL APP
    秒看最新热品

    内容纠错