2014年10月27日 Linux.

我们如何最小化NFV中的停机时间?

由查理·阿什顿

C.ashton.

在最近的SDN和OpenFlow世界大会在杜塞尔多夫,我被邀请做一个关于电信网络停机成本的演讲,以及这种财务影响可能会受到怎样的影响NFV.。这似乎是一个广泛感兴趣的话题,至少在nfv的关注范围内。所以在这篇文章中,我将总结我所涉及的一些信息,并建议我们作为一个行业如何应对这一挑战。

2013年10月,重读发布了综合分析,标题为“移动网络中断和降级”。您可以下载简短版本这里它提供了有关此主题的优秀信息。

这份报告包含了一些发人深省的数字,首先是这样一个事实网络服务提供商每年的断电成本约为150亿美元,通常占其年收入的1%至5%。这对他们的损益有着巨大的影响,特别是在网络基础设施成本激增的时候,因为视频流量的增长,而每个用户的收入持平或下降。ag亚博真人

该报告中有一个迷人的图表,说明了典型的一年中的服务提供商遭遇了多少“主要”中断。虽然27%的运营商表示,它们平均每年只有一到三大主要中断,而多达12%遭受15至20岁,而20%的遭受超过20次。显然,主要的中断不是不常见的事件。

关于这些网络中断的财务影响也很有趣。最大的影响是用户流失增加,当然,获得新客户,特别是高收入企业总是更昂贵的,而ag亚博真人不是保留现有的。其他重大影响是解决问题的业务费用以及损失从可计费服务捕获收入的能力。在直接财务影响方面略低,但仍然很重要,是直接向客户支付的退款的费用,不可避免地,与服务级别协议(SLA)问题有关的法律费用。

这份报告发布于2013年10月,可以肯定的是,它反映了传统的物理基础设施包含了微不足道的数量网络虚拟化。这些数字的推导是基于固定功能,垂直导向的设备,通常由电信设备制造商(TEM)开发,在每个架构的每个级别采用他们的专有技术。这种物理基础设施通常提供六个9(99.9999%)可靠性,这使得其运行的服务能够提供客户的五个9(99.999%),尤其是具有严格SLA的高收入企业。

那么行业移动到NFV时会发生什么,我们开始根据开放的硬件和软件标准更换使用水平导向的多供应商解决方案的固定功能设备?从服务可靠性的角度来看,NFV有可能使情况变得更糟(尽管有一种方法来解决它)。

作为新挑战的一个例子,基于nfv的基础设施提供的服务将由虚拟网络功能(VNFs)提供。在某些情况下,它们将是现有软件的虚拟化实现,而在其他情况下,它们将是全新的应用程序。不管怎样,它们将缺乏应用程序在当今物理基础设施中运行的可靠记录,它们将合并虚拟化的复杂性,我们可以肯定它们将更频繁地失败。

同样,NFV的核心原理是VM的动态重新分配服务器,机架和数据中心。这带来了更高的运行效率,并使应用程序的无缝扩大和模式作为交通模式的变化。它还增加了潜在的失败点的数量。

同样,交通流量通过新的,虚拟化系统将复杂,非常难以调试,即使是创新测试和监视应用程序,它们如何运行为VNF。无论这些正在开发的这些新工具的复杂程度如何,它都是一个安全的赌注,当发生中断时需要手动干预时,至少在NFV的早期调试它们需要更长的时间来调试它们。

那么我们如何解决这个问题,并确保服务提供商可以维护传统的,预期的服务水平正常运行时间?

关键是,即使使用到NFV的移动,网络基础架构也需要提供六种9的可靠性,使其能够快速地检测和响应硬件和软件问题,以便服务可以维护五个9的正常运行时间。这是“运营商级”可靠性的意义,并且它需要实现许多关键函数,例如:

  • 至少500公里的地理冗余,用于在自然灾害场景中继续运作,如地震;
  • 在不到一秒的时间内检测到失败的虚拟机(vm),具有自动重启和没有静默故障;
  • 管理程序中的10μ或更小的确定性中断延迟,允许CPE和访问功能的虚拟化;
  • 自动重启和从主机故障恢复;
  • 一个完全冗余、自动同步的网络控制平面;
  • 加速Live VM迁移,以确保计划维护期间的最小停机时间;
  • 电信级AAA(认证,授权和会计)安全;
  • 还有许多其他复杂的特性,不胜枚举。

您不能通过从最初为IT应用程序开发的企业级软件开始来实现这些具有挑战性的需求。这种类型的软件通常只能达到3个9(99.9%)的可靠性,相当于每年几乎9个小时的停机时间。这只是电信所需要的可靠性的千分之一。

幸运的是,对于行业而言,全载流量级NFV基础设施解决方案现已商购获得,并在SDN和Openflow World大会上展示,提供服务提供商,TEM和分析师的良好接收。这是确保网络中断由于这种新建筑概念的复杂性而产生的NFV的OPEX益处所需的解决方案。

文章最初发表于SDNCentral.com

以前的ETSI NFV概念证明#22
下一个一种用于飞机安全的物联网商业模式