2017年8月9日 Linux.

熟悉新的OpenStack热迁移特性吗?

由罗恩Breault

罗恩Breault

现在已经过了五年多的时间,我认为说我已经用现场迁移功能增加了Blasé;它只是做到它应该做的事情,它做得很好。但是,当你停止并考虑它时,OpenStack Live迁移真的是一个非凡的功能。现在尤其如此,尤其是对它的所有改进。请继续阅读以了解更多信息。

为什么我称实时迁移为非凡?这是因为“幕后”发生的一切使得它能够工作,也因为实时迁移所支持的。只需在Horizon中点击几下鼠标,运行在一台物理服务器上的VM就可以自动移动到另一台物理服务器上。“自动”听起来很简单,但要实现它需要做很多工作:在虚拟机运行时复制所有的静态和动态内存;在目标节点上复制并建立VM的完整网络基础结构;将本地块存储(如果使用)复制到目标节点;并短暂暂停,然后恢复VM以完成该过程。根据虚拟机的大小,整体迁移间隔可以以秒到分钟为单位。

实时迁移启用什么?各种重要的事情对于始终开启,生产云!实时迁移使物理服务器能够优雅地关闭并升级,而不脱机无托管的虚拟服务器。以类似的方式,可以在服务器上传送和部署重要主机安全更新或错误修复,而无需停止任何托管的VM。例如,在使用IN-Service升级功能时风河的钛云虚拟化软件产品,完整的云基础架构可以从一个版本升级到下一个,直播和生产,介于实时迁移的功能。

一个报告OpenStack创新中心最近发布了《高可用性热迁移》。这是一本很好的读物,详细介绍了他们对OpenStack的热迁移功能进行的全面研究和测试。虽然我不想阻止你阅读完整的报告,但对我来说,总结中的关键语句是:总之,我们能够证明现场迁移作品。“如果他们先问我,我可以为他们节省很多工作:钛云已经成功地利用实时迁移很多年了。虽然OpenStack发行版仍有一些问题需要解决,但钛云的Live Migration已经达到了一种艺术形式,我们一直在推动上游的变化,让它变得更好。通过独立验证第三方测试在美国,Titanium Cloud可以在不超过150ms的虚拟机停机时间内执行热迁移——我还没有听说过其他商业实现能达到这样的水平。

现在有最近发布的钛云,包括上游Openstack工作和Wind River更新,现场迁移比以往任何时候都更好!以下是我认为需要特别注意的两个改进:

性能增加。在我们最新的钛云发布下,我们的测试显示了实时迁移吞吐量显着地增加了。在我们的实验室中,我们已经看到吞吐量比以前的版本提高了5倍!这种更改可以对大型vm产生很大的影响,从而大大减少热迁移间隔。更快的迁移可能意味着减少计划维护活动的时间——操作员只需花费更少的时间等待Live migration完成。

Auto-Convergence。新的自动融合功能是一个特别酷的创新。Some VMs can take a long time to migrate due to heavy memory write activities – as fast as OpenStack is able to copy the ‘dirty’ memory contents of the VM from the source to the target, the VM is able to ‘dirty’ its memory again. This means OpenStack might barely keep up, or in some cases, might never catch up – the VM is simply just too busy writing to memory. The new Auto-Converge feature changes that by intelligently slowing down the virtual CPU on the VM so that it can’t dirty its pages as quickly. Since its memory writes are slower, Live Migration proceeds without stalling and is able to stay ahead of the VM. Very smart. This feature is optional, so if you don’t want to use it with certain VMs, the feature can be turned off; flexibility is key.

还有其他有趣的变化:动态更新最大实时迁移间隔的能力(一些VMS总是需要更长的时间来迁移到其他VMS - 这有助于避免超时);定期记录实时迁移吞吐量和估计停机时间;将超时的最大默认值减少800秒至180秒的超时,以命名几个。

随着所有这些变化都在一起,在最新发布的钛云下的实时迁移是我们迄今为止的最佳迁移。如果使用云管理关键基础结构,实时迁移是一个不可或缺的功能。如果您没有使用钛云,则无法获得现场迁移的最佳性能。联系您当地的风河销售经理或探望我们了解更多关于钛云和我们的实时迁移性能。

以前的持续创新,降低运营成本
下一个多核系统:悲伤的5个阶段