微软Azure团队致力于确保用户安排在Azure上的营业得以一连可靠地运行。。。。为了优化Azure的可靠性,,,,他们和微软亚洲研究院相助,,,,使用机械学习来展望潜在的故障,,,,并使用在线迁徙手艺提前缓解故障的影响。。。。
自2018年头以来,,,,Azure一直接纳在线迁徙手艺来应对种种各样的故障场景,,,, 好比硬件故障、机架维护和软件/BIOS更新等通例操作历程中泛起的过失等。。。。借助在线迁徙,,,,Azure能够从容处置惩罚故障,,,,并将故障的影响降低了50%。。。。
只管云云,,,,想要进一步拓展在线迁徙的应用领域,,,,仍需要探讨怎样使用系统中的有用展望信号来挖掘在线迁徙的用武之地。。。;;;;;;;诩褐卫硐低车闹种旨嗫厥,,,,微软研究员实现了基于机械学习的故障展望模子,,,,通过与自动在线迁徙手艺相连系,,,,该故障展望模子被应用在了磁盘故障、IO延迟和CPU频率异常等多种硬件故障情形的处置惩罚中。。。。
微软Azure团队与微软亚洲研究院携手打造的高精度故障展望的机械学习模子,,,,能够在泛起故障迹象之前就把正在运行的使命从“有危害”的机械上迁徙出去,,,,这也就意味着在Azure上运行的虚拟机比底层硬件还要可靠。。。。
使用这个模子,,,,在线迁徙对虚拟机的影响被控制到了最低。。。。从客户的反响来看,,,,虚拟机在线迁徙从未引发任何问题。。。。在线迁徙的历程中,,,,虚拟机的状态和所有网络毗连能够都坚持正常。。。。迁徙的最后阶段,,,,虚拟时机暂停几秒,,,,继而迁徙至新的主机。。。。只有少少量对性能敏感的使命可能会在虚拟机暂停前的几分钟内受到稍微影响。。。。
(泉源:微软亚洲研究院)
Copyright ? 918博天堂 版权所有 京ICP备05032414号
京公网安备11010802024551号