vmotion后,虚拟机网络出现长时间down
最近我遇到一个问题,使用vmotion功能将虚拟机从一个刀片服务器到另一个刀片服务器,迁移后虚拟机网络出现长时间down,大约要过3~5分钟后,才能恢复,但是这个故障出现是有一定的概率的,不是100%出现的,我想问下,出现这个故障的原因是???实在没头绪~ 可能的话,用主机配置文件来对比一下几台Esxi上配置的差异,看看是不是两边虚拟交换机的安全设置不一样? 单个虚拟机网络还是整个虚拟机网络?Down掉的时候,是不是整个物理交换上的所有网络都不可用? 有环路? 3-5分钟是正常的,你的VM是开机迁移还是关机迁移的?开机迁移需要同步内存,时间比较长(取决于你的VM分配的内存和在页面里面的文件) 问题可能出在你的交换机上,迁移后虚拟机网卡对应的HOST主机网卡发生变化,交换机上MAC地址没有及时更新,导致无法通讯。
要到ARP老化时间到达后,交换机更新MAC地址表才能够重新通讯。
你可以做个实验,每次迁移后,立即到交换机上RESET ARP记录,看是不是能够解决问题。 ARP表大概1个小时还是两个小时才会老化吧 本帖最后由 seanlaser 于 4-23-2012 09:26 编辑
开机vMotion只有在迁移最后的bitmap的时候才会发现VM网络中断,3-5分钟是不正常的。之前的内存snapshot复制是不会中断网络的。除非你的VM忙到复制snapshot时更新了全部的内存内容。即使如此按照vMotion要求的最低千兆网络,9~10秒/G的复制时间来算,你说3~5分钟断,这个VM在snapshot复制期间变更了18~30G的内存内容?你这个VM内存到底多大?
检查你的vMotion路径上的设备质量到底是否满足vMotion的要求,可能是复制的实际带宽偏低造成的。
另外看看是否有部分网卡有性能争用,上述不是100%出现的话有可能是有问题的时候使用的正是性能争用网卡。可能的话尽量给vMotion分配单独的千兆网卡。
页:
[1]