网络对于我们的生活意味着什么,可能并不是每个人都能概括出精辟的说辞,但现在让你从拥有网络的生活中脱离出来,大多数人都会感到手足无措。可以说网络已经和人们的日常生活、工作息息相关,通过网络我们得到了前所未有的信息量、经济得到了指数级别的提升,业务得以顺利、快捷地开展,网络管理是否得当直接决定了一切业务开展是否能得到保障。
不过,关于网络管理和业务系统之间是否有紧密地联系,或者依存度到底有多高,相信直至今日,大多数人还没有客观地理解。从表面上看,网络系统和业务系统貌似是行走在两条毫无交叉的轨道上,分属于不同的部门,实现不同的功能,着眼点也不同。IT部门管好设备,管好网络就算万事大吉,至于和业务部门有什么关系,是否会影响到业务部门的运作,很少有人会去关心,这就是现行的国内IT部门的普遍状态。
先不去评价我们是否应该花大力气去扭转这种局面,举一个简单的例子,大家都应该玩过或见过、听说过多米诺骨牌吧。多米诺骨牌是一种用木制、骨制或塑料制成的长方形骨牌。玩时将骨牌按一定间距排列成行,轻轻碰倒第一枚骨牌,其余的骨牌就会产生连锁反应,依次倒下。大家在欣赏骨牌坍塌瞬间所带来的震撼和不可思议的同时,是否还注意到一些别的问题?
给第一张牌一个很小的力,后面的牌就会连锁倒下,呈现的结果就是全面坍塌。这一环一环之间你可能看不到有直接的联系,但结果却是令人震撼的。而且这种传递的力的效果越来越强,被放大了。
回到之前我说的IT系统和业务系统的关系,也举一个小例子:有段时间,某一公司的一个业务系统运行很不稳定,经过彻查,发现不是业务系统本身的问题。无奈之下,决定把整个基础的IT系统也检查一遍。经过排查,发现机房温度过高,技术人员这才恍然大悟:网络设备跟人一样,温度高,人脑开始发昏。而环境温度高了,CPU负载变大,设备对响应和请求的延时自然加大。这会直接导致连接在网络设备上的服务器和主机,对外访问或者提供服务时,延时加大,建立在此基础上的业务系统的运行自然难以得到保障。加强机房空调制冷后,设备负载恢复正常,设备响应加快,网络恢复通畅,业务系统又回到了正常的工作状态。
这不就是个典型的多米诺效应吗?机房环境温度失控导致了设备运行不稳定,设备运行不稳定又造成了网络问题,而网络问题带来的通讯不畅也导致了业务系统的故障……这样的连锁反应使得一个看似不大的问题放大成一个严重的后果。
而我相信,这样的多米诺效应,其实离你并不远。只是更多的人不知道如何才能找到第一张骨牌,并不让它倒下。在上面的例子中,其实技术人员就是利用了IT运维管理软件发现了机房温度的报警,而报警的时间正好是业务系统出问题的那天,所以他们找到了第一张骨牌,却没有很好地找出这其中的联系,及时地制止它的倒下。
我想多米诺效应可以离你很远,关键在于你有没有认识到它的危害性,并做好充足地事前准备,规避这种风险,而不是在它到来时,眼睁睁地任凭你的业务系统崩溃下去。