预测智能: 管理复杂基础架构的锁钥

时间:2022-08-25 04:42:12

预测智能: 管理复杂基础架构的锁钥

预测智能技术可以自动检测事件的解决优先级,从而为业务服务提供最佳保障。例如,你可以自动检测到一台路由器正支持一个小型销售办事处,而另一台路由器则支持着整个欧洲客户群。

一家制药公司节省了700万美元的软硬件购置费用,将虚拟机密度提高了3倍,并在3个月内实现了投资回报;一家跨国医疗集团将关键事件的处理时间缩短了68%,平均每年节省120万美元。这些企业是如何取得上述成果的呢?答案就是预测智能技术。

北美金融服务公司

一家北美大型金融服务公司A,拥有诸多业务服务,包括网上银行、个人理财咨询、信用卡、抵押贷款等,各项业务每年的增长率目标均在30%以上。为支持快速增长,IT运维平均每年需要增加200台服务器到现有的异构服务器基础架构中(其应用服务器部署五种操作系统,包括Windows和Unix系统等),同时还需要扩大现有IT资源利用率或增加IT工作人员。

虽然这些方法可以支持A公司的整体业务增长,但IT成本却在迅速增加。另一方面,A公司的整体服务器利用率仅为15%~20%,效率低下。因此,A公司于2005年启动虚拟化计划。

据A公司一名IT经理介绍,IT部门依赖系统管理员定期提供容量信息,但这些快照信息仅记录了某一时刻的情形。这种分散的报告和监测使IT人员只能猜测容量走势,不能掌握真实情况。此外,这种快照信息无法预测服务器利用高峰期。IT部门只能依靠提供超额容量避免故障,这也加剧了业务有效增长的难度。如果服务器停机,IT人员需要花费大量时间寻找故障源,隔离问题服务器,这将造成数小时系统宕机,导致众多客户业务中断,影响业务效益。

为履行客户服务承诺、确保IT成本可控,该公司部署了BMC容量管理解决方案(包括BMC Performance Assurance和 Solution Labs Inc. Performance Surveyor),用以对分配给该公司三个级别(白金级、黄金级以及白银级)付费客户的服务器进行监测。BMC容量管理解决方案在工作量分析、预测建模以及多平台支持(包括虚拟化平台)方面有着独特的优势。

通过BMC解决方案,该公司能监测系统容量,在错误发展成致命问题前将其检测出来,并确保系统正常运行时间最大化。现在,公司可在几分钟内解决问题,无须耗费数小时,将宕机时间减少了一半,实现了268%的投资回报率,平均每年获益达400万美元。

如今,IT人员不是简单地通过增加服务器来解决问题。事实上,该公司明年将不会增加服务器,而是最大限度地利用其现有基础架构,转向虚拟化。

A公司最初在其150台服务器上部署了BMC容量管理方案,平均每个服务器仅需4小时即可完成BMC解决方案的安装。因此,完成所有150台服务器的实际部署仅需2~3个月。但由于部署过程需要分阶段进行IT整合,并在服务器上开展各种质量测试,此阶段共耗时两年。

目前,BMC解决方案支持约800台服务器。部署BMC解决方案前,A公司平均每年需要新增大约200台服务器。而现在,通过利用BMC解决方案先进的分析和虚拟化规划能力,公司能有效地虚拟化利用率较低的服务器资源,从而满足当前和未来的容量需求,避免再次购买服务器。

借助BMC容量管理解决方案,A公司的IT人员可以追踪IT系统,查看服务器容量数据(精确到秒),识别应用高峰期并定期制作精确报告。这为决策制定提供了极大的帮助。

从被动管理到预测管理

多年来,IT专家们一直致力于将被动的IT管理转变为主动的IT管理。被动管理是IT人员在事件发生后解决IT问题。由于IT人员对每个事件的识别和解决只能在获取服务中断报告后开始,这种方法会造成业务服务中断延长的巨大风险。

主动管理相比被动管理有重大进步。主动管理为关键性能指标设置预定阈值,并在每次超过阈值时指定的行动措施(如触发警报)。但是,随着IT环境日趋复杂,仅仅依靠主动管理已不能完全满足业务需求。在主动IT管理模式中,IT人员需要花费许多时间手动设置静态阈值。定期调整阈值极为繁琐,而且效率低下。

于是预测智能管理开始登上历史舞台。预测智能根据IT环境的实际使用模式来推断正常和异常现象,即时触发针对性措施以隔离未来产生威胁的根源,并在服务受到影响之前予以纠正,它能够根据业务影响的次序来划分优先级事件。利用预测智能,企业可以获得快速的技术投资回报,从而降低资本和运维开支。

预测智能整合多种先进技术,包括动态阈值、实时根源分析、预测模型和影响管理。

动态阈值:利用该技术,IT人员可以根据过往行为设置阈值。该技术将监控用户的应用行为,并了解用户所处IT环境中各类应用是否运行正常。它能根据了解到的情况自动调整阈值,而无须用户通过手动流程重新设置。

实时根源分析:大多数IT环境中,警报与事件生成大量数据,作为事件关联与分析的一部分,实时根源分析能够对生成的数据加以过滤,从而解决这一问题。实时根源分析在基础架构整体活动环境中考虑某个应用程序或设备的行为,能够关闭交叉警报(即根源的症状表现)、清除重复警报并确定剩余警报之间的关系。事实上,该技术可以智能地识别问题根源,并理顺该问题与队列中其他警报之间的关系。通过将事件转化为可执行的、与业务相关的信息,事件关联与分析解决方案能够加快问题处理速度。

预测模型:预测模型从了解当前性能和模式开始,依照现有方法建立起基线和规则,分析并关联性能数据,揭示出循环模式与关系。这些关系将被关联到整体业务和资源需求中。预测模型能为IT部门带来诸多益处:识别未充分利用IT资源的领域、平衡各服务器的工作负荷、准确地把物理工作负荷与服务器整合至一个虚拟平台上并精确预测未来容量需求。预测模型能够优化现有IT资源、确保服务水平交付、精确预测未来需求,从而帮助用户节省大量资金和运维成本。

预测智能技术可以自动检测事件的解决优先级,从而为业务服务提供最佳保障。例如,你可以自动检测到一台路由器正支持一个小型销售办事处,而另一台路由器则支持着整个欧洲客户群。因此,该技术能帮助用户缩短总体问题解决时间,同时帮助用户达成或超越与业务部门的服务水平协议要求。

据业内研究,上述技术与其他预测智能技术结合可使警报量减少60%~70%,消除交叉和重复事件。预测智能技术是全面的、精心整合型服务保障解决方案的重要副产品。服务保障解决方案能够为企业提供适应性自动预测技术,大幅降低服务中断风险,并确保业务所需的服务水平。

以A公司为例,得益于BMC容量管理方案,其IT部门能模拟容量情形以预测未来容量需求,从而了解预期客户增长率和系统变化对服务器性能的影响。通过更好地控制服务器容量以及更准确地监测服务器性能,A公司能根据业务增长更好地预测系统需求。因此,公司通过节约成本及整合获得了显著的可量化的效益。目前,IT团队成员不仅能够规划服务需求、增长需求和业务预期,还能在减缓成本增长的前提下有效支持需求增长。此外,BMC解决方案不仅能降低IT应用服务成本,还能减少服务器的意外宕机时间,并提高IT人员生产率。

上一篇:统一版本降低系统运营开销 下一篇:细分渠道 锐捷网络拓展行业市场