IT運維與IT運營實現方法

之前的IT運維與運營的介紹及說明,運維是運營的基礎,任何一個組織,首先是要活著,之後才要追求活得好,是IT Operations的不同發展階段,IT運維和 IT運營都非常重要。

IT運維管理階段需要 “穩定”、 “安全”、 “可靠”,關注可用性指標(MTTR、MTTF、MTBF等)、可靠性指標(RTO、RPO)和安全合規。在技術、工具和流程上,都以穩定、安全、可靠作爲最優先考慮的要素:

技術上:

傾向選擇穩定成熟的技術架構和産品,願意爲提升可靠性支付大量溢價,上得起小型機的就上小型機,買得起大機那就大機,能備份的地方就備份,儘量采用全冗餘架構;

流程上:

首先從事件管理和變更管理做起,主要目標是能確保故障事件得到追踪和及時解决,以及管控變更避免人爲故障多發,關注重點還是在提升可用性;

工具上:
採用“監-管-控”架構,其中監控更關注設備級監控,重點發現故障節點,“管”就是配合實現變更和事件流程,至于“控”,此時上配置自動化工具,更關心的是實現配置的標準化和合規檢查,重點還是在增强可靠性减少故障,而非减少運維人員工作量。

IT運營是建立在良好的IT運維的基礎上的,沒有“活著”,“活得好”就無從談起。與IT運維更多地是面向基礎設施不同,IT運營更多的是面向業務、面向服務。

在IT運營階段,與IT運維階段的需求“穩定”、“安全”、“可靠”不同,變成了“體驗”、“效率”、“效益”,在應對挑戰方面提出一些新的理念、工具和技術,主要從以下幾方面入手:

1、集中化、自動化運營

通過打造集中化、自動化的運營管理平臺,對數據進行集中管理,對集成層數據、存儲層數據以及應用層數據進行智能分析。集中式的運營有效地解决跨部門信息傳遞效率低下、信息流失等現象。同時,自動化運營平臺還具備標準化、流程化、智能化、模塊化和自動化等特點,正是基于這些特點,IT運維也由複雜變得愈發簡單,運維人員的工作量也得到了有效的控制。

2、IT運營管理可視化

簡言之,就是將企業海量的數據、IT物理機房、邏輯架構以及業務流程等各類抽象、龐雜的以數據驅動的直觀圖的形式呈現在人們眼前,實現“數圖互換”。通過直觀圖,按圖索驥,在架構圖中精准定位,檢測信息,排查故障。

通過這張直觀圖,企業的管理層底層、决策層甚至是底層員工都能有效認知企業的IT架構,幷隨時洞悉最新動態,從而高效的完成各類運維工作。


IT運營管理場景化强調的是對于企業運維工具以及業務數據的整合。目前,企業業務處于快速發展階段,IT部門的壓力陡增,碎片化數據量巨大。通過搭建場景,在場景中一站式整合各種管理要素,包括IT架構圖、運維數據、運維工具、處理規則等,模式化、場景化的整合管理,從而實現高效的運營管理。