智慧型 ITOps 資訊基礎架構自動化維運管理解決方案
在現今業務導向的環境中,就算 IT 服務中斷時間再低,還是會造成不可抹滅的經濟影響。研究機構調查顯示,企業若發生營運中斷恐造成營收損失、生產力停擺以及聲譽一落千丈等不利影響。為了解決企業 IT 維運團隊日趨複雜的日常工作,像是彙總各式各樣的 IT 維運數據,包括事故單、日誌及警示等繁瑣工作,IBM 打造了 Watson AIOps。這個智能化的 ITOps 維運平台結合 IBM Watson AI 強大的機器學習與自然語言處理技術,提供卓越的事件管理、異常偵測及事件群組功能,能夠協助團隊準確偵測和診斷應用程式與 IT 基礎架構的相關問題,縮短服務中斷時間降低風險,改造內部體驗並超越客戶期待,最大化地發揮 IT 真正價值。
功能優勢
廣泛的資料擷取與整合能力
IBM Watson AIOps 能夠從各種事件收集平台擷取資料,藉由簡化配置與自動化工具連結到各個系統擷取即時與歷史事件資料,然後根據 Watson AI 建立的機器學習模型傳達 IT 營運的執行情況。IBM Watson AIOps 支援的事件來源包含:Ansible、AppDynamics、AWS CloudWatch、Dynatrace、ELK、Falcon LogScale、IBM Instana、Kafka、Mezmo、Microsoft Teams、IBM Netcool、New Relic、PagerDuty、ServiceNow、Slack、Splunk、Zabbix。

自動產生系統資源拓樸圖形
IBM Watson AIOps 可以自動產生包含應用程式(服務)、資源群組或單一資源的系統資源拓樸圖形,IT 維運人員可以使用互動式操作介面深入了解各個資源的詳細資訊和狀態,並啟用時間軸功能檢視資源耗用隨著時間的變化。藉由統一的 IT 資產拓撲圖形,可以透過即時或歷史資料滿足對應用程式及資源的可視化監控,實現有效的事件精確定位。

透過事件關聯有效進行管理
IBM Watson AIOps 利用 Watson AI 的智能化事件分析能力以及自動化事件關聯與壓縮技術降低事件資料的過載,並可依據 IT 維運人員定義的規則條件對各種事件進行分組歸類與視覺化呈現,維運人員可以在單一介面中透過時間、拓樸和行為模式進行更有效率的事件管理。

智能化 AI 模型管理提升效率
IBM Watson AIOps 內建多個 Watson AI 分析模型來收集事件資料並從中進行學習,以便於提供解決應用程式、服務和網路基礎架構健康問題的有效見解,讓 IT 維運團隊能夠快速了解並診斷各種異常事件,有效縮短平均復原時間 (MTTR)。透過易於使用的 AI 模型管理工具,維運人員可以輕鬆地選擇、訓練、部署模型,並且對模型進行所需的版本控管,提升對 IT 基礎架構的維運效率。

增強式修復建議縮短復原時間
IBM Watson AIOps 利用 Watson AI 模型自動檢測結構化和非結構化事件資料的異常情況,並可根據過去解決事件的成功經驗自動提出「Next Best Action」建議,這種具備高度可解釋性的深入洞察,搭配內建的 Runbook 自動化功能,可以讓 IT 維運團隊更快地隔離並找到問題的根本原因,縮短事件的補救及復原時間。

預期效益
為企業實現更高效的 IT 維運管理
IBM Watson AIOps 透過將事件數據與相關情境相結合,讓企業能夠更全面地了解其 IT 環境發生的狀況。當異常事件發生時,透過平台提供的可行見解,有效支援決策的制定讓維運人員快速做出反應,實現更高效的 IT 維運管理。
為企業降低系統故障與停機風險
透過進階分析和機器學習技術,IBM Watson AIOps 能夠快速識別問題,並提供相應的主動建議,這樣的作法有助於企業預防未來可能出現的問題,從而降低了系統故障和中斷的風險,為企業提供更高效、更可靠的 IT 維運支援。
為企業提升團隊協作的工作效率
IBM Watson AIOps 透過 ChatOps 功能,有效地促進 IT 團隊之間的協同合作與知識共享,讓團隊成員能夠輕鬆地討論問題並共同解決挑戰。這種無縫式的協作能力不僅加速了問題的解決,還提高了團隊的工作效率和效能。