123 期 - 混合雲運行監控利器,用微軟 OMS 緊盯內外環境


網管人雜誌

本文刊載於 網管人雜誌第 123 期 - 2016 年 4 月 1 日出刊,NetAdmin 網管人雜誌 為一本介紹 Trend Learning 趨勢觀念、Solution Learning 解決方案、Technology Learning 技術應用的雜誌,下列筆記為本站投稿網管人雜誌獲得刊登的文章,網管人雜誌於每月份 1 日出刊您可於各大書店中看到它或透過下列圖示連結至博客來網路書店訂閱它。





文章目錄

1、前言
2、Microsoft OMS 概觀
3、建立 OMS 工作區
          透過 OMS 網站建立 OMS 工作區
          透過 Azure Portal 建立 OMS 工作區
4、開始使用 OMS 工作區
          新增 OMS 解決方案套件
          選擇資料收集連接方式
          指定資料收集類型
5、建立 OMS 監控作業
          為 Azure VM 虛擬主機啟用 OMS 監控機制
          為企業內部實體主機或 VM 啟用 OMS 監控機制
          OMS 儀表板
          新增解決方案套件
          行動監控
6、結語





1、前言

公有雲(Public Cloud)運作環境成熟之賜,讓原本習慣於私有環境的 IT 運作架構發生重大的改變。舉例來說,以往企業或組織習慣將官方網站,擺放於內部自建的資料中心或 IDC 代管中心,然後採購硬體伺服器並租用網際網路頻寬,再聘請開發人員及網站前端後端人員...等,最後打造出精美且多功能的官方網站。

但是,現在有了成熟的公有雲運作環境之後,企業或組織在公有雲環境中建立 PaaS 類型的 Web 網站服務之後,只要操心官方網站內容的維護即可,底層硬體伺服器、網際網路頻寬、網路穩定性...等完全不需要操心。同時,根據 IDC 的統計調查結果顯示,預估在 2016 年時 IT 公有雲服務規模將達到 980 億美元

圖 1、2016 年全球 IT 公有雲服務總收入預估 

當企業或組織開始嘗試在公有雲環境中建立各項服務之後,便會自然而然與企業內部環境(On-Premise)結合,形成混合雲(Hybrid Cloud)的運作環境。舉例來說,以往企業或組織在備份資料時,可能將資料備份於磁帶櫃或儲存陣列設備中,現在可以將資料加密後備份至雲端儲存體當中。同時,根據 IDC 的統計調查結果可以得知,企業或組織的 IT 運作環境將日趨混合雲型態的運作架構。

圖 2、IT 服務預算比例預估(現在、2 年後) 
圖片來源:IDC Cloud Track Survey

然而,以往在企業或組織內部運作環境當中,IT 管理人員所建置的 SCOM(System Center Operation Manager)監控機制,僅針對企業內部環境的各種應用服務及設備的健康情況。對於公有雲及混合雲的各項監控需求便無法精確的進行監控,因此 IT 管理人員需要更靈活的監控機制。

本文將說明及實作,如何透過 Microsoft OMS(Operations Management Suite),達到全面監控公有雲及混合雲運作環境。此外,Microsoft OMS 不只能針對微軟自家公有雲 Azure 進行監控,它也支援異質的公有雲環境如 AWS(Amazon Web Services)進行監控作業。

圖 3、Microsoft OMS(Operations Management Suite)運作架構示意圖 





2、Microsoft OMS 概觀

Microsoft OMS 是專門為了混合式架構的運作環境而設計。它可以監控及管理 Azure 公有雲環境、企業內部的 Windows Server 及 Linux Server,此外對於異質平台例如 AWS 公有雲環境,及企業內部所建立的 VMware、OpenStack 等虛擬化環境,也都能夠進行管理及監控作業。

事實上,Microsoft OMS 並非僅能進行監控作業而已,它還具備下列各項特色功能:

  • 日誌分析(Log Analytics): 為企業或組織的內部資料中心,收集並儲存分析 Windows Server 及 Linux Server 的日誌檔案,或是 Azure 及 AWS 等公有雲環境中相關日誌資料。最後,達到以單一工具全面監控伺服器的工作負載,並提供最佳做法以便協助 IT 管理人員在最短時間內發現並解決問題。
  • IT 自動化(IT Automation): 協助 IT 管理人員,透過 Windows PowerShell 及 Runbook 等工具,達成企業或組織內部資料中心建立 / 監控 / 管理 / 部署等作業。
  • 備份與復原(Backup and Recovery): 整合公有雲儲存資源,為企業或組織提供災難復原機制。當企業或組織遭遇災難事件時,可以快速從雲端環境進行資料復原,或將內部工作負載轉移至雲端環境中繼續運作。
  • 混合雲安全性(Security and Compliance): 透過收集、儲存、分析伺服器的日誌資料,了解伺服器是否需要進行安全性更新,或審查整體安全性稽核事件,以達到身份識別及修復資訊安全風險的目的。





3、建立 OMS 工作區 

建構 Microsoft OMS 運作環境,首先必須要建立「OMS 工作區(OMS WorkSpace)」。目前,IT 管理人員可以有 2 種方式來建立 OMS 工作區:

  • 透過 Microsoft Operations Management Suite 網站建立 OMS 工作區。
  • 透過 Azure Management Portal 建立 Operational Insights 工作區。

目前,Azure Portal 當中有分為 New Azure Portal 採用 ARM(Azure Resource Manager)進行管理,以及 Old Azure Portal 也就是 Azure Management Portal,採用 Azure Service Management 進行管理。此外,在 Azure Management Portal 中的 Operationsl Insights 為 OMS 的舊稱。
建立 OMS 工作區之後,便可以新增各種「解決方案(Solutions)」,接著為伺服器安裝 OMS 代理程式或者與企業內部 SCOM 整合連接,最後便可以透過單一的 OMS 平台進行管理及監控作業。如下圖所示,便是整個 OMS 管理平台的建構流程:

圖 4、Microsoft OMS 管理平台建構流程示意圖 



透過 OMS 網站建立 OMS 工作區

請開啟瀏覽器連結 OMS 網站,按下免費試用連結至 OMS 申請頁面後,以 Microsoft 帳戶或 Office 365 帳戶進行登入。

接著,在建立新工作區頁面中於各項欄位填入相關資訊,例如,工作區名稱(Workspace Name)...等。值得注意的部分是,目前 OMS 工作區支援的資料中心僅「美國東部(East US)」 及「西歐(West Europe)」,相關資訊確認無誤後按下 Create 鈕即可建立 OMS 工作區。

圖 5、透過 OMS 網站建立 OMS 工作區



透過 Azure Portal 建立 OMS 工作區 

若你已經擁有 Azure 訂閱帳戶,也可以登入 Azure Management Portal 入口網站,通過身分驗證程序順利登入後,請依序點選「Operationsl Insights > 建立工作區」,然後在相關欄位中填入建立 OMS 工作區的資訊後,按下建立工作區圖示即可建立 OMS 工作區。

值得注意的部分是,在建立 OMS 工作區時可以指定的收費階層欄位,共有 3 種方案可供選擇分別是「免費(Free)、標準(Standard)、高階(Premium)」,這 3 種收費階層對於每日收集的資料量,以及資料保留期間都有所不同,請依運作環境規模選擇適當的方案。

圖 6、透過 Azure Management Portal 建立 OMS 工作區





4、開始使用 OMS 工作區

當 OMS 工作區建立完成後,便可以登入 Microsoft OMS 網站。順利登入 OMS 網站後,因為我們尚未組態設定 OMS 收集任何資料,所以你可以看到目前的 OMS 儀表板中並沒有任何資料,只有 OMS Twitter 的最新資訊。接下來,只要透過 3 個簡單的設定步驟,即可開始進行伺服器的收集、儲存、分析等作業。

圖 7、登入 OMS 工作區,準備進行初始化作業



新增 OMS 解決方案套件

若 IT 管理人員有使用 SCOM 監控機制的話,對於 SCOM 中提供的「管理套件(Managment Pack,MP)」 應該不陌生,在 SCOM 運作環境中透過各項 MP 管理套件的強大功能,可以輕鬆為 SCOM 強化各項應用服務監控能力。同樣的運作概念,在 OMS 當中稱之為「解決方案套件(Solution Pack,SP)」。

在 OMS 入口網站中,按下「Get Started」 之後便能連結至解決方案套件頁面,進行初始化設定程序的第 1 個步驟,預設情況下會自動載入「日誌搜尋(Log Search)」 解決方案套件。

同時,也將自動勾選 6 項解決方案套件,分別是無須整合 Azure 公有雲環境的惡意軟體評估(Malware Assessment)、系統更新評估(System Update Assessment)、組態變更追蹤(Change Tracking),以及需要整合 Azure 公有雲環境的 Azure 災害復原服務(Azure Site Recovery)、備份(Backup)、自動化(Automation)等。

這些 OMS 解決方案套件,可以立即勾選後馬上新增也可以後續再進行新增的動作,確認目前要載入的 OMS 解決方案套件項目後,便可以按下「Add selected Solutions」 鈕,然後繼續下一個 OMS 初始化程序。

圖 8、新增預設提供的 OMS 解決方案套件



選擇資料收集連接方式

點選「Connect Sources」 頁籤之後,便可以看到目前 OMS 所支援的 3 種資料收集方式,分別是:

  • Servers Connected
  • MGMT Groups Connected
  • Storage Account Connected


Servers Connected」 的資料收集方式,是幫企業或組織當中內部運作的 Windows 或 Linux 伺服器,安裝 OMS 代理程式後進行資料收集作業。倘若是在 Azure 公有雲環境中運作的 VM 虛擬主機,可以透過 Portal 的方式直接為 VM 虛擬主機安裝及啟用 OMS 代理程式。

此資料收集方式,可以針對 Azure VM 虛擬主機,或是企業及組織在內部運作環境中並沒有建置 SCOM 監控機制的情況下,直接為內部運作的 Windows 或 Linux 伺服器進行監控作業。

若企業或組織內部已經建構好 SCOM 監控機制時,便可以透過「MGMT Groups Connected」 的資料收集方式,直接將地端的 SCOM 監控資訊與雲端的 OMS 管理平台進行整合連結,無須為地端的 Windows 或 Linux 伺服器逐台安裝 OMS 代理程式。

最後,企業或組織可以將 Windows 或 Linux 伺服器,各種事件記錄或是網站的 IIS 日誌儲存至 Azure 雲端儲存體當中,然後透過「Storage Accounts Connected」 資料收集方式,讓 OMS 管理平台讀取及分析 Azure 雲端儲存體當中所儲存的各種日誌。
事實上,在 OMS 管理介面中已經可以看到預計將會支援 AWS 儲存體(例如,S3)。
圖 9、目前 OMS 所支援的 3 種資料收集方式



指定資料收集類型

最後,請點選「DATA」 頁籤,便可以指定 OMS 所要收集的日誌資料類型。目前,OMS 支援 6 種日誌資料來源,分別是 Windows 事件日誌、Windows 效能計數器、Linux 效能計數器、IIS 日誌、自訂欄位、Syslog。

舉例來說,IT 管理人員希望監控 Windows 伺服器中,有關硬體事件(Hardware Event),便可以點選 Windows Event Logs 項目後,輸入資料收集關鍵字 Hardware 後,便可以勾選想要收集的事件等級,例如,錯誤(Error)、警告(Warning)、資訊(Information)...等。最後,便可以按下 Save 進行組態設定存檔的動作。

圖 10、指定 OMS 所要收集的事件類型及事件等級





5、建立 OMS 監控作業

順利建立 OMS 工作區,以及新增各項解決方案套件並指定資料收集方式及類型後,便可以為 Azure 公有雲環境的 VM 虛擬主機,或者企業及組織內部的實體主機或 VM 虛擬主機,啟用及安裝 OMS 代理程式(或稱為 Microsoft Monitor Agent),或者是與企業內部的 SCOM 進行整合的動作,便可以在 OMS 管理平台中進行統一監控的動作。



為 Azure VM 虛擬主機啟用 OMS 監控機制

當你建立 OMS 工作區完成後,倘若要監控 Azure 公有雲環境中的 VM 虛擬主機時,只要登入 Azure Management Portal 後,依序點選「Operational Insights > OMS 工作區>伺服器」,便會看到 Azure VM 虛擬主機清單,請點選準備啟用及安裝 OMS 代理程式的 VM 虛擬主機後,點選下方「啟用 Opinsights」 圖示,系統便會自動幫指定的 VM 虛擬主機安裝及啟用 OMS 代理程式。

當 Azure VM 虛擬主機安裝及啟用 OMS 代理程式完成後,在 Azure Management Portal 中便可以看到,該 VM 虛擬主機在 Operational Insights 已啟用欄位從先前的否轉變為「」,而狀態欄位從先前的空值轉變為「作用中」。此時,便表示該台 Azure VM 虛擬主機已經安裝及啟用 OMS 代理程式完成。

圖 11、指定的 Azure VM 虛擬主機已經安裝及啟用 OMS 代理程式完成



為企業內部實體主機或 VM 啟用 OMS 監控機制

倘若在企業內部中並未建置 SCOM 監控機制,那麼也可以直接在實體主機或 VM 虛擬主機當中,安裝 OMS 代理程式後啟用 OMS 監控機制。請登入 OMS 網站後,切換至 Connected Sources 頁籤依主機作業系統類型,下載用於 Windows 或 Linux 作業系統的 OMS 代理程式,並記錄下方所列的 Workspace IDPrimary Key

圖 12、下載 OMS 代理程式並記錄 Workspace ID 及 Primary Key

值得注意的是,在為企業內部的實體主機或 VM 虛擬主機安裝 OMS 代理程式時,必須要填入剛才在 OMS 網站中下方所列的 Workspace ID 及 Primary Key,那麼企業內部主機中的 OMS 代理程式,才能正確將所收集到的資料狀態上傳至正確的 OMS 工作區當中。

圖 13、必須填入正確 Workspace ID 及 Primary Key 才能順利進行監控作業

此外,通常在企業或組織內部運作環境當中,實體主機或 VM 虛擬主機是在企業防火牆的保護中運作。因此,請記得在企業防火牆中開啟允許下列防火牆規則,以便 OMS 代理程式的資料流量能夠順利通過企業防火牆,傳送至位於雲端環境中的 OMS 管理平台當中:

  • *.ods.opinsights.azure.com : 443
  • *.oms.opinsights.azure.com : 443
  • ods.systemcenteradvisor.com : 443
  • *.blob.core.windows.net : 443


若企業內部已經建構 SCOM 監控機制的話,那麼便可以直接為 SCOM 與 OMS 進行整合連接的動作,那麼 OMS 便可以直接取得地端 SCOM 的監控資料,並呈現於 OMS 儀表板當中。

值得注意的是,若是建構的 SCOM 版本為 System Center 2012 SP1 的話,那麼至少必須要 Operations Manager UR7,並且安裝 OMS Connector for Operations Manager,才能順利與 OMS 整合連接。若 SCOM 版本為 System Center 2012 R2 的話,至少必須要 Operations Manager UR3,才能順利與 OMS 整合連接。

當 SCOM 運作環境符合 OMS 整合連接時,開啟 SCOM 主控台後依序點選「Administration > Operations Management Suite > Connection」 項目,便可以進行「Register to Operations Management Suite」 的動作,然後填入 Microsoft 帳戶及 OMS 工作區名稱,即可進行整合連接的動作。

圖 14、企業內部 SCOM 與雲端環境的 OMS 整合連接 



OMS 儀表板

當我們順利為 Azure 雲端環境的 VM 虛擬主機,或企業內部的實體主機及 VM 虛擬主機,安裝及啟用 OMS 代理程之作業之後。接著,便可以在 OMS 入口網站中看到相關的資料統計結果。

圖 15、OMS 儀表板

首先,我們可以點選左下角的「Usage」 項目,查看目前 OMS 資料收集所使用的流量情況。倘若,先前你在建立 OMS 工作區時,採用的是「免費(Free)」 方案的話,那麼一定要注意每日的資料流量限制為 500MB,若當日達到 500MB 資料量時 OMS 將會停止進行資料分析作業,同時所收集到的資料僅會保留 7 天而已。

若是採用標準或高階方案的話,則沒有每日收集資料量的限制,但「標準(Standard)」 方案的話資料收集的保留期間為 1 個月,而採用「高階(Premium)」 方案的資料保留期間則為 12 個月

圖 16、查看 OMS 資料量收集數據及 SLA 服務情況

回到 OMS 儀表板後,你可以點選各項解決方案套件內容,舉例來說,我們點選「組態變更追蹤(Change Tracking)」 項目,進入後可以看到此解決方案套件中有 5 個子項目,分別針對組態設定變更、軟體變更、應用程式變更、Windows 服務變更、組態變更追蹤查詢。

圖 17、查看組態變更追蹤(Change Tracking)解決方案套件內容

舉例來說,我們想再深入查看「軟體變更(Software Changes)」 子項目的內容,便可點選該子項目下方的 See all,便可以查看更詳細的軟體變更資訊,例如,每台被監控伺服器的主機名稱以及軟體變更數量,並且在操作介面中還支援直接將資料收集數據匯出 Excel(.csv)檔案格式,方便 IT 管理人員將相關數據自行客製化成其它報表格式。

圖 18、深入查看軟體變更(Software Changes)子項目的內容



新增解決方案套件

事實上,除了進行 OMS 初始化設定時,可以勾選預設的 6 項解決方案套件之外,OMS 仍持續不斷推出各式各樣的解決方案套件。

請在 OMS 入口網站中點選「Solutions Gallery」 圖示,便可以看到目前可以擴充 OMS 監控能力的各項解決方案套件,若該解決方案套件顯示為「Owned」,則表示該解決方案套件已經新增且正在使用中,若顯示為「Free」 則表示可以新增該解決方案套件,若顯示為「Coming Soon」 則表示該解決方案套件即將推出。

圖 19、新增 OMS 解決方案套件

舉例來說,此實作環境中希望能夠監控 AD 複寫狀態,便可以點選「AD Replication Status」 項目,了解此解決方案套件的功能說明,以及屆時呈現的儀表板範例,若符合你的運作環境監控需求便可以按下「Add」 鈕進行新增。

圖 20、新增 AD Replication Status 解決方案套件



行動監控

除了透過 OMS 入口網站進行監控管理作業之外,OMS 還提供 App 行動應用程式(支援 Windows Phone、iOS、Android),讓 IT 管理人員可以隨時隨地監控企業內部或雲端環境的運作狀態。只要在 App 商店搜尋關鍵字「Microsoft OMS」,即可進行安裝作業。

當 Microsoft OMS App 安裝完成後,首先會請你先登入建立 OMS 工作區的 Microsoft 帳戶,順利通過身分驗證程序後,將會請你選擇要進行查看的 OMS 工作區,你可以發現到與剛才在 OMS 入口網站的儀表板上,有著相同的使用者操作體驗。

圖 21、透過 Microsoft OMS App 隨時隨地查看監控狀態

同樣的,我們也再次深入查看「軟體變更(Software Changes)」 子項目的內容,與剛才在 OMS 入口網站的儀表板中一樣有著相同的使用者操作體驗,讓 IT 管理人員只要擁有智慧型行動裝置及連網能力,便能達到隨時 / 隨地 / 隨處監控的目的。

圖 22、與 OMS 入口網站儀表板擁有相同的使用者操作體驗





6、結語

透過本文的說明及實作演練,相信讀者已經了解到如何為企業或組織,監控 Azure 公有雲環境的 VM 虛擬主機,以及企業內部實體主機或 VM 虛擬主機或與內部 SCOM 整合連結,以便建立 Microsoft OMS 混合雲運作架構監控機制。同時,透過 OMS 不斷擴增的解決方案套件,將能有效幫助 IT 管理人員進行更全面的監控。

此外,透過安裝 Microsoft OMS App 行動應用程式,讓 IT 管理人員即時出門在外,只要有網路通訊便能輕鬆透過智慧型手機,監控企業或組織在雲端環境或企業內部的各項應用服務健康狀態。