網管人 181 期 - 微軟超融合雲端作業系統 Azure Stack HCI 開箱



網管人雜誌

本文刊載於 網管人雜誌第 181 期 - 2021 年 2 月 1 日出刊,NetAdmin 網管人雜誌 為一本介紹 Trend Learning 趨勢觀念、Solution Learning 解決方案、Technology Learning 技術應用的雜誌,下列筆記為本站投稿網管人雜誌獲得刊登的文章,網管人雜誌於每月份 1 日出刊您可於各大書店中看到它,或透過城邦出版人讀者服務網進行訂閱。





本文目錄






前言

在 2020 年的 Microsoft Inspire 2020 大會  上,微軟首度發佈新一代的 HCI 超融合雲端作業系統「Azure Stack HCI」,相信管理人員肯定會產生疑惑,新一代 Azure Stack HCI 和 Windows Server 2019 作業系統,所建置的 HCI 超融合叢集運作環境有何不同 ?簡單來說,新一代的 Azure Stack HCI 超融合雲端作業系統,是專為 HCI 超融合環境進行重新設計(如圖 1 所示),並且針對 Azure 公有雲環境進行深度整合。

圖 1、Azure Stack HCI 運作架構示意圖





Azure Stack HCI 亮眼新功能

首先,企業和組織期待已久的「自動容錯移轉延伸叢集」(Stretched Cluster for Automatic Failover)特色功能,便在新一代 Azure Stack HCI 超融合叢集架構中開始支援。因此,企業和組織可以透過自動容錯移轉延伸叢集功能,在兩座資料中心之間,建立並啟用延伸叢集功能的 Azure Stack HCI 超融合運作環境,透過採用「Active-Passive」或「Active-Active」運作模式(如圖 2 所示),幫助企業或組織的營運服務達到高可用性和彈性。
請注意,自動容錯移轉延伸叢集功能僅支援 Azure Stack HCI,透過 Windows Server 2019 部署的 HCI 超融合環境並不支援。
圖 2、自動容錯移轉延伸叢集 Active-Passive 和 Active-Active 運作架構示意圖

由於,Azure Stack HCI 更精簡且重新設計後少掉許多舊有包袱,因此在執行磁碟區的「修復」(Repair)「重新同步」(Resync)時也獲得大幅度的改善。根據微軟官方的測試結果,同樣的運作環境和工作負載情況,與傳統 Windows Server 2019 HCI 超融合環境相較下,新一代的 Azure Stack HCI 重新同步時間將會「減少 4-5 倍」之多(如圖 3 所示)。

圖 3、重新設計的 Azure Stack HCI 在修復和重新同步時效能大幅提升

除了每月定期安全性更新之外,原則上每一年 Azure Stack HCI 便對釋出新功能版本,以便企業和組織可以不斷推進並享有各式亮眼特色功能。舉例來說,目前最新版本為 Azure Stack HCI 20H2,其中「20H2」版本的表示方式為「Second half of 2020」,也就是 2020 年下半年發佈的版本,而下一版便為 Azure Stack HCI 21H2(如圖 4 所示)。

圖 4、Azure Stack HCI 版本更新原則和支援週期





實戰 – 部署 Azure Stack HCI 超融合叢集

在本文實作環境中,總共建立四台主機,前二台主機採用 Windows Server 2019 作業系統,第一台主機擔任 DC 網域控制站的角色(網域名稱為「lab.weithenn.org」),另一台主機擔任 Windows Admin Center 管理平台的角色,另外二台主機則採用新版 Azure Stack HCI 20H2 雲端作業系統,並擔任 HCI 超融合叢集中節點主機的角色。
在開始建構 HCI 超融合運作環境之前,建議為四台主機安裝最新安全性更新後再開始建構,避免建置過程中遭遇非預期的錯誤。



部署 Azure Stack HCI 20H2 雲端作業系統

過去,採用 Windows Server 2019 作業系統建置 HCI 超融合環境時,僅使用眾多伺服器角色和功能當中的其中幾項而已。但是,新一代的 Azure Stack HCI 20H2 雲端作業系統(如圖 5 所示),則是重新設計且高度客製化的新版雲端基礎平台,同時只專注於提供 Azure Stack HCI 超融合叢集功能,並移除其它非必要的伺服器角色和功能,舉例來說,其它 Windows Server 應用中常見的 Web Server(IIS)、DFS Replication、iSCSI Target Server、Remote Desktop Services……等,都不存在於 Azure Stack HCI 雲端作業系統當中。
此外,從安裝映像檔的檔案大小也可知兩者的差別,Windows Server 2019 的 ISO 映像檔大小為「4.93 GB」左右,而 Azure Stack HCI 的 ISO 映像檔僅為「2.9 GB」大小。
圖 5、安裝新一代的 Azure Stack HCI 20H2 雲端作業系統

安裝完成後,系統將會出現命令提示字元視窗,提醒管理人員必須變更 Administrator 管理員帳號密碼,完成密碼變更作業後,將會出現「伺服器組態設定工具」(Server Configuration Tools,Sconfig)視窗,方便管理人員執行基本的伺服器組態設定作業,例如,組態設定 IP 位址、變更電腦名稱、加入網域環境……等(如圖 6 所示)。
事實上,微軟已經著手重新設計和客製化新的組態設定管理工具,屆時將取代目前預設的 Sconfig 伺服器組態設定工具,以便提供給管理人員更佳的使用者操作體驗。
圖 6、Azure Stack HCI 20H2 登入後自動開啟伺服器組態設定工具

為二台 HCI 超融合叢集節點主機,組態設定 IP 位址「10.10.75.21 和 10.10.75.22」,以及電腦名稱「HCI-Node01 及 HCI-Node02」。在儲存裝置部份,每台 HCI 叢集節點主機除了作業系統硬碟之外,額外配置「4 顆」300GB 的 SSD 固態硬碟(如圖 7 所示),以便屆時採用「All-Flash」類型建立 HCI 超融合叢集,並且這二台 HCI 叢集節點主機都加入「同一個」Windows AD 網域。

圖 7、每台 HCI 叢集節點主機額外配置 4 顆 300GB 的 SSD 固態硬碟



部署 Windows Admin Center 管理平台

在 WAC(Windows Admin Center)管理主機的部份,完成基本的伺服器組態設定後加入「lab.weithenn.org」網域環境,並安裝最新版本「Windows Admin Center version 2009」(如圖 8 所示)。
請注意,所謂 WAC v2009 版本並非 2009 年所發佈的 WAC 產品版本,而是指 2020 年 09 月所發佈的版本,微軟在發佈公告中也提醒大家正確的唸法為「Twenty oh-nine」。
圖 8、採用最新發佈的 Windows Admin Center v2009 版本

事實上,在最新的 WAC v2009 版本中,除了針對 VM 虛擬主機的管理功能不斷增強,例如,線上遷移儲存資源(Live Storage Migration)、親和性和反親和性規則(Affinity / Anti-Affinity Rules)……等之外,也開始支援部署和管理新版容器工具,舉例來說,透過 WAC 管理平台為內部資料中心內的 Windows Server 安裝 Docker 容器服務,支援經常使用的 Windows 容器映像檔,並且無須進行標記和鍵入容器映像檔名稱即可下載使用。

在開始部署之前,請先確保 WAC 管理平台已經安裝「叢集建立延伸模組」(Cluster Creation Extension),確保支援部署和管理 HCI 超融合叢集。請於登入 WAC 管理介面後,依序點選「Settings > Gateway > Extensions > Installed extensions」項目,鍵入關鍵字「Cluster」後,點選「Cluster Creation(Preview)」項目,即可看到 Cluster Creation 延伸模組和相關資訊(如圖 9 所示),本文實作環境採用最新的「1.373.0」版本。

圖 9、確認 WAC 管理平台已經安裝叢集建立延伸模組



準備部署 HCI 超融合叢集

回到 WAC 主要管理介面中,依序點選「All connections > Add > Server Clusters > Create new」項目,進入精靈互動模式準備部署 HCI 超融合叢集。

首先,在 Choose the cluster type 頁面中,系統詢問管理人員準備部署哪種類型的叢集,分別有傳統的「Windows Server」叢集和「Azure Stack HCI」超融合叢集,在本文實作環境中請點選「Azure Stack HCI」項目。

接著,在 Select Server Locations 選項中,系統詢問 HCI 超融合叢集的部署類型,分別是所有 HCI 叢集節點都在同一站台的「All servers in one site」,或者是分散在不同站台的「Servers in two sites」。在本文實作環境中,請點選所有 HCI 叢集節點都在同一站台的「All servers in one site」選項(如圖 10 所示)。
倘若,後續管理人員要實作「自動容錯移轉延伸叢集」進階功能時,則請選擇「Servers in two sites」項目。
圖 10、選擇部署 HCI 超融合叢集並且所有 HCI 叢集節點都處於同一站台



部署 Azure Stack HCI 超融合叢集 – Get Started

進入部署 Azure Stack HCI 超融合叢集組態設定流程後,透過叢集建立延伸模組的自動化組態設定流程,將會帶領管理人員在精靈互動模式中,輕鬆完成「Get Started > Networking > Clustering > Storage > SDN」五個階段。

首先,在第一個階段 Get Started 內,於 1.1 Check the prerequisites 頁面中,系統提示相關前置作業資訊,例如,建議為 WAC 管理平台執行註冊至 Azure 的動作,屆時便可以透過 Azure Portal 輕鬆管理 Azure Stack HCI 超融合叢集,HCI 叢集節點主機必須採用 Azure Stack HCI 雲端作業系統,稍後的組態設定流程必須具備本機 Administrators 群組的權限才行……等,建議管理人員再次檢視是否符合相關條件,避免稍後的部署作業發生非預期的錯誤。

在 1.2 Add servers 頁面中,請鍵入 HCI 叢集節點主機的管理者帳號及密碼,這個管理者帳號必須具備「Local Administrators Group」的身份和權限,然後鍵入 HCI 叢集節點主機的 FQDN 主機名稱,分別是「HCI-Node01 和 HCI-Node02」搭配網域名稱後按下 Add 鈕進行檢查(如圖 11 所示),通過系統檢查作業後再按下 Next 鈕繼續下一個組態設定流程。

圖 11、新增 HCI 叢集節點主機並通過系統驗證程序

在 1.3 Join a domain 頁面中,鍵入「lab.weithenn.org」網域管理者帳號,由於我們在基礎設定的前置作業中,已經將 HCI 超融合叢集節點主機加入網域,否則在此設定步驟中系統將會執行加入網域的動作,請按下 Apply changes 鈕讓系統進行檢查作業,當狀態列為「Changes applied」通過系統檢查程序後,即可按下 Next 鈕繼續下一個組態設定流程。

在 1.4 Install features 頁面中,系統將會檢查 HCI 超融合叢集節點主機,是否安裝建構 Azure Stack HCI 超融合叢集所需的伺服器角色和功能。由於,在前置作業中僅進行基礎設定和加入網域,因此檢查結果為「Not installed」尚未安裝相關伺服器角色和功能,請按下 Install features 鈕,為 HCI 超融合叢集節點主機安裝所需的伺服器角色和功能,等待幾分鐘後順利安裝所需的伺服器角色和功能後,狀態改變為「Installed」後即可按下 Next 鈕繼續下一個組態設定流程。
此步驟將會安裝 Data Deduplication、Hyper-V、BitLocker Drive Encryption、Data Center Bridging、Failover Clustering、Active Directory module for Windows PowerShell、Hyper-V Module for Windows PowerShell 等伺服器角色和功能。

在 1.5 Install updates 頁面中,系統將會檢查 HCI 超融合叢集節點主機,是否安裝最新的安全性更新,以避免稍後建構 Azure Stack HCI 超融合叢集時,遭遇到非預期的系統錯誤或臭蟲導致部署失敗。由於,前置作業中已經為 HCI 超融合叢集節點主機安裝最新安全性更新,否則請按下 Install updates 鈕安裝最新安全性更新。

在 1.6 Solution updates 頁面中,倘若採用的 HCI 超融合叢集節點主機伺服器供應商,有提供 WAC 管理平台延伸模組時便會安裝和檢查更新,例如,Dell EMC OpenManage Integration、Lenovo XClarity Integrator……等。

由於,在 1.4 Install features 組態設定步驟中所安裝的伺服器角色和功能,例如,Hyper-V 伺服器角色,需要重新啟動主機後才能套用生效。因此,在 1.7 Restart servers 頁面中,可以看到二台 HCI 超融合叢集節點主機,檢查後的 Status 欄位值為「Restart needed」,請按下 Restart servers 鈕執行重新啟動和套用生效的工作任務。
重新啟動 HCI 超融合叢集節點主機時,可以看到狀態列的變化為「Restarting > Verifying > Ready」。



部署 Azure Stack HCI 超融合叢集 – Networking

在 2.1 Verify network adapters 頁面中,系統將會檢查每一台 HCI 超融合叢集節點主機的網路組態,為稍後部署 HCI 超融合叢集虛擬交換器和虛擬網路環境做準備。

在 2.2 Select management adapters 頁面中,請選擇每台 HCI 超融合叢集節點主機,用於「管理」(Management Network)用途的網路卡,並且按下「Apply and test」鈕進行套用生效和測試作業,在本文實作環境中選擇「二張」網路卡並建立網路卡小組,以便管理用途網路流量具備「負載平衡和容錯移轉」(Load Balancing and FailOver,LBFO)的高可用性機制,完成套用和測試作業程序後,可以發現系統自動建立網路卡小組「vEthernet(Management)」,並將相關網路卡名稱變更為「Management」以利識別(如圖 12 所示)。

圖 12、指派每台 HCI 超融合叢集節點主機用於管理用途的網路卡

在 2.3 Define networks 頁面中,管理人員可以看到 HCI 超融合叢集節點主機中,其它網路卡的網路資訊,包括,IP 位址、網路遮罩、MAC 位址、VLAN ID……等。值得注意的是,運作環境中實體交換器有啟動 Jumbo Frame 機制時,請此頁面中下方展開 Advanced 項目,在 Jumbo packet size 欄位中填入適合的 MTU 數值。同樣的,請按下「Apply and test」鈕進行套用生效和測試作業,當 Statue 欄位值為「Passed」通過測試程序後,按下 Next 鈕繼續下一個組態設定流程。
預設情況下,未啟用 Jumbo Frame 機制的 Jumbo packet size 欄位值為 1514

在 2.4 Virtual switch 頁面中,請管理人員選擇符合運作環境的虛擬交換器架構,系統將會為每一台 HCI 超融合叢集節點主機,建立 vSwitch 虛擬網路交換器。在本文實作業環境中,同樣規劃二張網路卡用於「VM 虛擬主機」網路流量,而另外二張網路卡則規劃為「S2D 儲存資源」網路流量,所以選擇「Create two virtual switches」項目(如圖 13 所示),分別建立二台不同用途的 vSwitch 虛擬網路交換器,以便分別處理 VM 虛擬主機和 S2D 儲存資源網路流量。

圖 13、建立 HCI 超融合叢集環境 vSwitch 虛擬網路交換器

此外,在 Azure Stack HCI 超融合叢集環境中,並非建立傳統的 Hyper-V vSwitch 虛擬網路交換器,展開下方 Advanced 子項目後,可以看到系統預設已經勾選「Use switch-embedded teaming」選項,表示稍後建立支援 RDMA 卸載功能的「SET(Switch-Embedded Teaming)」虛擬網路交換器。



部署 Azure Stack HCI 超融合叢集 – Clustering

在 3.1 Validate cluster 頁面中,系統在建構 Azure Stack HCI 超融合叢集之前,執行「叢集驗證」(Cluster Validation)的動作,確保每台 HCI 超融合叢集節點主機符合各項運作需求,避免稍後建立 HCI 超融合叢集時發生非預期的錯誤。

請按下 Validate 鈕執行叢集驗證作業,系統將會彈出啟用 CredSSP 驗證機制的說明,請按下 Yes 鈕進行啟用並執行叢集驗證的動作。倘若,發生無法順利執行驗證機制,並得到「The WinRM client cannot process the request.」的錯誤訊息時,管理人員可以在 HCI 超融合叢集節點主機上,手動執行「Enable-WSManCredSSP -Role "Server"」PowerShell 指令,待部署完成後再進行停用的動作即可。

當叢集驗證工作任務經過幾分鐘完成檢查作業後,管理人員可以按下 Download report,下載容錯移轉叢集驗證報告查看檢查作業細項(如圖 14 所示)。

圖 14、通過叢集驗證工作程序並查看檢查作業細項

在 3.2 Create cluster 頁面中,請於 Cluster name 欄位鍵入 HCI 超融合叢集名稱,本文實作名稱為「HCI-Cluster」,展示 Advanced 子項目後,在 Networks 的部份保持預設值「Use all networks」即可,在 IP addresses 選擇「Specify one or more static addresses」項目,然後鍵入 HCI 超融合叢集固定 IP 位址,本文實作為「10.10.75.30」按下 Add 鈕,然後按下「Create cluster」鈕執行建立容錯移轉叢集的動作,經過幾分鐘作業時間後系統顯示順利建立容錯移轉叢集。
此時,在 DC 網域控制站當中,將會建立名稱為「HCI-Cluster」的叢集電腦帳戶,並且新增 DNS 正反解位置。



部署 Azure Stack HCI 超融合叢集 – Storage

在 4.1 Clean drives 頁面中,將每台 HCI 超融合叢集節點主機中的儲存資源進行整合。值得注意的是,倘若 HCI 超融合叢集節點主機中的儲存裝置,已經被「宣告」(Claimed)為使用狀態,例如,硬碟初始化為 GPT 格式、硬碟格式化為 NTFS 檔案系統...…等。

屆時,這些已經宣告使用狀態的儲存裝置,便無法整合加入至 HCI 超融合叢集的儲存資源當中。因此,系統提醒管理人員再次確認儲存裝置未進行宣告,倘若管理人員無法確認儲存裝置是否為乾淨狀態的話,請按下「Erase drives」鈕執行儲存裝置內容清空的動作。

在 4.2 Verify drives 頁面中,將會檢查每台 HCI 超融合叢集節點主機中,可用於 HCI 超融合叢集的儲存裝置,在本文實作環境中,正確檢查出每台 HCI 超融合叢集節點主機,額外配置的「4 顆」300GB SSD 固態硬碟。

在 4.3 Validate Storage 頁面中,針對儲存裝置是否能加入 HCI 超融合叢集的儲存資源進行驗證,驗證作業完成後可以按下 Download report,查看容錯移轉叢集報表中,針對 Storage Spaces Direct 的驗證檢查細項(如圖 15 所示)。

圖 15、通過 HCI 超融合叢集儲存資源驗證程序並查看驗證報表內容

在 4.4 Enable Storage Spaces Direct 頁面中,請按下「Enable」鈕執行啟用 Storage Spaces Direct 機制,在原有 Windows Server 容錯移轉叢集架構中整合儲存資源,啟用成為 Azure Stack HCI 超融合叢集架構。同樣的,經過幾分鐘作業時間後,順利啟用 Storage Spaces Direct 技術,管理人員可以下載報表檔案查看詳細資訊(如圖 16 所示)。

圖 16、HCI 超融合叢集建構完成



部署 Azure Stack HCI 超融合叢集 – SDN

HCI 超融合叢集最後部署階段,可以直接將「網路控制器」(Network Controller),部署在 HCI 超融合叢集最後部署階段中,打造出「軟體定義網路環境」(Software Defined Networking,SDN)。由於,文章篇幅的關系便暫不建立 SDN 軟體定義網路環境,所以請按下「Skip」略過定義和部署網路控制器的動作。

至此,Azure Stack HCI 超融合叢集已經部署完成。同時,在 WAC 管理介面 All connections 清單中,已經自動出現 HCI-Cluster 超融合叢集,點選後即可開始透過 WAC 管理 Azure Stack HCI 超融合叢集。

現在,管理人員便可以透過 WAC 管理平台,看到 HCI 超融合叢集的各種使用率和工作負載情況,包括,HCI 叢集節點主機數量、儲存裝置數量、運作的 VM 虛擬主機數量、HCI 叢集整體 CPU/Memory/Storage 工作負載情況、IOPS 儲存效能、Latency 延遲時間、Throughput 傳輸速率……等(如圖 17 所示)。

圖 17、透過 WAC 管理平台查看和管理 HCI 超融合基礎架構



關閉 CredSSP 通訊協定

由於,剛才建立 Azure Stack HCI 叢集過程中,我們為每一台 HCI 叢集節點主機,啟用有安全性疑慮的 CredSSP 通訊協定。現在,Azure Stack HCI 叢集已經部署完成,我們可以停用每台 HCI 叢集節點主機的 CredSSP 通訊協定,降低主機安全性風險。

請在 Windows Admin Center 管理頁面中,點選 All connections 內的個別的 HCI 叢集節點主機,在 Overview 項目中即可看到「Disable CredSSP」鈕(如圖 18 所示),按下後當系統成功停用 CredSSP 通訊協定後該按鈕便會消失。

圖 18、停用每台 HCI 叢集節點主機的 CredSSP 通訊協定



CAU 自動化部署安全性更新

在 Azure Stack HCI 超融合叢集環境中,管理人員可以透過「叢集感知更新」(Cluster-Aware Updating,CAU)機制,輕鬆為 Azure Stack HCI 超融合叢集部署安全性更新機制。請點選左側的「Updates」項目,準備透過 CAU 叢集感知更新機制,為 Azure Stack HCI 超融合叢集進行安全性更新。

按下「Check for updates」鈕,系統將會檢查每台 HCI 叢集節點主機作業系統層級的安全性更新,接著檢查硬體伺服器的安全性更新,確認進行安裝作業後按下「Install」鈕即可,每台 HCI 叢集節點主機,便會依序執行「Fetching Status > Waiting > Scanning > Staging > Installing > Succeeded」等動作(如圖 19 所示),管理人員可以透過「Update Status」欄位狀態,了解每台 HCI 叢集節點主機部署安全性更新的狀態。
倘若,得到「cloudn't configure cluster aware updates」的錯誤訊息,管理人員可能忘記給予 HCI-Computer 叢集電腦帳戶,在 DC 網域控制站所處的 OU 中具備「建立電腦物件」(Create Computer Objects)的權限,詳細資訊請參考 Microsoft KB 288935
圖 19、透過 CAU 機制為 HCI 叢集節點主機部署安全性更新





結語

透過本文的深入剖析及實作演練,管理人員只要透過 WAC 管理平台,即可輕鬆部署新一代 Azure Stack HCI 超融合叢集,同時後續的維運和管理也都可以透過 WAC 管理平台完成,幫助原本 IT 人員編制便不多的中小型企業,能夠有更佳的部署和管理體驗。