︿
Top


網管人雜誌

本文刊載於 網管人雜誌第 179 期 - 2020 年 12 月 1 日出刊,NetAdmin 網管人雜誌 為一本介紹 Trend Learning 趨勢觀念、Solution Learning 解決方案、Technology Learning 技術應用的雜誌,下列筆記為本站投稿網管人雜誌獲得刊登的文章,網管人雜誌於每月份 1 日出刊您可於各大書店中看到它,或透過城邦出版人讀者服務網進行訂閱。





本文目錄







前言

建構過微軟 S2D(Storage Spaces Direct)超融合環境的管理人員,應該會有這樣深刻的體會,那就是管理人員必須具備 PowerShell 管理技巧,以及對於整體 S2D 超融合基礎架構的建置流程清楚明瞭,才能夠順利搭建 S2D 超融合運作環境。

然而,也因為整個 S2D 超融合環境建構過程,完全需要透過 PowerShell 指令進行建構和檢查運作環境及狀態,舉例來說,從 S2D 超融合環境的前置作業、組態設定虛擬交換器和虛擬網路環境、建構容錯移轉叢集、整合儲存資源、啟用 S2D(Storage Spaces Direct)超融合技術……等,因此即便是熟悉 PowerShell 指令的管理人員,至少也需要花費數小時才能完成整個建置作業,所以讓許多對於 PowerShell 不熟悉的管理人員望之卻步。

微軟收集許多管理人員的意見反應後,正式在 Microsoft Ignite 2019 大會上,發表並實際展示透過 WAC(Windows Admin Center)管理平台,採用新增的「叢集建立延伸模組」(Cluster Creation Extension)特色功能,幫助管理人員在 WAC 圖形化管理介面中,以多階段工作流程的方式帶領管理人員(如圖 1 所示),將過去需要執行大量 PowerShell 的繁複工作流程,在 WAC 圖形化管理介面中完成建置 S2D 超融合運作環境的工作任務。

圖 1、WAC 管理平台支援建構各種容錯移轉叢集的部署情境

在本文中,我們將帶領管理人員進行實戰演練,從一開始為 WAC 管理平台安裝叢集建立延伸模組,到如何透過叢集建立延伸模組的多階段工作流程,手把手帶領管理人員輕鬆建構整個 S2D 超融合運作環境。





WAC 新增特色功能

事實上,WAC 管理平台除了採用現代化主流技術 HTML 5 進行開發,並且無須額外收取軟體授權費用之外,更重要的是各項特色功能隨著使用者的意見反應後持續增加。在「叢集建立延伸模組」(Cluster Creation Extension)的「1.2」版本中,開始新增支援部署「軟體定義網路」(Software-Defined Network,SDN),幫助管理人員輕鬆部署網路控制器、軟體式負載平衡器、SDN 閘道……等(如圖 2 所示)。

圖 2、從叢集建立延伸模組 1.2 版本開始支援部署 SDN 軟體定義網路環境



支援部署 Azure Stack HCI v2 新式雲端作業系統

過去,企業和組織希望建構微軟的 HCI 超融合叢集運作環境時,必須採用 Windows Server 2016 或 Windows Server 2019 雲端作業系統。然而,微軟發現企業和組織已經開始逐漸將工作負載進行遷移,或是直接改為採用在雲端環境中運作。

因此,在 Microsoft Inspire 2020 大會上,微軟發佈新一代的 HCI 超融合雲端作業系統「Azure Stack HCI」。此時,管理人員肯定會有疑惑,新一代的 Azure Stack HCI 和 Windows Server 2019 作業系統中,建置後的 HCI 超融合叢集運作環境有哪些差異? 簡單來說,新一代的 Azure Stack HCI 是專為 HCI 超融合環境進行重新設計,並且針對 Azure 公有雲環境進行深度整合。

首先,在 Windows Server 2019 運作環境中建置的 HCI 超融合環境,其實只是眾多伺服器角色和功能當中的其中一項。然而,新一代的 Azure Stack HCI 則是全新高度客製化過後的新版雲端作業系統,並且只專注在 Azure Stack HCI 超融合叢集功能,拿掉其它不必要的伺服器角色和功能,舉例來說,傳統應用中常見的 Print Server、DNS Server、DHCP Server、Active Directory Domain Services、Certificate Services、Federation Services……等,都不存在於 Azure Stack HCI 當中。

此外,企業和組織期待已久的「延伸叢集」(Stretched Cluster)特色功能,也在新一代的 Azure Stack HCI 開始支援。因此,企業和組織現在可以透過延伸叢集特色功能,例如,在二棟不同建築物之間,建立 Azure Stack HCI 超融合運作環境並啟用延伸叢集功能,無論採用「Active-Passive」或「Active-Active」運作模式(如圖 3 所示),都能讓營運服務達成更高的可用性和彈性。
請注意,延伸叢集特色功能目前僅支援在 Azure Stack HCI 中啟用,而 Windows Server 2019 所建置的 HCI 超融合環境尚未支援。
圖 3、延伸叢集支援 Active-Passive 和 Active-Active 運作模式

在新版 WAC v2007 版本當中,開始正式支援部署和管理 Azure Stack HCI 運作環境。簡單來說,透過最新 WAC v2007 版本中的「叢集部署工作流程」(Cluster Deployment Workflow)機制,不僅支援部署和管理舊有的「Windows 伺服器容錯移轉叢集」(Windows Server Failover Cluster,WSFC),更新增支援部署和管理 Azure Stack HCI 所建構的 HCI 超融合叢集(如圖 4 所示)。
請注意,這裡的 WAC v2007 版本,並非 2007 年所發佈的 WAC 產品版本,而是指 2020 年 07 月所發佈的版本,微軟官方甚至提醒大家正確的唸法為「Twenty oh-seven」。
圖 4、WAC v2007 版本開始支援部署和管理 Azure Stack HCI 超融合叢集環境



支援部署 AKS on Azure Stack HCI

過去,企業和組織希望建構「容器即服務」(Container as a Service,CaaS)時,在 Azure 公有雲上便是採用 AKS(Azure Kubernetes Service)服務,讓企業無須擔心 Kubernetes 叢集的維運管理,可以將所有心力放在改善和增強自家產品身上。

Microsoft Ignite 2020 大會上,微軟正式發佈 AKS on Azure Stack HCI 的消息,並且實際展示透過最新發佈的 WAC v2009 版本,讓 WAC 管理平台可以支援部署和管理 AKS on Azure Stack HCI 運作環境(如圖 5 所示)。簡單來說,過往企業和組織部署 AKS 容器即服務時,僅能在公有雲環境進行部署和管理,現在則可以將 AKS 容器即服務,部署在企業和組織內部資料中心內的 Azure Stack HCI 運作環境中。
請注意,這裡的 WAC v2009 版本,並非 2009 年所發佈的 WAC 產品版本,而是指 2020 年 09 月所發佈的版本,微軟官方甚至提醒大家正確的唸法為「Twenty oh-nine」。
圖 5、最新 WAC v2009 版本支援部署和管理 AKS on Azure Stack HCI 運作環境

事實上,WAC 管理平台除了持續新增亮眼特色功能之外,針對原有的核心功能也不斷改進。在 WAC v2009 版本中,針對 VM 虛擬主機的管理功能也不斷增強,例如,線上遷移儲存資源(Live Storage Migration)、親和性和反親和性規則(Affinity / Anti-Affinity Rules)……等。

此外,WAC 管理平台也支援部署和管理新版容器工具,舉例來說,透過 WAC 管理平台為內部資料中心內的 Windows Server 安裝 Docker 容器服務,支援經常使用的 Windows 容器映像檔,並且無須進行標記和鍵入容器映像檔名稱即可下載使用。同時,為了避免破壞 Kubernetes 叢集進行擴充節點主機工作任務,所以 WAC 管理平台一旦感知節點主機為 Kubernetes 叢集所屬的成員主機時,便會停用破壞性的操作,例如,停止容器,避免干擾 Kubernetes 叢集的維運管理作業。

圖 6、新版 WAC v2009 支援部署和管理新版容器工具





實戰 WAC 建構 HCI 超融合叢集

在實務上,企業和組織希望建構 HCI 超融合叢集時,應該如何挑選適合的 x86 硬體伺服器。建議可以參考 Azure Stack HCI Catalog 網站,挑選企業和組織習慣採用的 x86 硬體伺服器品牌,以及通過 Azure Stack HCI 驗證程序的型號,確保各項硬體元件的韌體和驅動程式為穩定和最佳化的版本。

在本文實作環境中,總共建立 4 台 Windows Server 2019 主機,第一台主機擔任 DC 網域控制站的角色(網域名稱為 hci.weithenn.org),另一台主機擔任 Windows Admin Center 管理平台的角色,最後二台主機則擔任 HCI 超融合叢集中的節點主機。同時,這 4 台 Windows Server 2019 主機,皆安裝最新的安全性更新。
請注意,當 Windows Server 2019 從獨立主機提升為 DC 網域控制站時,系統詢問存放 AD 資料庫及記錄檔和 SYSVOL 分割區,請採用主流「NTFS」檔案系統,因為 AD 資料庫尚未支援新式的「ReFS」檔案系統。

或許,有管理人員可能會有疑惑,在小型實作環境中為何不乾脆將 WAC 管理軟體,直接安裝於 DC 網域控制站當中,而要特地獨立一台主機擔任 WAC 管理平台 ?原因在於,WAC 管理平台使用的某些通訊連接埠,會與 DC 網域控制站之間發生衝突,所以當管理人員嘗試在 DC 網域控制站安裝 WAC 管理軟體時,系統將會出現「This software is not supported on domain controller machines」警告訊息並停止安裝程序(如圖 7 所示)。

圖 7、Windows Admin Center 無法安裝於 DC 網域控制站主機

在 WAC 管理主機的部份,除了基本的組態設定並加入「hci.weithenn.org」網域環境之外,安裝 2020 年 9 月最新發佈的「Windows Admin Center version 2009」(如圖 8 所示)。

圖 8、採用最新釋出的 Windows Admin Center v2009 版本

在 HCI 超融合叢集節點主機的部份,建立 2 台 HCI 叢集節點主機,電腦名稱分別命名為「HCI-N01 及 HCI-N02」,每台 HCI 叢集節點主機除了作業系統硬碟之外,額外配置「5 顆」300GB 的 SSD 固態硬碟(如圖 9 所示),採用 All-Flash 類型建立 HCI 超融合叢集,並且 2 台 HCI 叢集節點主機加入「同一個」Windows AD 網域。
請注意,擔任 HCI 叢集節點角色的主機,必須安裝 Windows Server 2019「Datacenter」版本,才能順利支援建構 HCI 超融合運作架構。
圖 9、每台 HCI 叢集節點主機額外配置 5 顆 300GB 的 SSD 固態硬碟



WAC 安裝 Cluster Creation 延伸模組

上述各項前置作業準備完成後,在開始建構 HCI 超融合叢集之前,請先確保 WAC 管理平台已經安裝「叢集建立延伸模組」(Cluster Creation Extension),確保支援部署及管理 HCI 超融合叢集。

登入 WAC 管理介面後,請依序點選「Settings > Gateway > Extensions > Available extensions」項目,鍵入關鍵字「Cluster Creation」後,點選「Cluster Creation(Preview)」項目後按下 Install 鈕進行安裝程序,待安裝作業完成後即可在「Installed extensions」頁籤中,看到 Cluster Creation 延伸模組和相關資訊(如圖 10 所示)。

圖 10、為 WAC 管理平台安裝叢集建立延伸模組



選擇部署 HCI 超融合叢集架構

確認叢集建立延伸模組安裝完成後,在 WAC 管理介面 All Connections 中便會出現「Cluster Creation」子項目,點選後便進入精靈互動部署模式。

首先,在 Choose the type of cluster to create 頁面中,系統詢問管理人員準備部署哪種類型的叢集,一共支援六種不同類型的叢集,分別是「Hyperconverged、Hyperconverged+SDN、Compute Cluster、Storage Cluster、Compute Cluster+SDN、Classic Failover Cluster」,每種類型的叢集將會為節點主機安裝不同的伺服器功能和角色,並且搭配相關的組態設定。

在本文實作環境中,請點選「Hyperconverged」項目,準備建構 HCI 超融合叢集架構並按下 Create 鈕,便進入部署 HCI 超融合叢集架構組態設定流程,在這個自動化組態設定流程中總共有四個階段,分別是「Get Started > Networking > Clustering > Storage」。

在 Get Started 第一個階段中,系統提示相關前置作業資訊,例如,叢集節點主機必須採用 Windows Server 2016 或 Windows Server 2019 的 Datacenter 版本才行……等,請管理人員再次檢查是否符合相關條件,避免稍後部署 HCI 超融合叢集時發生非預期的錯誤。

在 1.2 Enter an account 頁面中,請鍵入管理者帳號及密碼,這個管理者帳號必須是「網域帳號」,並且必須具備相關主機「Local Administrators Group」的身份和權限,在本文實作環境中管理帳號為「hci.weithenn.org\weithenn」。

在 1.3 Add servers 頁面中,鍵入本文實作環境的 2 台 HCI 超融合叢集節點主機的電腦名稱,分別是「HCI-N01」和「HCI-N02」後按下 Add 鈕。此時,系統將會進行相關檢查作業,確認是否符合建構 HCI 超融合叢集(如圖 11 所示)。

圖 11、檢查 2 台 HCI 超融合叢集節點主機是否符合條件

在 1.4 Install features 頁面中,系統將會檢查是否已經安裝建構 HCI 超融合叢集時,所需要的伺服器角色和功能。由於,在前置作業中僅為 HCI 超融合叢集節點主機進行基礎設定和加入網域,因此檢查的結果是尚未安裝相關伺服器角色和功能,請按下 Install features 鈕,為 2 台 HCI 超融合叢集節點主機安裝所需的伺服器角色和功能,等待幾分鐘後順利安裝所需的伺服器角色和功能後,請按下 Next 鈕進入下一個部署程序(如圖 12 所示)。

圖 12、為 2 台 HCI 超融合叢集節點主機安裝所需的伺服器角色和功能

由於,剛才所安裝的伺服器角色和功能中,例如,Hyper-V 伺服器角色,需要重新啟動主機後才能套用生效。因此,在 1.5 Restart servers 頁面中,可以看到 2 台 HCI 超融合叢集節點主機,在 Status 的欄位皆為「Restart needed」,請按下 Restart servers 鈕重新啟動 2 台 HCI 超融合叢集節點主機。



HCI 超融合叢集部署階段 2 - Networking

進入 HCI 超融合叢集部署階段 2,便是部署 HCI 超融合叢集虛擬交換器和虛擬網路環境的部份。首先,在 2.1 Verify network adapters 頁面中,系統將會檢查每一台 HCI 超融合叢集節點主機,具備多少張網路卡以及是否建立網路卡小組……等(如圖 13 所示)。
倘若,管理人員僅是進行測試未建立網路卡小組時,可能會得到「Adapter symmetry validation failed.」的檢查錯誤訊息。
圖 13、檢查每一台 HCI 超融合叢集節點主機網路卡資訊

在 2.2 Select management adapters 頁面中,請管理人員選擇每台 HCI 超融合叢集節點主機,用於管理用途的網路卡,在本文實作環境中,針對管理用途的網路卡已經建立網路卡小組,因此勾選「Microsoft Network Adapter Multiplexor Driver」項目,同時系統提示會將選擇的網路卡名稱改為「Management」以利識別。
倘若,管理人員未明確選擇管理用途的網路卡,則系統將會使用任意網路卡進行管理網路流量的傳輸作業。

在 2.3 Edit adapter properties 頁面中,管理人員可以看到 HCI 超融合叢集節點主機中,所有網路卡的網路資訊,包括,IP 位址、網路遮罩、MAC 位址……等。值得注意的是,運作環境中若有搭配 VLAN ID 的話,也請在網路卡的 VLAN ID 欄位中加入,若實體交換器有啟動 Jumbo Frame 的話,請參考網路卡廠商提供的手冊,並在此頁面中展開 Advanced 項目,在 Jumbo packet size 欄位中填入適合的數值。
預設情況下,Jumbo packet size 欄位值為未啟用 Jumbo Frame 的 1514

在 2.4 Create virtual switch 頁面中,將會為每一台 HCI 超融合叢集節點主機,建立 Hyper-V vSwitch 虛擬網路交換器,值得注意的是並非建立一般 vSwitch 虛擬網路交換器,管理人員可以看到預設已經勾選「Use switch-embedded teaming」選項。因此,稍後將會建立支援 RDMA 卸載功能的「SET(Switch-Embedded Teaming)」虛擬網路交換器(如圖 14 所示)。

圖 14、建立支援 RDMA 卸載功能的 SET(Switch-Embedded Teaming)虛擬網路交換器



HCI 超融合叢集部署階段 3 - Clustering

進入 HCI 超融合叢集部署階段 3,系統會在建構 HCI 超融合叢集之前,執行「叢集驗證」(Cluster Validation)的動作,確保每台 HCI 超融合叢集節點主機符合各項運作需求,避免稍後建立 HCI 超融合叢集時發生非預期的錯誤。

在 3.1 Validate cluster 頁面中,按下 Validate 鈕後便開始執行叢集驗證作業,值得注意的是在開始執行叢集驗證作業時,系統會彈出啟用 CredSSP 驗證機制的說明,請按下 Yes 鈕進行啟用並執行叢集驗證的動作(如圖 15 所示)。
倘若無法順利執行驗證機制,並得到「The WinRM client cannot process the request.」的錯誤訊息時,管理人員可以在 HCI 超融合叢集節點主機上,手動執行「Enable-WSManCredSSP -Role "Server"」PowerShell 指令,待部署完成後再進行停用的動作即可。
圖 15、啟用 CredSSP 驗證機制並執行叢集驗證工作任務

當叢集驗證工作任務經過幾分鐘完成檢查作業後,管理人員可以按下 Download report,下載容錯移轉叢集驗證報告查看檢查作業細項(如圖 16 所示)。

圖 16、通過叢集驗證工作程序並查看檢查作業細項

在 3.2 Create cluster 頁面中,請於 Cluster name 欄位鍵入 HCI 超融合叢集名稱,本文實作名稱為「S2D-Cluster」,在 Networks 的部份保持預設值「Use all networks」即可,在 IP addresses 選擇「Specify one or more static addresses」項目,然後鍵入 HCI 超融合叢集 IP 位址,本文實作為「10.10.75.20」然後按下 Add 鈕,最後按下 Create cluster 鈕執行建立容錯移轉叢集的動作,同樣經過幾分鐘後便順利建立容錯移轉叢集(如圖 17 所示)。

圖 17、成功建立容錯移轉叢集



HCI 超融合叢集部署階段 4 - Storage

HCI 超融合叢集部署的最後一個階段,便是將儲存資源整合至剛才所建立的容錯移轉叢集內。首先,在 4.1 Verify drives 頁面中,將會檢查每台 HCI 超融合叢集節點主機中,可用於 HCI 超融合叢集的儲存裝置,在本文實作環境中,正確檢查出每台 HCI 超融合叢集節點主機,額外配置的 5 顆 300GB SSD 固態硬碟(如圖 18 所示)。

圖 18、每台 HCI 超融合叢集節點主機皆額外配置 5 顆 300GB SSD 固態硬碟

值得注意的是,倘若儲存裝置已經「宣告」(Claimed)使用,例如,硬碟初始化為 MBR/GPT、格式化為 NTFS/ReFS 檔案系統...…等。那麼,屆時這些已經宣告使用的儲存裝置,便無法整合加入至 HCI 超融合叢集的儲存資源當中。因此,在 4.2 Clean drives 頁面中,提醒管理人員再次確認儲存裝置未進行宣告,如果無法確認的話,請按下 Clean drives 鈕執行儲存裝置內容清空的動作(如圖 19 所示)。

圖 19、執行儲存裝置內容清理的動作

在 4.3 Validate Storage 頁面中,針對儲存裝置是否能加入 HCI 超融合叢集的儲存資源進行驗證,驗證作業完成後同樣可以按下 Donwload report,查看容錯移轉叢集報表中,針對 Storage Spaces Direct 的驗證檢查細項(如圖 20 所示)。

圖 20、通過 HCI 超融合叢集儲存資源驗證程序並查看驗證報表內容

在 4.4 Enable Storage Spaces Direct 頁面中,請按下 Enable 鈕執行啟用 Storage Spaces Direct 技術,也就是在原有的容錯移轉叢集架構中整合儲存資源,正式成為 HCI 超融合叢集架構。經過幾分鐘的等待時間後,順利啟用 Storage Spaces Direct 技術,同樣的管理人員可以下載報表檔案查看詳細資訊(如圖 21 所示)。

圖 21、HCI 超融合叢集建構完成



WAC 管理 HCI 超融合叢集

至此,已經順利透過 WAC 管理平台部署 HCI 超融合叢集。同時,在 WAC 管理介面 All connections 清單中,應該自動出現剛才部署完成的 S2D-Cluster 超融合叢集,倘若未出現的話管理人員也可以依序點選「Add > Server Clusters > Add」項目,然後在 Cluster Name 欄位鍵入「s2d-cluster」HCI 超融合叢集名稱,開始透過 WAC 管理 HCI 超融合叢集(如圖 22 所示)。

圖 22、準備透過 WAC 管理 HCI 超融合叢集

現在,管理人員便可以透過 WAC 管理平台,看到 HCI 超融合叢集的各種使用率和工作負載情況,包括,HCI 叢集節點主機數量、儲存裝置數量、運作的 VM 虛擬主機數量、HCI 叢集整體 CPU/Memory/Storage 工作負載情況、IOPS 儲存效能、Latency 延遲時間、Throughput 傳輸速率……等(如圖 23 所示)。

圖 23、透過 WAC 管理平台查看和管理 HCI 超融合基礎架構





結語

透過本文的深入剖析及實作演練,相信讀者應該可以充份感受到 WAC 管理平台的強大功能和便利性,同時透過 WAC 管理平台即可輕鬆部署 HCI 超融合叢集基礎架構,而無須如同過往建置時必須敲打一堆 PowerShell 指令,除了有效避免人為打錯指令造成非預期的錯誤之外,整體的部署速度也將加快許多。