︿
Top


網管人雜誌

本文刊載於 網管人雜誌第 230 期 - 2025 年 3 月 1 日出刊,NetAdmin 網管人雜誌 為一本介紹 Trend Learning 趨勢觀念、Solution Learning 解決方案、Technology Learning 技術應用的雜誌,下列筆記為本站投稿網管人雜誌獲得刊登的文章,網管人雜誌於每月份 1 日出刊您可於各大書店中看到它,或透過城邦出版人讀者服務網進行訂閱。





本文目錄






前言

最新的 Nutanix AOS 6.10 版本,在 2024 年 10 月正式發佈,並且為「長期支援」(Long Term Support,LTS)版本,除了擁有更長的支援時間 12-15 個月以及臭蟲修復之外,也包括過去發佈版本的所有新增及增強功能(如圖 1 所示)。

圖 1、Nutanix AOS 版本和其它主要元件版本對應資訊示意圖

事實上,前一個 LTS 長期支援版本為 AOS 6.5.x,而後續發佈的 AOS 6.6 及 6.7 版本,皆為「短期支援」(Short Term Support,STS)版本,雖然僅擁有升級及維護 3-6 個月的支援期間,但此版本的主要功能在於提供新增特色功能。

至於,前一個版本 AOS 6.8,則是屬於「短期擴充支援」(Extended Short Term Support,eSTS)版本,雖然主要也是以提供新增特色功能為主,但是提供比 STS 短期支援更長的 12 個月支援時間,詳細資訊請參考 Nutanix KB-5505 知識庫文件





AOS 亮眼新功能

如上所述 AOS v6.10 版本為 LTS 長期支援版本,主要在於臭蟲修復和系統穩定性,但也同時包括過去 STS 的 AOS v6.6 和 v6.7 版本,以及 eSTS 的 AOS v6.8 和 v6.8.1 的新增特色功能,下列將逐一盤點這些亮眼新功能,能夠對企業和組織的地端資料中心帶來哪些優勢。



AOS 6.6 採用第 8 代 AHV 虛擬化平台

在 2023 年 1 月發佈的 AOS 6.6 版本中,採用新版的 Prism Central 2022.9,搭配第 8 代的 AHV 虛擬化平台,除了在 AHV Hypervisor 當中包含最新開放源始碼元件之外,也減少許多系統服務和 Open vSwitch 虛擬交換器當中,有關無效中斷的情況,以便提升系統空閒時輪詢的執行效率,對於 EUC 和 VDI 虛擬桌面等密集系統,以及針對延遲時間敏感的 EPIC 和 SAP 工作負載,在效能表現上都有明顯的提升。

此外,在這個版本中,Guest VM 客體作業系統,也開始支援採用「虛擬可信任平台模組」(Virtual Trusted Platform Module,vTPM)的 Windows 11 作業系統,以便提升針對韌體攻擊的安全性(如圖 2 所示)。

圖 2、從 AOS 6.6 版本開始支援 Windows 11 vTPM 以抵擋韌體攻擊

在過去的 AOS 6.1 舊版中,「儲存原則」(Storage Policy)是套用於儲存容器當中,然後將 VM 虛擬主機存放至符合需求的儲存容器,一旦運作環境中有多個叢集時,必須分別為每個叢集建立儲存容器才行。

從 AOS 6.6 版本開始,管理人員只要在 PC 管理主控台中建立儲存原則,便能將儲存原則套用至 VM 虛擬主機,也無須為每個叢集分別建立儲存容器,並且支援將「複寫份數」(Replication Factor,RF),套用至 VM 虛擬主機層級,同時也提供儲存原則檢查功能,幫助管理人員快速找出不符合儲存原則的 VM 虛擬主機(如圖 3 所示)。

圖 3、AOS 6.6 開始支援儲存原則直接套用至 VM 虛擬主機層級

雖然,過去的 AOS 版本皆支援「遠端直接記憶體存取」(Remote Direct Memory Access,RDMA),但是在組態設定 RDMA 時較為麻煩,必須實體網路交換器搭配 PFC 優先流量控制,和 ECN 明確擁塞通知等組態設定,同時在使用 Foundation 部署和建立叢集時,便要進行 RDMA 的啟用設定才行。

從 AOS 6.6 版本開始,只要採用支援「零接觸 RoCE」(Zero Touch RoCE,ZTR)功能的 RDMA 網路卡,便可以組態設定啟用 RDMA 特色功能,無須搭配實體網路交換器的組態設定,因此也無須擔心實體網路交換器的相容性,同時也無須強制在 Foundation 部署和建立叢集時啟用,現在只要透過 Prism 管理介面,便能輕鬆啟用 RDMA 特色功能,提升整體儲存效能並降低 CPU 工作負載(如圖 4 所示)。

圖 4、透過 Prism 管理介面啟用 RDMA 特色功能

在 AOS 6.6 版本中,也針對「重複資料刪除」(Deduplication)「清除編碼」(Erasure Coding,EC),這二大儲存功能進行增強。在重複資料刪除的部份,改為在「Sub Extent」層級便進行處理,以便提升執行效率,而非過去傳統整個 1MB Extent 層級進行處理。

在清除編碼的運作機制中,雖然和傳統 RAID-5/RAID-6 運作機制類似,主要差異在於資料和 Parity 驗算,是分佈在單台伺服器節點上,而非分佈在本機儲存裝置中,同時在更新資料時會重新計算 Parity 所需要的叢集資源,並且只有被系統判斷為「Write-Cold」的資料,才會進行清除編碼的動作,也因為 Nutanix 物件資料僅會寫入一次,所以能夠最佳化儲存空間和叢集運算資源(如圖 5 所示)。

圖 5、AOS 支援清除編碼運作架構示意圖

此外,在 AOS 6.6 和 PC 2022.9 版本中,針對 NearSync 的增強支援 20 秒 RPO 。簡單來說,在叢集中受到 NearSync 保護的 VM 虛擬主機,除了具備每小時「復原點」(Recovery Points)之外,並且能夠恢復最後 15 分鐘的 NearSync 快照內容(如圖 6 所示)。

圖 6、在 AOS 6.6 和 PC 2022.9 中 NearSync 機制操作介面示意圖



AOS 6.7 支援跨叢集即時遷移 VM

AOS 6.7 為搭配 Prism Central 2023.3 管理主控台,同時包括新一代的 AHV 9 虛擬化平台。在舊版的 AOS 平台中,雖然可以透過 AHV Metro Availability 機制(如圖 7 所示),搭配兩個叢集之間啟用同步儲存複寫技術,達到類似將 VM 虛擬主機在兩個叢集之間遷移的效果,但是在組態設定上管理人員需要花費更多心力才行。

圖 7、AHV Metro Availability 運作架構示意圖

從 AOS 6.7 版本開始,無須像過去繁雜的組態設定,以及兩個叢集之間是否由同一台 PC 管理主控台所納管,都可以透過「跨叢集即時遷移」(Cross-Cluster Live Migration,CCLM)機制,將 VM 虛擬主機工作負載,跨越不同叢集進行即時遷移,除了遷移過程中不會造成 VM 虛擬主機停機事件(如圖 8 所示),也整合跨多個 CPU 處理器核心和網路進行多執行緒處理,讓整體遷移時間比過往版本更快完成。

此外,當管理人員在執行 VM 虛擬主機跨叢集即時遷移之前,系統還會執行相關檢查任務,例如,目標主機的 CPU、記憶體、儲存、GPU、虛擬網路……等,是否符合需求,必須通過系統檢查後才能順利執行遷移的工作任務。

圖 8、透過 PC 管理主控台跨叢集即時遷移 VM 虛擬主機

在 Nutanix Guest Tools(NGT)軟體部署方面,從 AOS 6.7 版本開始也有所提升以便簡化大規模部署 NGT,開始支援使用軟體套件管理工具進行安裝,無須像過去需要透過 SSH 或 WinRM 連線,進入每一台 VM 虛擬主機執行安裝作業。現在,針對 Windows 虛擬主機支援 exe 安裝執行檔,以及 Linux 虛擬主機支援 deb 和 rpm 安裝檔,同時支援第三方軟體套件管理工具,例如,Microsoft Intune、HCL BigFix 等端點管理工具,或採用 Ansible 自動化機制,達成 NGT 軟體客製化安裝的目的。

此外,在 AOS 6.7 版本中,針對 AHV 虛擬化平台的儲存效能提升再次最佳化。簡單來說,透過 AHV Turbo Mode 技術,最大化提升資料路徑的工作效率,在使用者空間中達成多個 I/O 佇列,以便最大化提升資料儲存多工並性,同時降低 AHV 節點主機的 CPU 處理器使用率。

預設情況下,AOS 和 AHV 之間的路徑連接,採用 iSCSI 通訊協定達成,倘若採用支援的 RDMA 介面卡時,則能夠過 iSCSI Extensions for RDMA(iSER),更進一步將資料直接傳輸到 Stargate 當中,無須中斷系統上的 CPU 處理程序,因此除了避免再次複製記憶體資料,並降低 CPU 處理器使用率,達到降低網路延遲提升儲存效能的目的(如圖 9 所示)。

圖 9、AHV Turbo Mode 採用 iSCSI 通訊協定或 iSER 加快儲存效能



AOS 6.8 發佈 X-Small PC 管理主控台

首先,在 AOS 6.8 版本中,針對資料庫工作負載的部份,透過 AES、Blockstore、SPDK 等機制提升儲存效能,其中「自主擴充儲存」(Autonomous Extent Store,AES)機制(如圖 10 所示),最佳化後的中繼資料機制,有效降低 CPU 處理器使用率並提升效能,特別是在工作負載產生持續隨機讀取和寫入資料的情境中。

圖 10、最佳化後的 AES 機制運作架構示意圖

根據 Nutanix 內部測試結果顯示,最佳化後的 AES 機制讓大型資料庫工作負載,例如,Oracle 或 Microsoft SQL 資料庫工作負載,在 IOPS 儲存效能整體表現提升 17%,並且資料讀取延遲時間降低 16%,而資料寫入延遲時間則降低 3%(如圖 11 所示)。

圖 11、最佳化後的 AES 機制大幅提升大型資料庫工作負載儲存效能

從 AOS 6.8 版本開始,當管理人員的 PC 管理主控台納管多個叢集時,在建立 VM 虛擬主機選擇目標叢集時,將會發現系統多出一個「自動選擇叢集」(Automatic Cluster Selection)選項(如圖 12 所示),簡單來說,採用此選項時,系統將會自動根據叢集資源可用性、主機親和性、VM 虛擬主機規格……等,更聰明的放置 VM 虛擬主機至適合的叢集運作。

圖 12、自動選擇叢集功能,系統評估後聰明的放置 VM 虛擬主機至適合的叢集運作

在過去的 PC 管理主控台規格中,即便是最小的 Small PC 也需要至少 6 vCPU、28GB vRAM、500GB vDisk 的資源,這對於小型規模的叢集來說,可能佔用過多的資源,導致無謂的資源浪費,並且減少可分配給 VM 虛擬主機工作負載的資源。

從 AOS 6.8 版本開始,支援 X-Small PC 規格,只要 4 vCPU、18GB vRAM、100GB vDisk 資源即可(如圖 13 所示),但是能夠管理的叢集規模也能夠符合小型企業及組織的需求,X-Small PC 支援管理 5 個叢集、50 台 AHV 主機、500 台 VM 虛擬主機、5 位管理人員同時操作。

圖 13、X-Small PC 規格管理主控台所需硬體資源示意圖

值得注意的是,X-Small PC 規格的管理主控台,不支援用於中大型規模的相關功能,例如,不支援將 X-Small PC 由原本單台 VM 虛擬主機,擴充至具備高可用性的 3 台 VM 虛擬主機架構,不支援 Nutanix DR 異地備援機制,不支援 Nutanix NKP 容器引擎、不支援 Flow Virtual Networking 和 Flow Network Security……等功能,倘若需要這些中大型規模的相關功能時,管理人員必須先將 X-Small PC 升級為 Small、Large、X-Large 規格的 PC 管理主控台才行。





實戰 – 製作最新 AOS 6.10 安裝映像檔

由於最新發佈的 Nutanix CE 2.1 版本中,採用的是 AOS 6.8.1 而非最新發佈的 AOS 6.10 版本,但是管理人員會發現,即便安裝 Nutanix CE 2.1 版本後,在 AOS 6.8.1 叢集中嘗試使用 LCM 更新至 AOS 6.10 版本時,將會發現系統提示無法辨別硬體類型而失敗(如圖 14 所示),並提示參考 Nutanix KB-15185 知識庫文章

圖 14、無法由 Nutanix CE 2.1 安裝的 AOS 6.8 透過 LCM 升級至 AOS 6.10 版本



部署 Foundation VM

簡單來說,因為是巢狀式虛擬化環境,所以無法通過 LCM 更新機制的硬體伺服器驗證程序。雖然,無法透過 LCM 更新機制,將 Nutanix CE 2.1 安裝的 AOS 6.8.1 升級至 AOS 6.10,但是管理人員可以透過部署 Foundation VM,以及下載最新 AOS 6.10 和 AHV 映像檔,製作出可進行單台安裝作業的 Nutanix CE ISO 客製化映象檔。

首先,請登入 Nutanix 支援網站,下載最新版本的 Foundation VM(如圖 15 所示),值得注意的是,企業和組織必須具備 Nutanix 相關軟體授權,才能下載 Foundation、AOS、AHV 相關映像檔,本文實作環境中,下載可部署於 VMware Workstation 環境的 Foundation_VM-5.7.tar 檔案。

圖 15、下載最新版本的 Foundation VM v5.7

將下載的 Foundation_VM-5.7.tar 檔案解壓縮後,將會解壓縮出 .ovf 和 .vmdk 檔案,開啟 Vmware Workstation 後,依序點選「File > Open > Foundation_VM-5.7.ovf」,接著鍵入匯入後的 VM 虛擬主機名稱和路徑後按下 Import 鈕。

執行開機作業後,預設情況下會自動登入,倘若遇到需要鍵入身份驗證資訊時,請鍵入預設管理者帳號「nutanix」及密碼「nutanix/4u」,順利登入後,在圖形介面中依序點選「System > Preferences > Internet and Network > Advanced Network Configuration > Ethernet > Wired connection 1」,點選 IPv4 Settings 頁籤後,將預設的 Automatic(DHCP)選擇至「Manual」項目,然後按下 Add 鈕鍵入固定 IP 位址資訊,本文實作環境中,IP 位址、網路遮罩、預設閘道分別是「10.10.75.25,24,10.10.75.254」,按下 Save 鈕後重新啟動主機,重新啟動完成並登入系統後,管理人員可以開啟瀏覽器鍵入「https://fvm.lab.weithenn.org:8000」後,即可測試連線至 Foundation 部署畫面(如圖 16 所示)。

圖 16、順利部署 Foundation VM 及調整為固定 IP 位址



建立客製化 AOS 6.10 ISO 映象檔

雖然,官方並未正式發佈採用最新 AOS 6.10 的 Nutanix CE ISO 映像檔,但是我們只要將原有的 Nutanix CE 2.1 ISO 映象檔中,把 AOS 6.8.1 和搭配的 AHV 映像檔案抽掉即可。下列為前置作業準備的 ISO 映象檔:
  • Nutanix CE 2.1 ISO 映象檔:phoenix.x86_64-fnd_5.6.1_patch-aos_6.8.1_ga.iso
  • AOS 6.10 壓縮檔:nutanix_installer_package-release-fraser-6.10-stable-45706f65299ffde905da43b6e7d98478d071b7b9-x86_64.tar.gz
  • AHV ISO 映象檔:AHV-DVD-x86_64-el8.nutanix.20230302.102001.iso

首先,由於 AOS 6.10 壓縮檔容量超過 4GB,所以必須將檔案進行拆分才行,管理人員可以挑選順手的工具,在本文實作環境中則採用 ExpLZH for Windows 工具 ,將檔案以 3GB 的分式進行分割,執行後可以發現總共產生 3 個檔案,分別是結尾的 .001、.002、.BAT,其中 .BAT 檔案可以刪除無須保留,拆分後的檔案請重新命名為「nutanix_installer_package.tar.p00」和「nutanix_installer_package.tar.p01」。

接著使用 WinSCP 工具,將拆分後的 AOS 6.10 檔案、Nutanix CE 2.1 映象檔、AHV 映象檔,上傳至 Foundation VM 主機「/home/weithenn」路徑後,執行「sudo mount phoenix.x86_64-fnd_5.6.1_patch-aos_6.8.1_ga.iso /mnt/iso」指令掛載 Nutanix CE 2.1 映象檔,建立名稱為 AOS610 的資料夾後,將掛載的 Nutanix CE 2.1 映象檔所有資料夾和檔案,複製到 AOS610 資料夾後,卸載 Nutanix CE 2.1 映象檔。

將路徑中「AOS610\images\svm」內的檔案,置換成剛才拆分的 2 個 AOS 6.10 檔案,將路徑中「AOS610\images\hypervisor\kvm」內的檔案刪除,並複製 AHV 映象檔進去。現在,即可執行 genisoimage 指令,打包客製化具備 AOS 6.10 和 AHV 的 Nutanix CE ISO 映像檔,請切換到「/home/weithenn/AOS610」路徑後,執行「sudo genisoimage -o .. /nutanix-ce-aos-6.10.iso -R -J -T -V PHOENIX -b boot/isolinux/isolinux.bin -no-emul-boot -boot-load-size 4 -boot-info-table .」指令,系統便會打包出名稱為「nutanix-ce-aos-6.10.iso」的 ISO 映像檔(如圖 17 所示)。

圖 17、建立包含最新 AOS 6.10 的客製化 Nutanix CE ISO 映像檔



建立支援巢狀技術的 VM 虛擬主機

在巢狀式虛擬化環境中,在 AOS 6.5 和先前的舊版中,AHV 和 CVM 均採用 CentOS 7.9 作業系統版本,然而從 AOS 6.8 版本開始,AHV 和 CVM 則改為升級採用 Rocky Linux 8.9 作業系統版本。

因此,在開啟 VMware Workstation 虛擬化軟體,點選 Create a New Virtual Machine 選項後,選擇 Guest OS 客體作業系統時,請選擇 Linux 選項中的「Rocky Linux 8 64-bit」項目(如圖 18 所示),待安裝程序完成後,屆時管理人員登入便能看到,AHV 和 CVM 採用 Rocky Linux 8.9 作業系統版本。

圖 18、從 AOS 6.8 以後包含 AOS 6.10 請選擇採用 Rocky Linux 8 作業系統版本

在 SCSI 硬碟控制器部份,雖然系統預設建議採用 LSI Logic 類型,倘若安裝 VMware Workstation 的主機,採用的是 SSD 固態硬碟而非一般 HDD 機械式硬碟時,建議可以改為選擇採用「Paravirtualized SCSI」硬碟控制器(如圖 19 所示),可以有效加快 VM 虛擬主機的運作效率。

圖 19、採用 Paravirtualized SCSI 硬碟控制器加快 VM 虛擬主機運作效率

在選擇 vDisk 虛擬硬碟類型時,由於採用 Rocky Linux 8 作業系統版本,所以系統預設採用的 vDisk 虛擬硬碟類型為「NVMe」,請改為選擇採用「SCSI」選項(如圖 20 所示),否則屆時安裝完成後,由於巢狀式 VM 虛擬主機採用模擬的 NVMe 固態硬碟,將會導致 CVM 主機將無法順利啟動。

圖 20、選擇採用 SCSI 的 vDisk 虛擬硬碟類型

此外,在建立VM虛擬主機完成後,先別急著開機進入安裝程序,請使用系統管理員權限開啟 Notepad 筆記本,修改 Guest Hypervisor 虛擬主機的「.vmx」組態設定檔,加上「disk.EnableUUID = "TRUE"」參數值,確保指派給 vDisk 虛擬硬碟 Serial Number 序列號,否則在稍後的安裝程序中,可以看到硬碟未顯示 Serial Number,後續也會導致啟動叢集服務時,在 Medusa 服務啟動環境時卡住並產生錯誤,造成叢集無法順利啟動。

在安裝畫面中(如圖 21 所示),可以看到確實採用最新的 AOS 6.10 版本,以及搭配的 AHV 虛擬化平台版本 20230302.102001,在IP位址的配置如下:
  • Host IP Address: 10.10.75.11
  • CVM IP Address: 10.10.75.12
  • Subnet Mask: 255.255.255.0
  • Gateway: 10.10.75.254
圖 21、安裝最新 AOS 6.10 和搭配的 AHV 版本



部署 AOS 6.10 叢集

安裝完成並重新啟動主機後,管理人員可以從 Console 登入,或是透過 SSH Client 登入 AHV 虛擬化平台和 CVM 主機,下列為系統預設的管理者帳號和密碼:
  • AHV: SSH登入、管理帳號 root、管理密碼 nutanix/4u
  • CVM: SSH登入、管理帳號 nutanix、管理密碼 nutanix/4u
  • Prism Element: Web登入、管理帳號 admin、管理密碼 nutanix/4u

首先,登入 AHV 虛擬化平台後,執行「cat /etc/rocky-release」指令,可以看到最新 AOS 6.10 的 AHV 虛擬化平台,採用 Rocky Linux 8.10 作業系統版本(如圖 22 所示),接著執行「virsh list」指令,查詢運作於 AHV 虛擬化平台之上的 CVM 主機運作情況,當 State 欄位狀態由原本的 paused 轉換為「running」後,表示 CVM 主機已經啟動完畢。

圖 22、最新 AOS 6.10 的 AHV 虛擬化平台採用 Rocky Linux 8.10 作業系統版本

確認 CVM 主機成功運作後,管理人員同樣可以透過 SSH Client 登入 CVM 主機,執行「cat /etc/rocky-release」指令,查詢 CVM 主機為採用 Rocky Linux 8.9 作業系統版本,執行「ip -c -br a」指令查詢 CVM 網路組態,可以看到「eth0」介面,使用先前安裝程序中組態設定的「10.10.75.12」位址,而「eth1」介面則為系統預設的「192.168.5.2」和「192.168.5.254」位址。

確認 AHV 和 CVM 網路組態設定無誤後,由於本文實作環境是部署單一節點的叢集,所以在「資料可用性」(Data Resiliency)的部份,只能搭配「--redundancy_factor=1」參數,也就是不支援資料保護的狀況,倘若管理人員需要確保資料可用性的話,必須部署多台節點的叢集才能支援。

請切換到 CVM 主機操作畫面,執行「cluster -s 10.10.75.15 --redundancy_factor=1 create」指令(如圖 23 所示),部署並啟動叢集的動作,需要等待一段時間才能完成,在叢集自動部署工作流程中,可以看到相關系統服務逐一啟動中,整個叢集的指揮中心名稱為 ZeusLeader,一旦所有叢集系統服務皆順利啟動後,系統將會出現「INFO MainThread cluster:3104 Success!」訊息,表示叢集部署作業已經順利完成,後續管理人員需要確認叢集狀態時,只要執行「cluster status」指令即可進行確認。

圖 23、確認 CVM 主機作業系統版本和網路組態後部署叢集環境





結語

透過本文的深入剖析和實戰演練後,管理人員除了理解最新 AOS 6.10 版本中,具備哪些新增特色功能和運作原理之外,透過搭配部署 Foundation VM 的方式,也能自行客製化出最新的 Nutanix CE 包含 AOS 6.10 的映像檔,以利後續測試和研究用途。
文章標籤: ,