透過 RDU 升級 vCenter 縮短停機時間讓營運如常 | 網管人 222 期



網管人雜誌

本文刊載於 網管人雜誌第 222 期 - 2024 年 7 月 1 日出刊,NetAdmin 網管人雜誌 為一本介紹 Trend Learning 趨勢觀念、Solution Learning 解決方案、Technology Learning 技術應用的雜誌,下列筆記為本站投稿網管人雜誌獲得刊登的文章,網管人雜誌於每月份 1 日出刊您可於各大書店中看到它,或透過城邦出版人讀者服務網進行訂閱。





本文目錄






前言

在 VMware vSphere 虛擬化架構中,vCenter Server 管理平台的重要性不言而喻,無論是管理 VM 虛擬主機和容器等工作負載,或是組態設定 vNetwork 虛擬網路和 vStorage 儲存資源,甚至是 vSphere vMotion 線上遷移工作負載和 vSphere HA 高可用性機制……等,都必須依靠 vCenter Server 管理平台才能達成。

然而,只要是軟體產品,便需要定期執行臭蟲修正和版本更新或版本升級的動作。在過去的 vCenter 版本中,每當 vCenter 管理平台必須執行重大安全性更新或版本升級時,在版本更新或升級過程中,都必須要部署新版本 vCenter 主機、停止舊版本 vCenter 主機內的系統服務、安裝安全性更新、安裝 Binary 檔案、匯出 / 匯入資料、執行自動化腳本、關閉舊版本 vCenter 主機、啟動新版本 vCenter 系統服務、新版本 vCenter 正式接手服務……等動作。

這樣的版本更新或升級流程中,除了部署新版本目的端 vCenter 管理平台時,不會產生「停機時間」(Downtime)之外,其餘的工作流程都將導致 vCenter 管理平台產生停機時間,增加企業和組織持續營運的風險。

因此,從 vSphere 7 Update3 版本開始,VMware 官方開始將用於 VMC on AWS 公有雲環境中,版本更新和升級機制嘗試落地,也就是由 Project Arctic 專案 所演化而來的 API-Driven 技術,套用至企業和組織的地端資料中心內,推出 vCenter Server Reduced Downtime Upgrade(RDU)特色功能,讓 vCenter 管理平台,在執行安全性更新或版本升級時,能夠將停機時間最大化縮短,在最新的 vSphere 8 Update 2 版本中,甚至能將版本更新或升級作業程序的停機時間限縮在 5 分鐘之內。





vCenter RDU 運作架構

RDU 運作機制

那麼新版 RDU 運作機制,如何改善過往版本更新或升級的工作流程,有效降低 vCenter 管理平台停機時間呢? 首先,在階段 1 工作程序時,系統將會基於管理人員掛載的新版本 vCenter ISO 映像檔,建立和部署新版本 vCenter 虛擬主機並 Power On 開機(如圖 1 所示)。

圖 1、vCenter RDU 更新升級版本工作流程 - 階段 1

當系統順利部署新版本 vCenter 虛擬主機並開機完成後,便會進入階段 2 工作程序,系統將會自動為舊版本 vCenter 管理平台,開啟 SSH Service(Port 22)之後,傳送現有 vCenter 資料庫和相關組態設定檔至新版本 vCenter 主機內(如圖 2 所示)。

圖 2、vCenter RDU 更新升級版本工作流程 - 階段 2

當資料傳輸作業完成並且通過系統檢查程序後,將會進入階段 3 工作程序,系統顯示「切換」(Switchover)鈕可以執行。請注意,更新升級版本工作流程至此都未發生任何停機時間,只有當管理人員按下切換鈕,並且新版本 vCenter 主機接手完成的這段期間(通常在 5 分鐘內),才會發生停機時間(如圖 3 所示)。

圖 3、vCenter RDU 更新升級版本工作流程 - 階段 3

一旦新版本 vCenter 主機接手完成後,正式取代舊版本 vCenter 的 FQDN 及 IP 位址……等,此時便進入階段 4 工作程序,系統將會自動將舊版本 vCenter 主機關機,並且清除過程中產生的暫存資料(如圖 4 所示)。值得注意的是,在 RDU 版本更新升級機制的幫助下,確實能有效避免 vCenter 管理平台,在執行版本更新或版本升級時可能導致系統損壞的情況,並有效減少過程中產生的停機時間,然而它並不能夠取代企業或組織原有的 vCenter 備份機制,這是管理人員最容易忽略的地方。

圖 4、vCenter RDU 更新升級版本工作流程 - 階段 4



RDU 更新升級流程

雲端環境的 vSphere+ 更新機制重點為「遷移」(Migration-Base),在版本更新或升級動作執行之前,預先部署新版本的 vCenter 管理平台,並將舊版本 vCenter 資料庫和組態設定等資料,傳輸複寫至新版本 vCenter 主機內,屆時只要進行新舊版本的 vCenter 管理平台切換作業即可。

然而,和過往版本更新升級工作流程最主要的差別在於,新舊版本 vCenter 管理平台之間,在 vCenter 資料庫和組態設定資料複寫期間,舊版本的 vCenter 管理平台仍然能夠正常運作,執行相關進階特色功能並管理虛擬化基礎架構,整個版本更新升級工作流程中,唯一會產生停機時間的部份,就是在 vCenter 資料庫和組態設定複寫程序完成後,管理人員正式觸發切換工作任務,將舊版本 vCenter 停止系統服務,由新版本 vCenter 接手後啟動系統服務的這段期間,原則上來說會在五分鐘之內完成,這和過往版本更新升級的停機時間相比減少許多。

新式 RDU 版本更新升級機制,如下所條列共有五個步驟(如圖 5 所示),管理人員也可以在實際操作期間,查看每個工作任務的執行進度:

1. 掛載 ISO 映像檔: 將準備部署新版本的 vCenter ISO 映像檔進行掛載。值得注意的是,這個 vCenter ISO 映像檔必須是完整的安裝 ISO 映像檔,而非僅是含有安全性更新或修補臭蟲的 ISO 映像檔。

2. 檢查備份: 系統將會進行檢查和確認,運作中的舊版本 vCenter 管理平台,是否已經執行過備份的工作任務,倘若發現 vCenter 管理平台未定期執行備份,或未包含最新的備份時,將會提醒管理人員必須執行備份工作任務後,再回到此頁面繼續版本更新升級流程。

3. 更新 LCM Plugin 外掛程式: 系統將會在舊版本 vCenter 管理平台中,更新 vCenter LCM 生命週期服務的 Plugin,以便後續部署新版本 vCenter 管理平台時,能夠在 LCM Plugin 方面保持一致,一旦 LCM Plugin 外掛程式更新完畢後,系統將會自動重新整理 vCenter 管理介面,管理人員可以輕易發現管理介面有些許不同。

4. 組態設定新的 vCenter: 針對部署的新版本 vCenter 主機進行組態設定作業,包括,vCenter 虛擬主機名稱、臨時的 root 管理帳號和密碼、臨時的 vNetwork 虛擬網路設定……等,管理人員可以選擇繼承舊版本 vCenter 原有的組態設定,也可以選擇自行變更組態設定內容。在預設情況下,部署的新版本 vCenter 主機,將會繼承舊版本 vCenter 主機中,FQDN、IP 位址、root 管理帳號密碼和網路身份驗證……等。

5. 升級與執行切換: 一旦部署的新版本 vCenter 主機複寫資料和組態設定完畢,並且兩台 vCenter 主機都保持正常運作狀態時,管理人員便能決定何時執行切換作業,原則上可以立即執行切換 vCenter 管理平台的工作任務,也可以排程設定一天後或一週後都可以。值得注意的是,切換期間原有 vCenter 停止服務,新部署的 vCenter 接手並啟動服務,通常還是未產生五分鐘之內的停機時間。

圖 5、RDU 版本更新或升級運作流程示意圖





實戰演練 – 透過新式 RDU 進行 vCenter 版本升級

由於,RDU 是全新自我管理的版本升級機制,所以並未支援舊版 vCenter 7 升級至新版 vCenter 8 。目前,支援從 vCenter 8.0 GA、8.0 U1、8.0 P02 升級至最新 8.0 U2 版本。在實戰演練小節,將使用 RDU 機制將舊版 vCenter 8.0(如圖 6 所示),升級至最新 vCenter 8.0 U2 版本。

圖 6、準備透過新式 RDU 機制升級至最新 vCenter 8.0 U2 版本



掛載新版 vCenter ISO 映像檔

首先,將下載完成的最新版本 vCenter 8.0 U2 的 ISO 映像檔,上傳至 Datastore 儲存資源或 Content Library 當中,並組態設定掛載至舊版 vCenter 8.0 的 CD/DVD 光碟機即可。值得注意的是,掛載時記得勾選「Connected」和「Connect At Power On」選項(如圖 7 所示),這兩個選項比較常被管理人員忽略,導致看似掛載 ISO 映像檔成功卻無法使用的情況。

圖 7、掛載最新版本 vCenter 8.0 U2 的 ISO 映像檔



選擇採用的 vCenter 新版本

請在 vCenter 管理介面中,依序點選「vCenter Server > Updates > vCenter Server Update」,在 RDU Update 區塊中,可以看到 1. Target Version 項目,除了顯示現有 vCenter 版本資訊,以及 VAMI(vCenter Server Appliance Management Interface)資訊之外,請點選 Target version 欄位中的 Select Version 連結,在彈出視窗中將會顯示可更新升級的 vCenter 版本,建議選擇和剛才上傳的 ISO 映像檔相同版本,避免系統透過網際網路下載最新版本。

點選完畢後,系統將會自動執行來源預先檢查作業,一旦通過預先檢查作業後,管理人員應點選 Product Interoperability 產品互通性頁籤,確保新版本的 vCenter 主機,和 ESXi 虛擬化平台之間的版本相容性,是否順利通過系統檢查和驗證作業(如圖 8 所示)。

圖 8、選擇升級新版 vCenter 並檢查產品相容性



vCenter 備份確認與檢查

在 2. Backup 項目中,系統再次提醒管理人員,在執行 vCenter 管理平台版本升級之前,請先再次確認是否執行相關備份作業,避免升級版本過程中,倘若發生非預期的錯誤導致 vCenter 管理平台無法正常運作時,可以透過最後一次的完整備份快速進行復原作業。



更新 vCenter LCM Plugin

在 3. Prepare source 項目中,系統提醒管理人員由於 vCenter 管理平台版本升級後,屆時將會連帶將 LCM(Life-Cycle Manager)一起進行版本升級,在此之前請先按下 Update Plugin,預先執行 LCM Plugin 更新作業,一旦 LCM Plugin 更新的工作任務完成後,系統將提醒管理人員重新整理瀏覽器,此時 vCenter 圖形管理介面,將會因為 LCM Plugin 更新後而有所改變(如圖 9 所示)。

圖 9、成功更新 LCM Plugin 之後,vCenter 管理介面重整後有些微變化

值得注意的是,倘若在更新 LCM Plugin 階段中,發生失敗產生「Update 8.0.2.00000 for component vlcm is not found.」錯誤訊息時,請參考 VMware KB94779 知識庫文章內容,下載「fix_rdu.sh」指令碼至 vCenter 管理平台,然後執行修正作業後再次嘗試更新 LCM Plugin。



組態設定新版本 vCenter

在 4. Target Appliance 項目中,將會組態設定新版 vCenter 管理平台環境,請按下 Configure Target Appliance 進行組態設定作業,事實上這個組態設定流程和部署 vCenter 管理平台非常相似。首先,在 1. License Agreement 使用者授權協議畫面中,請勾選「I accept…」選項後按下 Next 鈕進入下一個組態設定程序。

在 2. CEIP 頁面中,必須勾選「Join…」選項,確保後續 vSphere Health、Host Hardware Compatibility、vCenter Server Update Planner……等功能持續運作。在 3. Target Location 頁面中,管理人員可以選擇「Deploy in the same location as source」選項,將新版本的 vCenter 管理平台,跟現有舊版 vCenter 部署在一起,或是選擇「Deploy in the different location as source」選項,將新版本 vCenter 管理平台,部署至其它 ESXi 虛擬化平台中,並提供管理者帳號及密碼以利連線作業。

在 4. Deployment Type 頁面中,選擇「Same Configuration」選項時,屆時新版本 vCenter 管理平台,將完全套用舊有 vCenter 管理平台的所有組態設定,倘若管理人員需要調整新版本 vCenter 管理平台的組態設定,例如,提升 vCenter 管理平台的 Size 運作規模、調整 vCenter 存放在不同資料夾、調整 vCenter 存放在不同的 Datastore 儲存資源……等,請點選「Detailed Configuration」選項(如圖 10 所示)。

圖 10、針對新版本 vCenter 管理平台調整相關組態設定

在 5. Folder 頁面中,請選擇稍後部署的新版本 vCenter 管理平台,存放在 Datacenter 中的哪個資料夾內。在 6. Compute Resource 頁面中,選擇新版本 vCenter 運作在哪個 Cluster 叢集、Resource Pool 資源集區、ESXi 虛擬化平台中。在 7. VM Appliance details 頁面中,組態設定新版本 vCenter 的 VM 虛擬主機名稱,以及暫時的 root 管理密碼(如圖 11 所示),值得注意的是,VM 虛擬主機名稱需要避免使用「%,/,\」這 3 個字元,否則將會發生非預期的錯誤,至於 root 管理密碼的部份除了必須符合複雜性原則之外,密碼的總長度不能超過「20」個字元。

圖 11、組態設定新版本 vCenter 的 VM 虛擬主機名稱和 root 管理密碼

在 8. Deployment Size 頁面中,預設採用和舊版本 vCenter 一樣的 Size 運作規模,倘若企業和組織因為專案或營運規模成長,導致工作負載增加時,可以考慮在此時一併將 vCenter 管理平台的 Size 運作規模進行提升。值得注意的是,新版本的 vCenter Size 運作規模,只能與舊有 vCenter 相同或更大,並不支援小於舊有 vCenter 的 Size 運作規模(如圖 12 所示)。

圖 12、部署新版本的 vCenter Size 運作規模只能相同或更大,不支援縮小 Size 運作規模

在 9. Datastore 頁面中,預設情況下,系統會選擇存放在和舊有 vCenter 一樣的 Datastore 儲存資源,管理人員可以依照需求,選擇部署新版本 vCenter 採用不同的 Datastore 儲存資源。在 10. Network Settings 頁面中,請填入部署新版本 vCenter 的相關網路組態設定內容,例如,FQDN、IP 位址……等,值得注意的是,這裡的 FQDN 和 IP 位址都是暫時使用的用途。在 11. Review 頁面中,再次檢視相關組態設定是否正確無誤,確認無誤後按下 Finish 鈕即可(如圖 13 所示)。

圖 13、再次檢視新版本 vCenter 相關組態設定是否正確無誤



部署新版本 vCenter

回到 vCenter Update Planner 頁面中,在 5. Upgrade 項目中,系統說明至此為止,新版本 vCenter 的預先部署作業和組態設定已經完成,只要按下 Start Upgrade 便會立即執行,部署新版本 vCenter 和複寫資料的動作,並且只有在「Switchover」階段,才會發生停機時間,這時間通常僅幾分鐘時間。

一旦按下 Start Upgrade 鈕之後,從 vCenter 管理介面下方的工作項目清單中可以看到,系統開始自動部署新版本的 vCenter 虛擬主機,組態設定新版本 vCenter 虛擬主機後進行 Power On 開機的動作(如圖 14 所示),並接收舊有 vCenter 的必要資料,包括,vCenter 資料庫、組態設定、TLS/SSL 憑證……等,此時舊有的 vCenter 管理平台仍持續運作中不受任何影響。

圖 14、系統自動部署並組態設定新版本 vCenter 管理平台

倘若,在部署新版本 vCenter 管理平台時,發生部署失敗或升級新版本失敗的情況,管理人員也無須擔心,系統將會自動把新版本的 vCenter 虛擬主機斷電後刪除,整個系統環境自動恢復到原有的運作狀態。



切換至新版本 vCenter 管理平台

一旦新版本 vCenter 部署並組態設定完畢後,系統的「SWITCHOVER」鈕便轉變為可執行狀態(如圖 15 所示),確認執行切換的動作後,系統便會正式將舊版來源 vCenter 的組態設定,複寫套用至新版本 vCenter 管理平台中,並且相關系統服務也將正式啟動,以便回應管理人員的各項管理操作。

圖 15、系統準備完成管理者可選擇適當時機進行 vCenter 管理平台切換

值得注意的是,vCenter 管理平台的停機時間,便是在按下 Switchover 鈕,開始執行切換工作任務,系統在確保新舊 vCenter 管理平台的資料一致後,便會將舊有 vCenter 管理平台關機,新版本 vCenter 管理平台,開始接手舊有 vCenter 管理平台的 FQDN、IP 位址、TLS/SSL 憑證、啟動所有系統服務……等(如圖 16 所示)。

圖 16、開始執行切換作業讓新版本 vCenter 管理平台接手

完成接手程序後開始回應管理人員操作,一般來說整個切換流程大約五分鐘以內即可完成,在本文實作環境中,整個切換作業花費「3 分 45 秒」,新版本 vCenter 管理平台便順利接手完成(如圖 17 所示)。

圖 17、新版本 vCenter 管理平台順利接手完成

現在,管理人員可以採用相同的 vCenter FQDN 和管理帳號及密碼登入,可以看到除了 vCenter VM 虛擬主機的名稱改變,以利識別之外其餘不變(如圖 18 所示)。此外,建議管理人員應立即為新版本 vCenter 執行備份工作任務,並且將舊版 vCenter 虛擬主機的網路連接選項取消勾選後,轉換為 VM Template 避免不小心將舊版 vCenter 開機造成衝突的情況。

圖 18、新版本 vCenter 管理平台順利接手並回應管理人員的各項管理操作





結語

透過本文的深入剖析和實作演練後,企業和組織的管理人員,除了理解新式 RDU 版本升級的運作流程外,透過實戰演練讓管理人員,能夠輕鬆完成 vCenter 管理平台版本升級的工作任務。