數據中心升級前的 11 個關鍵注意事項
日期:2022-07-20 瀏覽次數: 2431
云部署和SaaS產品已經將許多工作負載部署移出了數據中心。然而,本地數據中心仍然承載著受法律限制的工作負載和數據,這些工作負載和數據太重要、太敏感或不切實際,無法信任外部供應商。這意味著數據中心的成功升級在很大程度上依賴于此。
升級仍然是提升數據中心 IT 能力的主要手段。它們通過更換老化或性能不佳的 IT 資產來建立彈性、提高性能、降低運營成本、增強安全性并控制停機時間。但升級總是帶有風險因素:疏忽和錯誤可能導致意外停機、工作負載可用性問題、性能中斷以及不可接受的管理或安全漏洞。重要的是在第一次成功完成升級,或者至少在出現問題時有能力有效地回退。
順利、成功和有意義的數據中心升級的關鍵是準備。了解目標和每個目標的路徑,并在路上遇到障礙,為升級過程帶來巨大的收益。
1. 了解您的業務需求
當業務領導者選擇不必要的技術投資或缺乏明確的 ROI 標準時,就會出現一些成本最高和風險最高的錯誤。升級不應作為新技術的展示,而應有助于企業更有效地運營和更具競爭力。他們應該專注于以下方面:
擴展重要資源,例如存儲或計算; 為更多、新的或更新的應用程序啟用新的工作負載; 支持額外的員工、用戶或交易; 降低每個用戶或交易的成本;和 構建 IT 能力,例如工作負載彈性、業務連續性和災難恢復。
例如,服務器升級可能支持將多個工作負載整合到一個系統上,從而降低電力、空間和系統維護等成本。向基礎架構添加存儲就像向現有存儲服務器添加新磁盤一樣簡單。包括一個冗余的負載平衡服務器,以提高關鍵工作負載的可用性。
2. 確定升級目標
在明確定義業務需求的情況下,確定升級項目的范圍,并確定受升級影響的硬件、軟件、服務、策略、流程和工作流。
升級從來都不是一個全有或全無的決定。升級范圍可能非常狹窄和具體,因此請提前明確確定范圍以防止潛在的災難性疏忽,例如意外的硬件或軟件版本不兼容。
考慮老化的舊工作負載和依賴于工作負載的硬件。您可以將重要的工作負載重新設計為更新的軟件產品,在功能強大的新服務器硬件上部署更新的軟件,并淘汰老化的硬件。在這種情況下,主要升級目標將涉及舊服務器及其舊應用程序。
此外,請考慮次要范圍,例如依賴項。例如,如果那個老化的應用程序依賴于一個較舊的數據庫,您是否必須升級該數據庫及其硬件?應用程序或系統管理等實踐被視為依賴項,您應該將它們包括在范圍內。
3. 創建升級路線圖
一個升級項目或目標通常涉及多個離散的升級任務。例如,升級可能涉及向基礎架構添加兩個服務器機架,但這可能還需要增加電源和冷卻能力升級或增強 WAN 訪問。
即使是像服務器升級這樣簡單的事情也可能涉及支持工作。例如,要將 2U 服務器添加到完整機架,您可能需要先重新安置一臺或多臺其他服務器以騰出空間。這些考慮可能看起來像細枝末節,但即使是小細節也可能會延遲升級。
檢查預期目標及其依賴關系,并首先確定依賴關系。這可能是簡單地重新定位硬件以騰出適當的機架空間或升級支持平臺(例如數據庫及其服務器)的問題,然后再推出預期的升級。
4. 確定升級技術
為升級確定新產品可能就像為存儲升級選擇新磁盤或為新服務器選擇品牌、型號和負載一樣簡單。更大的升級需要更多的考慮。例如,如果需要更新一組相關服務器,請評估先進技術平臺的潛力,例如超融合基礎設施。
使用不熟悉的硬件和軟件進行升級是災難的根源,因此請盡可能在投入使用之前測試產品。使用動手評估和原理驗證項目來驗證新的硬件和軟件產品,并了解它們的部署、設置、配置和互操作性注意事項。
5. 清理或增強現有基礎設施
數據中心中的一切都有一個生命周期,而老化的基礎設施可能會對業務構成障礙。當您審查基礎架構以確定升級的范圍和要求時,請花更多時間考慮可能不會直接影響預期升級但仍可以在更廣泛的意義上使業務和基礎架構受益的任務或項目,包括以下內容:
為關鍵應用程序增加冗余; 從不再需要它的應用程序中刪除冗余; 更新老化的布線以促進更大的網絡帶寬; 更新配電和備用電源,例如配電單元和不間斷電源子系統; 重新定位機架并關閉開放的硬件間隙以增強冷卻氣流;和 審查系統管理工具和功能。
這種切向或二次升級可以提高數據中心的性能、可靠性和效率。
6. 準備文件
大多數數據中心硬件和軟件都需要各種各樣的部署細節。詳細信息包括默認網絡地址、許可數據(例如激活碼)以及設置和配置的詳細說明(例如產品手冊和用戶指南)。
組織這些數據,并在啟動升級任務之前確保一切可用。否則,由于缺少詳細信息,業務將面臨無法接受的延誤和不必要的取消風險。例如,新軟件產品可能需要許可證號或激活碼。 IT 人員不想在凌晨 2 點執行升級時爭先恐后地獲取此信息,因為此時供應商的銷售和支持人員可能無法及時響應。
7. 備份并準備恢復
當今的虛擬化數據中心環境使得將工作負載轉移到其他服務器變得相對容易,這使您能夠更換和配置空服務器。同時,您可以使用復制或快照技術復制在 VM 內運行的工作負載。盡管如此,錯誤和意想不到的后果還是會發生,即使是看似簡單的升級也可能會匆忙橫掃。在升級之前和升級期間,使用簡單的指導方針為最壞的情況做好準備,例如:
對升級過程中涉及的任何服務器應用程序或存儲系統執行完整備份; 測試修復過程并確保修復工作; 確保所有參與升級任務的 IT 人員都能成功執行恢復或回滾; 記錄現有硬件和軟件的當前配置——即使你計劃淘汰這些產品——以便在必要時將它們恢復到已知的工作狀態;和 記錄升級期間發生的所有更改——例如更改 IP 地址或將 VM 移動到不同的物理服務器——并確保這些更改反映在系統或更改管理工具中。
8. 讓利益相關者了解情況
升級可能會中斷常規業務并使重要的工作負載長時間不可用。這會影響員工、業務合作伙伴、客戶和業務領導者。數據中心升級應始終將利益相關者納入流程。
升級項目通常涉及許多任務。因此,單獨處理每項任務,并將其傳達給利益相關者。常見的通信包括以下內容:
告訴利益相關者計劃進行哪些升級,為什么需要進行這項工作,應該提供哪些更改或新功能以及工作何時進行; 提醒利益相關者升級計劃——通常包括導致實際升級任務的幾個提醒; 如果您遇到問題或延誤,向利益相關者發送更新;和 升級任務完成并恢復正常功能后,向利益相關者發送完全清除通知。
此外,如果出現問題,請提供準確的聯系信息以供支持或幫助臺訪問。例如,如果軟件升級帶有??新的特性和功能,請提前對支持人員進行這些更改的培訓,以便他們能夠有效地解決用戶的疑問和問題。
9. 驗證部署
完成升級任務后,測試并驗證硬件或軟件部署是否正常工作。例如,新服務器應該運行良好并具有安全配置。當您重新安裝或將工作負載遷移回服務器時,這些工作負載應該可以通過本地數據中心網絡訪問。在這個階段,IT 人員必須對性能進行基準測試和衡量,對升級問題進行故障排除和修復,或者在需要時執行回滾。只有當您知道一切都按預期工作時,您才應該在企業 LAN 或 Internet 上打開資源以供一般使用。
升級可能會破壞系統或應用程序管理工具。捕獲所有數據中心系統和安全管理工具中升級任務所涉及的任何更改,或準備使用您收集的文檔手動輸入更改。一些管理平臺需要額外安裝代理或驅動程序,然后管理工具才能正確監督新資產。
10. 必要時系統地展開部署
分階段推出涉及高度不確定性或風險的升級項目。例如,更新任務關鍵型遺留應用程序及其相關硬件涉及同時部署新資產——與當前資產并行——并打開環境部分進行 beta 測試,而不是簡單地在升級中替換應用程序和硬件。這可以最大限度地減少升級上線后不可預見的問題的影響,因為原始硬件和軟件仍然可用且可操作。
如果新資產按預期運行,您可以系統地將其他用戶組遷移到新資產。當您成功遷移所有用戶并徹底驗證新資產后,您可以將任何舊資產作為較小的清理升級任務停用并刪除。
11. 考慮數據中心標準
對數據中心的設計、實施、性能或可用性沒有既定要求。然而,政府、利益相關者、合作伙伴和客戶已經開始期望在一定程度上遵守某些標準。升級項目是檢查數據中心標準并考慮采用現有標準的價值的絕佳機會。
眾多代碼和最佳實踐標準可以驗證您的數據中心,包括 Uptime Institute、電信行業協會 942、美國國家標準協會/BICSI 002-2014、EN 50600 和一系列可選標準,例如能源和環境設計領導力、綠色地球儀和能源之星。了解每個標準的作用,評估其重要性或對您的業務的好處,并計劃實施所需的標準作為正在進行的數據中心升級項目的一部分。
文章來源:千家網,如侵聯刪
|