Stisknutím tlačítka "Enter" přeskočíte na obsah

NSX-T upgrade – postřehy

Spousta z Vás se již setkala s SDN (software define networking) od společnosti VMware. Nejprve tu s námi bylo NSX-V, které pomalu míří do „propadliště dějin“ a na jeho místo nastoupilo NSX-T. VMware implementuje do NSX-T nové a nové funkce a tím pádem je třeba nasazovat nové a nové verze. Upgrade jako takový, by měl být plně automatický, má i step-by-step průvodce, ale ne vždy je upgrade tak hladký jak Upgrade Guide tvrdí.

Rád bych v tomto článku shrnul některé postřehy, které jsem nabyl při, nakonec vždy úspěšných, upgradech. Zároveň doufám budu schopen průběžně tento článek doplňovat o další „hinty.“

Jako první a nejdůležitější doporučuji zkontrolovat interoperabilitu s ostatními nasazenými produkty VMware. Pokud máte nasazené, nebo nasazujete ESXi zcela jistě ve Vaší infrastruktuře máte již např. vRealize Operations nebo třeba vRealize Network Insight.

Interoperability Matrix je zde: https://interopmatrix.vmware.com/Interoperability

Jako další krok, pokud ještě nemáte nastaveném doporučuji zálohu konfigurace NSX-T. Ta se konfiguruje přes System – Backup & Restore.

Pozor: podporován je pouze protokol STFTP, tj. musíte mít k dispozici příslušné úložiště. Pro „odpůrce“ příkazové řádky doporučuji např. Linux Turnkey, který se dá stáhnout ve formě appliance a konfiguruje se přes webové GUI.

Když už zmiňuji zálohování, to má jednu zajímavou „vychytávku“ a to že umožňuje nejenom zálohovat v pravidelných intervalech, ale i při každé změně konfigurace. To vřele doporučuji, předejdete pak nemilému překvapení, když obnovíte konfigurace a některé změny vám tam budou chybět, neboť nastaly v době mezi pravidelnými zálohami a pádem. U této volby je ale třeba myslet na to, že se bude ukládat hodně dat, tj. v cílovém úložišti musí být dostatek místa.

Tato volba se skrývá pod záložkou System – Backup & Restore – Scheduled

Máme tedy zkontrolovánu kompatibilitu, provedenou zálohu a můžeme stáhnout a naimportovat upgrade balíček. Ten je ve formátu .mub a má většinou cca 6-7 GB. Důrazně doporučuji přečíst si Release Notes a Upgrade Guide před každým upgradem, předejdete pak nepříjemnostem. Např. při upgrade z NSX-T z verze tuším 2.5 na 3.0 bylo nutné před upgrade připojit k NSX managerům další disk o velikosti 100 GB.

Tento balíček pak naimportujete přes NSX-T GUI volbu System – Upgrade –  NSX Upgrade

Jakmile máte naimportovný mub soubor s upgrade balíčkem, můžete spustit pre-check.

Dá se sice přeskočit, ale odhalí možné problémy, které mohou vzninkout při upgrade. Typickým problémem je, že na některých ESXi hypervizorech není dostatek volného místa v /tmp oddíle, kam se instalují  VIB s NSX-T.  Je třeba minimálně 180 MB volného místa. Pokud používáte USB/SD karty jako bootovací médium a zároveň máte nasazenou vSAN, lehce se může stát, že v /tmp partition není dostatek místa. vSAN totiž používá tento oddíl. Řešení pro tuto situaci je jednoduché – reboot serveru. Doporučením je pro ESXi 7.0U2 a novější nepoužívat pro tmp a scratch partition USB/SD disky – více podrobností v tomto blogu – https://blogs.vmware.com/vsphere/2021/09/esxi-7-boot-media-consideration-vmware-technical-guidance.html

Upgrade probíhá v pořadí Edge – ESXi – NSX managery. Může se stát, že v průběhu upgrade opět dojde k zaplnění /tmp oddílu. Ve výchozím nastavení je, že pokud update nějaké komponenty selže, upgrade se zastaví. Pokud se tak stane, je nutné afektovaný ESXi opět restartovat a upgrade opět spustit. Předem ale doporučuji na pčílsušné kategorii udělat reset a spustit znovu test.

Jakmile máme uspěšně dokončený pre-check, můžeme spustit samotný upgrade. Jak jsem zmiňoval, probíhá postupně, v pořadí Edge – ESXi – NSX managery.

Upgrade spouštějte vždy z VIP adresy celého NSX manager clusteru. 

Upgrade Edge může probíhat v režimu serial (výchozí) nebo paralel. Ve výchozím režimu (serial) se upgradují edge postupně po jednotlivých Edge clusterech a v rámci clusteru opět postupně, tj. pokud máte v clusteru min. dvě edge, neměl by  být nijak afektován provoz z a do NSX ani jiné služby, např. LB, VPN apod.

Následně probíhají upgrade ESXi po jednotlivých clusterech.

Zde můžete narazit na několik problémů. Jedním z nich je zmiňovaný problém s místem v /tmp partition, dalším pak může být, že při upgrade nsx komponent zůstane tento task zatuhlý na 80% „finishing upgrade“ a upgrade tohoto hosta zhavaruje. Mě pomohlo se přihlásit na afektovaný host, resratovat „hostd“ službu a spustit upgarde znovu. Pak již doběhl upgrade úspěšně.

Jako poslední proběhne upgrade přímo NSX managerů.

Jakmile doběhne, trvá restart a opětovné nastartování GUI, překavpivě dlouho. Klidně i několik desítek minut. Nelekejte se tedy a vyčkejte. Stav upgrade jednotlivých NSX managerů a celého clusteru můžete zkontrolovat přes příkazovou řádku a SSH připojení přímo na managery a to pomocí příkazu:

get upgrade progress-status

Doufám, že Vám tento článek pomohl překonat nástrahy upgrade NSX-T, resp. Vám přeji aby jste ho nemuseli číst a všechny Vaše upgrady dopadly dobře.