Reklama
| STORAGE ŘEŠENÍ ANEB KDYŽ POTŘEBUJETE MÍT DATA STÁLE DOSTUPNÁ |
|
|
|
| Komentář - Informační technologie |
| Napsal uživatel Štefan Steiner |
|
Oblast storage řešení začíná být čím dál více klíčovou pro fungování téměř všech počítačových sítí, databází a informačních systémů. Dat je zkrátka příliš mnoho a již není možné a z mnoha hledisek ani žádoucí je uchovávat na jednotlivých discích umístěných v lokálních počítačích či menších serverech. Oblast ukládání dat je zkrátka potřeba řešit komplexně, a tedy formou tzv. storage řešení. A k čemu že přesně jsou? Co je to storage řešení Storage řešení je název pro zařízení či skupiny zařízení, která slouží k ukládání větších objemů dat obvykle prostřednictvím počítačové sítě. Jednotlivá zařízení přitom často mohou být mezi sebou spojena pomocí počítačové sítě, a to jak Ethernet (při rozmístění zařízení velmi daleko od sebe), tak i pomocí až 8× rychlejšího rozhraní Fibre Channel. Specializované sítě sloužící k propojení jednotlivých zařízení se nazývají SAN (Storage Area Network). Klíčovými úkoly storage řešení je uchovávat digitální data v takové podobě, aby bylo možné k nim v reálném čase přistupovat a v reálném čase s nimi také manipulovat. Oproti dříve velice populárním tzv. souborovým serverům je zde však kladen vysoký důraz na dostupnost, spolehlivost a rychlost a na zpřístupnění dat více serverům a počítačům najednou. Data jednotlivých serverů tak již nejsou ukládána přímo na discích serverů, ale na společném storage řešení, což přináší řadu úspor. Pro samotné ukládání dat storage řešení používají obvykle větší množství pevných disků, které pracují buď na SAS (potažmo SCSI) datové sběrnici, nebo u malých storage řešení také na datové sběrnici SATA2. Storage řešení tedy využívají stejné pevné disky jako počítače nebo servery. Rozdíl je však v tom, že se jedná o specializované zařízení, jehož výkon je optimalizován čistě pro ukládání a čtení souborů při spojování zapojených pevných disků do nejrůznějších typů RAID (viz dále). Naprosto klíčový rozdíl je také ve způsobu, kterým se storage řešení připojuje k počítačové síti. Obvykle je k dispozici rozhraní iSCSI (zejména u levnějších zařízení) nebo Fibre Channel, které dosahuje rychlosti až 8 Gb/s (tj. 1 GB/s).
Proč storage řešení Storage řešení přináší řadu výhod, které nemusí být na první pohled patrné. První z nich je již výše zmiňovaná konsolidace dat. Data všech serverů jsou umístěna na jednom místě, které je dostatečně zabezpečené, zálohované a spolehlivé a které zároveň umožňuje maximálně využít výhod sdílení jedné úložné kapacity. Tu je možné u storage řešení velice jednoduše plynule navyšovat. Vezměme si příklad, kdy máme databázový server, poštovní server a server s informačním systémem. Každý disponuje úložnou kapacitou 500 GB, přičemž databázový server využívá 100 GB, poštovní server 490 GB a server s informačním systémem 200 GB. Za dané situace, kdy není využíváno storage řešení, musíme dokoupit do poštovního serveru další disk, i když máme k dispozici celkem 1500 GB úložné kapacity. Při využití storage řešení si však vystačíme jen s 1000 GB a navíc nemusíme nic dokupovat. Druhou, související výhodou je vysoká škálovatelnost. Disky do storage řešení totiž můžete dokupovat třeba i po jednotlivých kusech, takže není třeba si na začátku nechávat zbytečně moc volného místa „na potom“, protože nový disk můžete koupit a zapojit prakticky ihned a protože kapacita každého nového disku je využitelná všemi zapojenými servery. Nikdy se vám tedy nemůže stát, že by poštovní server měl málo místa a databázový zbytečně moc. Na druhou stranu, když začne docházet volné místo, pak všem serverům najednou, což je ovšem, jak jsme si řekli již výše, velice snadno řešitelné. Úspory však nepřicházejí pouze na straně nákupu samotných disků. Velmi významné výhody má totiž storage řešení také v oblasti zálohování. Zálohovat totiž můžete hned několik serverů najednou a také u záložních médií (ať již jsou to pevné disky nebo pásky) opět maximalizujete využití dostupné úložné kapacity. Další velkou výhodou je velmi snadná možnost sdílení dat ze storage řešení mezi různými servery a uživateli a s tím související možnost využití jednotlivých storage řešení pro vytváření permanentně aktualizovaných záloh vzdálených serverů. Pokud tedy máte k dispozici více budov a více storage řešení, můžete se velmi snadno jistit pro případ fyzického zničení jednoho storage řešení. Všechny tyto výhody společně patří do kategorie, kterou lze souhrnně nazvat jako vysoká dostupnost a spolehlivost. Všechna data využívají specializované řešení vybudované pouze a jen za účelem zpracování dat, u kte- rého je velmi snadné zajistit vysokou spolehlivost (ve srovnání s průměrným diskovým polem průměrného serveru, který obsahuje velké množství elektronických součástek, které mohou selhat) a navíc zálohování de facto všech serverů je centralizované na jedno jediné místo, kdy není třeba obcházet a kontrolovat zálohy na každém serveru zvlášť. Jaké parametry mají storage řešení Síť Storage řešení se skládá z několika klíčových prvků, které dohromady tvoří funkční celek, což je také důvod, proč se to celé nazývá řešením. Základ implementace storage řešení tvoří počítačová síť, ke které bude storage v řešení připojeno. Ta totiž často musí nejprve podstoupit příslušné úpravy ať již se jedná o zvýšení rychlosti na 1 Gbps, úpravy konfigurace a počtu některých aktivních bsíťových prvků či změnu topologie sítě. Servery Další bezprostředně související součástí jsou servery, které budou nové storage řešení využívat. Ty se totiž k SAN připojují v ideálním případě pomocí fibre channel, které musí být v serveru přítomno prostřednictvím HBA (Host Bus Adapter) karty připojené (u rychlejších variant fibre channel) na sběrnici PCI Express. Pokud fibre channel v serverech není přítomno, je třeba jej dokoupit nebo zvolit variantu připojení prostřednictvím sítě Ethernet. Pokud přítomno je, vyplatí se koupit storage řešení s podporou při nejhorším stejně rychlého fibre channel, jako je na serveru. Kapacita
Podstatnou položkou při výběru je kapacita storage řešení. Ta se zde neměří v objemu dostupného prostoru (což by technicky ani nebylo možné), nýbrž v počtu volných míst pro instalaci pevných disků. Některá storage řešení přitom mají zvlášť vyhrazena místa pro zapojení SAS disků a zvlášť místa pro zapojení SATA2 disků. U takovýchto řešení však SATA2 disky mají primárně sloužit pro zálohování SAS diskového pole. SAS disky jsou totiž v reálném provozu přibližně 3× rychlejší než SATA disky a rychlost čtení dat u SAS disku s 15 000 ot./min. naprosto běžně dosahuje hodnoty 180 MB/s. Podporované módy RAID Abychom se mohli bavit o kapacitě storage řešení co se dostupného úložného prostoru týče, musíme se podívat na to, jaké módy RAID storage řešení podporuje. RAID (Redundand Array of Independent Disks) je již přes 15 let užívaný standard pro vytváření datových úložišť na základě propojování více samostatných pevných disků. V dnešní době je primitivní RAID řadič běžnou součástí téměř každého počítače. RAID řadiče u storage řešení však patří svými schopnostmi, podporovanými módy i spolehlivostí do naprosto jiné kategorie.A k čemu je vlastně ono RAID potřeba? RAID umožňuje spojovat kapacity více identických (tedy při nejmenším stejně velkých) fyzických disků do jednoho virtuálního pevného disku. RAID k tomu využívá dvou základních metod – strippingu amirroringu. Stripping spojí n fyzických disků v jeden virtuální pevný disk s n násobnou velikostí. Výhodou je, že při ukládání jsou data rozprostřena na jednotlivé disky v poli, což až n násobně urychluje proces zápisu. V případě, kdy se ale poškodí jediný disk v poli, poškodí se veškerá data uložená na diskovém poli. Tento mód je označován jako RAID 0. Mirroring naopak spojí n fyzických disků v jeden virtuální pevný disk se stejnou velikostí. Při zápisu jsou data paralelně zapisována na všechny disky v poli. Při čtení je však možné číst data paralelně a tím získat teoreticky až n násobně rychlejší čtení. Tento mód je označován jako RAID 1. Ve storage řešeních se nicméně využívají zejména vyšší RAID módy. RAID 5, který využívá strippingu pro rozprostření dat na nejméně dva pevné disky, avšak využívá také opravný kód CRC a paritní bity, které ukládá na třetí disk, nebo také často využívaný RAID 10, který pouze kombinuje RAID 1 a RAID 0, kdy všechny disky zapojené ve strippingu jsou zrcadleny na stejný počet disků.
Pevné disky Pro výběr a výkon storage řešení jsou samozřejmě podstatné i pevné disky zapojené následně do diskového pole RAID. Zde bez výjimky platí, že vysoký výkon získáte pouze na SAS discích s rychlostí 15 000 otáček za minutu, zatímco SATA2 disky s třetinovou cenou vám poskytnou jen třetinový výkon (myšleno tedy v rychlosti čtení/zápisu dat i v rychlosti jejich vyhledávání) a kratší životnost. Nicméně platí, že na vytváření okamžitých záloh (tzv. snapshotů) na pevné disky jsou SATA2 disky více než dostatečné. Servis Nedílnou součástí storage řešení je také servis. Ten je u storage řešení obzvláště významný. Pokud totiž nastane nějaká kritická porucha, postihne rázem všechny servery (pakliže nemáte k dispozici záložní storage řešení). Takovou poruchu je pak třeba neprodleně vyřešit a každá hodina, kdy se zařízení nachází v poruše, může představovat velkou finanční ztrátu. Na servisu se tedy u storage řešení rozhodně nevyplatí šetřit. Navíc dodavatelé storage řešení nabízejí obvykle nadstandardní doby odezvy, on-line dohled, nonstop podporu atd. Každý dodavatel má však jiné složení standardních a příplatkových servisních programů, proto se vyplatí si je pečlivě prostudovat. Storage řešení se vyplatí
Storage řešení je v současné době tím nejelegantnějším a často také nejekonomičtějším řešením, jak nakládat s daty u středně velkých a velkých sítí, kde existuje více kritických serverů. Při volbě storage řešení je pak třeba klást velký důraz ani ne tak na výběr pevných disků, kam se budou data ukládat (ty jsou obvykle u všech dodavatelů stejné), ale zejména na rozšiřitelnost (ať již možností konektivity či počtu pevných disků), dodávané aplikaci pro správu a zálohování storage řešení, podporu a servis. Právě rozšiřitelnost je přitom u storage řešení naprosto klíčová apředurčuje také reálnou dobu životnosti celého řešení. Objemy zpracovávaných dat totiž kontinuálně rostou a to samé by mělo umět i vaše storage řešení. Martin Zikmund |














