Przechowywanie zorientowane na siatkę

Pamięć zorientowana na siatkę ( GOS ) była terminem używanym do przechowywania danych w projekcie uniwersyteckim w czasach, gdy popularny był termin „grid computing” .

Opis

GOS był następcą terminu pamięć masowa podłączona do sieci (NAS). Systemy GOS zawierały dyski twarde, często macierze RAID (nadmiarowe macierze niezależnych dysków), podobnie jak tradycyjne serwery plików.

Gosongrid.jpg

GOS został zaprojektowany do obsługi operacji na plikach na duże odległości, w wielu domenach i na jednym obrazie, co jest typowe w środowiskach Grid. GOS zachowuje się jak serwer plików za pośrednictwem opartego na plikach protokołu GOS-FS dla dowolnej jednostki w sieci. Podobnie jak GridFTP , GOS-FS integruje silnik strumienia równoległego i infrastrukturę bezpieczeństwa sieci (GSI).

Zgodnie z uniwersalnym VFS (Virtual Filesystem Switch), GOS-FS może być szeroko stosowany jako podstawowa platforma do najlepszego wykorzystania zwiększonej przepustowości transferu i przyspieszenia aplikacji opartych na NFS / CIFS . GOS może również działać przez SCSI , Fibre Channel lub iSCSI , co nie wpływa na wydajność przyspieszania, oferując zarówno protokoły na poziomie plików, jak i protokoły na poziomie bloków dla sieci pamięci masowej (SAN) z tego samego systemu.

W infrastrukturze sieciowej zasoby mogą być oddalone od siebie geograficznie, wytwarzane przez różnych producentów i mieć różne polityki kontroli dostępu. Sprawia to, że dostęp do zasobów sieci jest dynamiczny i uzależniony od lokalnych ograniczeń. Techniki scentralizowanego zarządzania tymi zasobami mają ograniczoną skalowalność zarówno pod względem wydajności wykonania, jak i odporności na uszkodzenia. Świadczenie usług na takich platformach wymaga rozproszonego mechanizmu zarządzania zasobami, a klastrowe urządzenia GOS typu peer-to-peer pozwalają na dalsze rozszerzanie pojedynczego obrazu pamięci masowej, nawet jeśli pojedyncze urządzenie GOS osiągnie swoje ograniczenia pojemności. Klaster udostępnia wspólną, zagregowaną prezentację danych przechowywanych na wszystkich uczestniczących urządzeniach GOS. Każde urządzenie GOS zarządza własną wewnętrzną przestrzenią dyskową. Główną zaletą tej agregacji jest to, że klastrowana pamięć masowa GOS jest dostępna dla użytkowników jako pojedynczy punkt montowania.

Produkty GOS pasują do kategorii cienkich serwerów. W porównaniu z tradycyjnymi architekturami pamięci masowej opartymi na „grubych serwerach”, cienkie serwery GOS zapewniają liczne korzyści, takie jak eliminacja potencjalnych wąskich gardeł w sieci/sieci, zoptymalizowanie procesora i systemu operacyjnego wyłącznie pod kątem operacji we/wy, łatwość instalacji, zdalne zarządzanie i minimalna konserwacja, niski koszt i Plug and Play itp. Przykłady podobnych innowacji obejmują NAS, drukarki, faksy, routery i przełączniki.

W systemie operacyjnym GOS został zainstalowany serwer Apache, zapewniający komunikację opartą na protokole HTTPS pomiędzy serwerem GOS a administratorem za pośrednictwem przeglądarki internetowej . Zdalne zarządzanie i monitorowanie ułatwia konfigurowanie, zarządzanie i monitorowanie systemów GOS.

Historia

Frank Zhigang Wang i Na Helian zaproponowali rządowi Wielkiej Brytanii propozycję finansowania zatytułowaną „Grid-Oriented Storage (GOS): Architektura systemu przechowywania danych nowej generacji dla ery przetwarzania sieciowego” w 2003 r. Propozycja została zatwierdzona i przyznano milion funtów [ cytat ] potrzebne ] w 2004 r. Pierwszy prototyp został skonstruowany w 2005 r. w Center for Grid Computing, Cambridge-Cranfield High Performance Computing Facility. Pierwsza prezentacja konferencyjna miała miejsce na Sympozjum IEEE na temat Cluster Computing and Grid (CCGrid), 9–12 maja 2005 r., Cardiff, Wielka Brytania. Jako jeden z pięciu najlepszych prac w toku, został włączony do IEEE Distributed Systems Online. W 2006 r. architektura GOS i jej implementacje zostały opublikowane w IEEE Transactions on Computers, zatytułowane „Pamięć masowa zorientowana na sieć: architektura pojedynczego obrazu, między domenami, o dużej przepustowości”. Od stycznia 2007 pokazy odbywały się o godz Princeton University , Cambridge University Computer Lab i inne. Do 2013 roku Cranfield Center nadal używało czasu przyszłego w projekcie.

Udostępnianie plików peer-to-peer wykorzystuje podobne techniki.

Notatki

Dalsza lektura

  • Frank Wang, Na Helian, Sining Wu, Yuhui Deng, Yike Guo, Steve Thompson, Ian Johnson, Dave Milward & Robert Maddock, Grid-Oriented Storage, IEEE Distributed Systems Online, tom 6, wydanie 9, wrzesień 2005.
  • Frank Wang, Sining Wu, Na Helian, Andy Parker, Yike Guo, Yuhui Deng, Vineet Khare, Pamięć masowa zorientowana na sieć: pojedynczy obraz, międzydomenowa architektura o dużej przepustowości, IEEE Transactions on Computers, tom 56, nie .4, s. 474–487, 2007.
  • Frank Zhigang Wang, Sining Wu, Na Helian, Podstawowy protokół przesyłania danych w celu przyspieszenia komunikacji internetowej, International Journal of Computer Networks, Elsevier, 2007.
  • Frank Zhigang Wang, Sining Wu, Na Helian, Yuhui Deng, Vineet Khare, Chris Thompson i Michael Parker, Dostęp do danych oparty na siatce do bazy danych sekwencji nukleotydów z 6-krotną poprawą czasów odpowiedzi, przetwarzanie nowej generacji, nr 2, tom 25, 2007.
  • Frank Wang, Yuhui Deng, Na Helian, Evolutionary Storage: Przyspieszenie dysku magnetycznego przez klastrowanie częstych danych, IEEE Transactions on Magnetics, Issue.6, Vol.43, 2007.
  • Frank Zhigang Wang, Na Helian, Sining Wu, Yuhui Deng, Vineet Khare, Chris Thompson i Michael Parker, Grid-based Storage Architecture for Accelerating Bioinformatics Computing, Journal of VLSI Signal Processing Systems, nr 1, tom 48, 2007.
  • Yuhui Deng i Frank Wang, Heterogeniczna sieć pamięci masowej obsługiwana przez usługę sieciową, ACM Operating System Review, nr 1, tom 41, 2007.
  • Yuhui Deng i Frank Wang, Optimal Clustering Size of Small File Access in Network Attached Storage Device, Parallel Processing Letters, nr 1, tom 17, 2007.