
19.03.2010, 14:33
tagi: cassandra, digg, my sql, twitter
Serwisy Twitter i Digg nie będą dłużej korzystać z baz danych opartych na języku MySQL. Przedstawiciele obu firm zamierzają przenieść dane do środowisk wykorzystujących nierelacyjną bazę Cassandra.
Decyzja ta związana jest z przejęciem praw do bazy MySQL przez koncern Oracle. Konieczność przeniesienia informacji dostarczanych przez użytkowników serwisów Twitter i Digg do nowego środowiska ma być podyktowana przede wszystkim problemami wydajnościowymi.
My SQL nie jest wydajna
"Rezygnujemy ze środowiska MySQL ze względu na narastające trudności związane z obsługą i zapewnieniem wysokiej wydajności nieustannie rozszerzającego się zbioru danych" - twierdzi John Quinn, wiceprezes firmy Digg. Według niego w ostatnim czasie nastąpiły istotne zmiany w środowisku informatycznym stojącym za serwisem. W ramach modernizacji przepisano cały kod serwisu Digg. Aplikacje obsługujące serwis przeniesiono do architektury rozproszonej. Zrezygnowano również z platformy LAMP (Linux, Apache, MySQL, PHP). Jednak najpoważniejszą zmianą ma być właśnie odejście od relacyjnej bazy danych MySQL na rzecz rozwijanej przez Fundację Apache bazy Cassandra. John Quinn dodaje, że do tej pory do nowego środowiska bazodanowego przeniesiono większość funkcjonalności serwisu Digg. Firma aktywnie zaangażowała się również w rozwój tej bazy danych.
Twitter minimalizuje koszty
W przypadku firmy Twitter rezygnacja z MySQL ma być pośrednio związana m.in. z chęcią zmniejszenia kosztów utrzymania środowiska bazodanowego przechowującego coraz większe ilości danych. Obecnie serwis Twitter korzysta ze środowiska bazodanowego obsługiwanego przez klaster serwerów, na których działa baza MySQL. Ryan King, inżynier systemowy w firmie Twitter, twierdzi, że w obliczu konieczności zmiany bazy danych, pod uwagę brano zarówno przemodelowanie struktur w obrębie środowiska MySQL, jak i wykorzystanie innych nierelacyjnych baz danych. Brano pod uwagę również bazy takie jak: HyperTable, HBase, Voldemort i Remis. Ostatecznie z punktu widzenia potrzeb Twittera to baza Cassandra okazała się być bardziej skalowalna, stabilna i łatwiejsza w obsłudze.
Cassandra zyskuje
Cassandra, podobnie jak inne nierelacyjne bazy, zyskuje na szybkości działania m.in. dzięki odrzuceniu niektórych założeń stanowiących podstawę działania konwencjonalnych relacyjnych baz danych. Model tej bazy przewiduje maksymalizację dostępności danych oraz skrócenie czasu potrzebnego na zapisanie informacji. Według osób zaangażowanych w rozwój bazy Cassandra w niektórych zastosowaniach jest nawet 2,5 tys. razy szybsza od bazy MySQL. Obecnie baza wykorzystuje model danych z systemu bazodanowego Google BigTable oraz opracowany przez firmę Amazon rozproszony system składowania informacji Dynamo. Na największe, uruchomione produkcyjnie środowisko oparte na silniku Cassandra, składa się 150 serwerów obsługujących wspólnie ponad 100TB danych.
Źródło: computerworld.pl
Chcesz skomentować powyższą treść? Kliknij dodaj i wypełnij formularz. Komentarz pojawi się po weryfikacji przez nasz zespół redakcyjny. Aby zobaczyć już dodane komentarze kliknij: pokaż/ukryj.
Zapisz się do naszego newslettera aby cyklicznie otrzymywać ciekawe informacje. Będziesz mógł się wypisać w każdej chwili, klikając na odpowiedni link w dowolnym wydaniu newslettera.
30.07.2010, Google ulepsza wyszukiwarkę obrazów
Jak wejść na tę nową wersję? - Zuzka
23.07.2010, Czytniki e - booków systematycznie tanieją
A jest dostępny w Polsce? - miłosz
21.05.2010, You Tube ma nową formę publikowania filmów
no nareszcie!!! - hulio