Systemy informatyczne zyskały już w przedsiębiorstwach swoje poważane miejsce. Decydenci chętnie inicjują projekty wspierające rozwój firmy, upraszczające przesyłanie dokumentów lub nadzorujące proces sprzedaży. Liczba systemów rośnie i na razie nie widać tendencji odwrotnej. Rozwój przedsiębiorstw z jednoczesną oszczędną polityką kadrową powoduje, że nadzór nad pracującymi systemami jest utrudniony. Naturalną konsekwencją tego procesu jest implementacja w infrastrukturach informatycznych systemów monitoringu IT.

Na rynku dostępnych jest kilka typów oprogramowania które działają według schematów które opiszemy. Część oprogramowania dostępna jest w wolnej dystrybucji linux, inne wymagają zakupu licencji.

Open Source

Obszar projektów Open Source dostarcza kilku narzędzi Monitoringu IT. Bardziej znanymi aplikacjami są Zabbix, MRTG, Cacti, Nagios.core. Wszystkie one znalazły grono zwolenników wśród specjalistów technologii otwartego oprogramowania. Operatorzy często w ramach własnych zainteresowań i entuzjastycznego podejścia wdrażają nocami takie produkty i często należy przyznać, że efekty ich pracy są zdumiewające. Zwłaszcza projekt Nagios zasługuje na uznanie. Wdrożenie tego systemu, realizuje często nawet zaawansowane aspekty śledzenia systemów i aplikacji. Zawsze jednak modyfikacja ustawień, aktualizacja aplikacji, włączenie nowej osoby do zespołu obsługi, związane jest z nadmierną w stosunku do korzyści pracą. Coraz mniejsza grupa operatorów w swojej pracy ma czas, na ręczną edycję plików konfiguracyjnych i przeglądanie forum internetowego, w poszukiwaniu odpowiedzi na błąd aplikacji. W rezultacie uruchamiane projekty Open Source nie obejmują całości zagadnienia, a ich konfiguracja szybko się dezaktualizuje.

Każdy projekt to koszt

Brak opłaty licencyjnej w Open Source zawsze stanowi bardzo atrakcyjny element projektu. Często idea wdrożenia tego typu oprogramowania jest inicjatywą oddolną, przez co całościowy koszt wdrożenia i utrzymania systemu nie jest w pełni znany. Nie ulega jednak wątpliwości, że czas kilku tygodni potrzebny na uruchomienie podstawowej funkcjonalność oprogramowania, to już znaczący koszt w budżecie przedsiębiorstwa.

Rozwiązania komercyjne

Wszystkich rozwiązań komercyjnych nie sposób wyliczyć. Oferta na rynku jest niezwykle bogata, jednak wyraźnie da się wydzielić kilka grup produktów. Pierwszą z nich stanowią produkty pochodzące od gigantów informatyki. Firmy wiodących marek serwerów dostarczają od wielu lat systemy monitoringu IT. Ich funkcje są niezwykle rozbudowane, możliwości ogromne, a zastosowane technologie nieco przyciężkie i staroświeckie. Często niestety zdarzają się sytuacje, że systemy z górnych półek oferty są zbyt skomplikowane, ich wdrożenie jest trudne i przysparza problemy również firmom partnerskim. W rezultacie produkty te nie zawsze stanowią pomoc dla działów IT, a często przysparzają im dodatkowych obowiązków.

Dużą grupę produktów stanowią rozwiązania oparte o monitoring SNMP, podstawowych funkcji IP, WMI dla Windows. Pozornie aplikacje te potrafią monitorować różnorodną architekturę, ale szybko ich użytkownicy przekonają się, że zamknięte podejście do monitoringu nie pozwoli im na monitoring dowolnych rozwiązań zastosowanych w każdym przedsiębiorstwie. W praktyce widzimy, że narzędzie SNMP nie zawsze działa tak jakbyśmy tego chcieli, co również trzeba powiedzieć o WMI. Tak zaprojektowany monitoring staje są fragmentaryczny i nie rozwiązuje istoty problemu spojrzenia na infrastrukturę jako całość.

Open Source ale komercyjnie

Od pewnego czasu istnieje na rynku trend, że dobre i uznane projekty Open Source doczekały się swoich komercyjnych wersji. Powód powstania tych aplikacji jest oczywisty. Wymieniliśmy już dobre produkty świata Linux, które posiadają możliwość bardzo dobrego monitoringu infrastruktury, tylko brakuje im pewnych funkcji, czas wdrożenia i obsługi jest zbyt długi, a całości brakuje kompetentnego wsparcia producenta.

Przykładem takiego oprogramowania jest op5 Monitor – komercyjny monitoring z Nagios.core w tle.

Op5 Monitor vs. Nagios core

op5 Monitor

Pierwsza wersja Op5Monitor powstała w roku 2003, a jej producent to firma Op5 AB ze Szwecji. Architektura obu systemów jest zbliżona – system Linux, PHP, Apache, monitoring w oparciu o wtyczki. Systemy te są nawet kompatybilne, jeżeli chodzi o strukturę plików konfiguracyjnych. Jeżeli ktoś zna Nagiosa, ale przeszkadza mu jego ograniczona funkcjonalność, skomplikowana konfiguracja i “dyskusyjny” wygląd, to op5 Monitor jest środowiskiem którego szuka.

op5 Monitor - Tactical overview

op5 Monitor - Hosts details

Wszystko to co polubiliśmy w Nagios Core jest na swoim miejscu. Koncepcja monitoringu się nie zmieniła. Obiekt monitorowany to host, a metody sprawdzania to serwisy. Sprawdzanie odbywa się poprzez uruchamianie z odpowiednimi parametrami wtyczek, które są niczym innym jak skryptami w katalogu roboczym /opt/plugins. To podejście jest niezwykle proste i dobrze, że się nie zmieniło pomiędzy wersjami Nagios oraz op5 Monitor.

Nagios Core to produkt bezpłatny. op5 Monitor to narzędzie komercyjne, posiadające typowe cechy firmowych aplikacji. Zapoznając się z tym produktem rozpoznajemy wiele projektów open source, których instalacją możemy się przecież zająć sami. Problem w tym, że tych wspólnie pracujących projektów w op5 Monitor jest około 150. W cenie licencji dostajemy gotowe środowisko do pracy instalujące się w przeciągu minuty na naszym Linuksie. Kolejny krok to oczywiście przeniesienie naszej infrastruktury do konfiguracji monitoringu. I tu również op5 Monitor nas pozytywnie zaskakuje. Przycisk „skanowanie sieci” i dalsze przedstawienie formatek jedynie do akceptacji sprawia, że podstawowy monitoring osiągamy w kolejnych minutach. Nazwy wypełnianych pól w konfiguracji są identyczne jak w Nagios Core, zmienia się jedynie koncepcja ich przetwarzania. Tryb tekstowy został uzupełniony interfejsem www, wyszukiwaniem, filtrami co w porównaniu z Nagios Core stanowczo poprawia komfort pracy.

Jednym przyciskiem wykonujemy backup danych, odtwarzanie oraz aktualizację do najnowszej wersji. Backup może pracować w trybie automatycznym, tworząc kopię we wskazanym miejscu na dysku lub na udział FTP.

op5 Monitor - Ekran tworzenia kopii bezpieczeństwa

Interfejs www aplikacji jest zmieniony całkowicie i umożliwia zarówno szybszą nawigację, wielokrotne wybory, jak i edycję ustawień. W zakładce ustawień też widzimy zmiany: szybko przyzwyczajamy się do możliwości kopiowania obiektów i serwisów opcją CLONE lub propagowania zmian na grupę odfiltrowanych obiektów poprzez PROPAGATE.

Produkt komercyjny oznacza również, że użytkownicy moją do dyspozycji dokumentację oraz dział wsparcia firmy op5 AB, który pomoże w przypadku pojawienia się problemów z konfiguracją. Wsparcie, to również dostęp do aktualizacji jak i możliwość zgłaszania nowych wymagań. Cała aplikacja posiada rozpisany rozwój, co pozwala nam spać spokojnie nie myśląc o tym, czy wdrożony system będzie dalej rozwijany w perspektywie najbliższych miesięcy.

Nagion, Cacti, Wiki, NagVis, Merlin, Ninja . . . Wszystko w jednym miejscu

Dużą zmianą zarówno w płatnej wersji Nagios XI jak i opisywanym Op5Monitor jest prezentacja monitorowanych wartości w postaci grafik. Tego od zawsze brakowało użytkownikom darmowej wersji Nagios. Do realizacji tej funkcji do tej pory używaliśmy Cacti, jednak jako druga aplikacja do monitorowania w naszej strukturze zawsze jest wybrakowana, a gdy potrzebujemy danych np. do przedstawienia miesięcznych raportów klientowi – pojawiają się nam puste pola.

Projekt Cacti wraz z wymaganym RRDTools został dołączony do op5 Monitor. Rysowanie grafik wymaga współpracy z wtyczkami udostępniającymi dane statystyczne. Tworząc własny skrypt musimy pamiętać, aby poza zwracanym statusem i ciągiem tekstu dodać informację do wykresu.
Przykładowy wynik komendy sprawdzania dysku:

DISK WARNING - free space: / 23073 MB (12% inode=93%);| /=158631MB;153125;172266;0;191407

Dane statystyczne to wszystkie dane po znaku “|”.

Są to kolejne wartości oddzielone średnikiem:

'opis'=wartość[jednostka];[warn];[crit];[min];[max]

Metody sprawdzania zwracające dane statystyczne automatycznie uzyskują interpratację graficzną w witrynie monitoringu.

op5 Monitor - Dane statystyczne

Warto wspomnieć, że historia danych statystycznych włączona jest również do pakietu kopii bezpieczeństwa. Nie jest tracona podczas aktualizacji wersji lub nawet zmiany architektury serwera przy np. migracji na nowy serwer monitoringu.

Kolejne duże projekty włączone w system op5 Monitor to elementy odpowiedzialne za wygodę działania. Interfejs użytkownika został całkowicie zmieniony w stosunku do Nagios core. Konfiguracja nie jest już oparta na plikach tekstowych, chociaż te w dalszym ciągu istnieja. Projekt Merlin odpowiada za obsługę wprowadzanych wartości i ich umieszczenie w bazie ustawień.

Do prowadzenia notatek o urządzeniach, wprowadzania informacji o umiejscowieniu, osobach odpowiedzialnych służy dobrze znana Wikipedia.

Wszystkie te elementy to op5 Monitor, opatrzone jednym pakietem instalacyjnych, ścieżką rozwoju oraz automatyczną aktualizacją z op5 AB.

Jak to naprawdę działa?

op5 Monitor instalujemy na Linuksie lub uruchamiamy, jako maszynę wirtualną. Aplikacja dostarczana jest z dużą grupą ciągle rozwijanych metod sprawdzających. Sprawdzanie odbywa się na dwa sposoby: zewnętrznie lub za pomocą agenta. Wszystko to na co pozwalają ogólne metody sieciowe w połączeniu z protokołami SMTP, HTTP, SSH, SQL oraz SNMP sprawdzane jest bez potrzeby instalowania agenta. Gdy chcemy kontrolować wewnętrzne parametry systemu operacyjnego, wtedy musimy współpracować z agentem NRPE/Netsaint instalowanym w systemach Unix / Linux oraz NsClient dla systemów Windows.

op5 Monitor swoją konfigurację przetrzymuje w bazie danych MySQL oraz plikach tekstowych. Dane z bazy zostają wpisane do plików w momencie wyboru klawisza SAVE. Wprowadzane dane są weryfikowane co skutkuje, że op5 Monitor nie przestaje działać w przypadku wprowadzenia złych wartości w konfiguracji. Interfejs www weryfikuje dane zanim zmiany zostaną wpisane do plików. Znany ekran Nagios Core mówiący o błędzie konfiguracji:

Whoops, Could not read object configuration data!

nigdy się nie pojawi.

Jeśli w konfiguracji popełnimy wiele błędów i zechcemy cofnąć operację mamy do dyspozycji przycisk UNDO który w praktyce wgrywa pliki konfiguracji tekstowej na nowo do bazy.

op5 Monitor - Opcja kopiowanie poprzez CLONE

Netsaint czy NRPE?

Agent to mała aplikacja instalowana w monitorowanym systemie operacyjnym. Śledzenie parametrów Unixów i Linuxów możliwe jest poprzez wykożystanie agenta Netsaint lub NRPE. Spróbujmy spojrzeć na ich różnice.

Netsaint to program lub po prostu rozbudowany perlowy skrypt. Pracuje w trybie nasłuchu, wyczekując na komendę przesłaną mu z serwera Op5Monitor. Taka komenda to np. dfcommand która powoduje uruchomienie odpowiednio przygotowanej komendy df systemu operacyjnego i zwrócenie wyniku. Zarówno agent Netsaint jak i NRPE zawsze bazują w monitoringu na odpowiednio przygotowanych poleceniach orginalnego systemu operacyjnego. Netsaint to pojedynczy plik, i nie posiada on żadnego dodatku np. w postaci zewnętrznego pliku z konfiguracją. Teoretycznie Netsaint jest prosty, jednak w praktyce używanie go powoduje duży bałagan w architekturze. Zwróćmy uwagę, że wszystkie definicje komend muszą być odpowiednio opisane w formacie perla i to najlepiej w warunkach if dla wszystkich systemów typu Unix w naszej infrastrukturze. Dodanie nowej, niestandardowej komendy połączone jest z dodaniem około jednej strony kodu perl do wnętrza skryptu. Taka operacja powoduje siłą rzeczy powstanie nowej wersji Netsaint w naszym środowisku.

NRPE cechuje nieco inne podejście. NRPE to klasyczny projekt dostarczany w źródłach. Na stronie producenta aplikacji http://www.op5.com/support/downloads/agents/nrpe możemy pobrać przygotowane pakiety dla kilku popularnych dystrybucji. Agent ten składa się z trzech części: pliku uruchamialnego nrpe, pliku z konfiguracją oraz oddzielnych plików komend. To lepszy układ, niż proponuje nam Netsaint. Plik agenta na serwerach jest zawsze taki sam i może być łatwo wymienione na nowszą dystrybucję. Konfiguracja agenta oraz wpisy dotyczące nowych komend są często umieszczane w osobnych plikach co dodatkowo porządkuje ustawienia.

Co dla Windows?

Op5 Monitor współpracuje z systemami rodziny MsWindows Server i Desktop poprzez agenta NsClient++ również rozwijanego przez firmę op5 AB. Po typowej okienkowej instalacji oraz edycji ustawień zezwalających na połączenia z serwera monitoringu agent jest gotowy do pracy. Pierwsze śledzone wartości to obciążenie procesora, zajętość dysków i pamięci operacyjnej, ilość procesów i występowanie danego procesu, odpowiedź na PING oraz użycie swap. Tę listę możemy szybko rozszerzyć dodając w pliku konfiguracyjnym wpisy o nowym poleceniu typu:

check_mycommand=scripts\plik.bat

Również tworząc polecenia dla NsClient nie powinniśmy zapominać o fragmencie danych statystycznych do tworzenia wykresów.

Monitoring Windows dodatkowo możemy rozszerzyć o śledzenie uruchomiony zadań oraz pracujących serwisów. Mamy również do dyspozycji uzyskiwanie informacji z mechanizmy „Performance Counters” systemów Windows, a tam ukryte są tysiące gotowych do wykorzystania liczników dla sprzętu, systemu operacyjnego i charakterystycznych aplikacji Microsoft takich jak MsSQL, Project Server, Analitics Server, Exchange BizTalk. Wspierany jest również monitoring przez WMI, jednak rzadko w praktyce jest on stosowany.

Co możemy monitorować?

Decydującą przewagą produktów opartych o Nagios Core w porównaniu do konkurencji są w zasadzie nieograniczone możliwości monitoringu. op5 Monitor z jednakową łatwością będzie śledził systemy Linux, Solaris, AIX, HP-UX czy MS Windows. Firma op5 wyposażyła aplikację w metody kontrolujące środowisko VMWare ESX, bazy Oracle, MSSQL Server, MySQL, komponenty domeny Windows oraz wiele innych.

op5 Monitor również podłączy się do systemów IBM i5 kreśląc kolorowe wykresy dla aktywnych zadań, użycia ASP i wielu innych charakterystycznych dla tej platformy parametrów.

Raporty

Raportować możemy dowolne obiekty, serwisy oraz ich grupy. W stosunku do Nagios Core, raporty działają poprawnie oraz jest ich więcej. Pierwszą dużą różnicą jest dodanie do raportów wykresów statystycznych, tych samych jakie mamy dostępne w monitorowanych serwisach. Drugą ciekawostką to udostępnienie raportu SLA, gdzie w trakcie tworzenia mamy możliwość wprowadzenia poziomu ustalonej dostępności. Przekroczenie SLA będzie dodatkowo raportowane .

Utworzone raporty możemy zapisać w postaci PDF lub przesłać na email. Mamy również możliwość wprowadzenia szablony raportu, tak aby wysyłał się on automatycznie np. w ostatni dzień miesiąca, informując naszych klientów o dostępności systemów.

op5 Monitor - Raport

Podsumowanie

op5 Monitor to produkt nowego trendu komercyjnego Open Source. W wygodny sposób realizuje on zadania związane z monitoringiem infrastruktury informatycznej. Może aplikacje tego typu wyznaczą nowy standard umiejętnie łącząc to co wygodne w rozwiązaniach okienkowych z tym co elastyczne w projektach otwartego kodu? Z pewnością produkt znajdzie grono swoich zwolenników.

Linki
Producent http://www.op5.com
Dystrybucja w Polsce http://it.emca.pl

  • lolo

    Przykład jak można zarobić na darmowym programie.
    Myślę że każdy szanujący się administrator skorzysta z samego nagiosa lub innej apki :P

    • Inna aplikacja to Zabbix :D

    • Jurek

      Jak zerkniesz sobie na referencje op5 Monitora w Polsce to szybko się zorientujesz, że nie każdy szanujący się Administrator… Wielu szanujących woli coś co działa OutOfTheBox. Nagios to początek przygody, ma masę błędów i dużo braków które nadrabia op5 Monitor. To, że nagios nie ma płatnej licencji nie oznacza, że jest za darmo. Czas wdrożenia i procent udanych wdrożeń dowodzą, że firmie bardziej opłaca się zakupić licencje zamiast zatrudniać LinuxGuru który zdobywa w firmie monopol na wiedzę.