Zestaw narzędzi nVidia CUDA 4 – łatwiejsze programowanie równoległe

Zestaw narzędzi nVidia CUDA 4 – łatwiejsze programowanie równoległe

przez -
0 257
nVidia
Firma nVidia przedstawiła nową wersję zestawu narzędziowego CUDA Toolkit 4, przeznaczonego do tworzenia aplikacji wykorzystujących obliczenia równoległe na procesorach graficznych NVIDIA. Zestaw został stworzony w celu łatwiejszego programowania równoległego i zapewnienia możliwości przeniesienia aplikacji na procesory graficzne większej liczbie programistów.

Nowa wersja oczywiście posiada pełne wsparcie pod Linuksa, oraz cechuje się szeregiem funkcji i możliwości:

  • Technologia NVIDIA GPUDirect 2.0 – oferuje obsługę wzajemnej, bezpośredniej komunikacji pomiędzy procesorami graficznymi pracującymi w obrębie jednego serwera lub jednej stacji roboczej
  • Funkcja jednolitego adresowania wirtualnego (UVA) – daje możliwość stworzenia jednolitej, połączonej przestrzeni adresowej złożonej z pamięci głównej komputera i pamięci procesorów graficznych
  • Biblioteki szablonów wydajnych elementów podstawowych języka C++ Thrust – to kolekcja potężnych algorytmów obsługi obliczeń równoległych i struktur danych, wraz z otwartym kodem źródłowym, która ułatwia pracę programistów języka C++. Standardowe zadania (np. sortowanie równoległe) realizowane za pomocą bibliotek Thrust są od 5 do 100 razy szybsze w porównaniu ze standardowymi bibliotekami Standard Template Library (STL) lub bibliotekami Intela Threading Building Blocks (TBB)

Architektura CUDA 4.0 cechuje się ponadto szeregiem innych funkcji i możliwości, jak:

  • Integracja MPI z aplikacjami CUDA
  • Współdzielenie procesorów graficznych między wieloma wątkami
  • Dostęp do wielu procesorów dla jednego wątku procesora centralnego
  • Nowa biblioteka obrazu i wizualizacji komputerowej NPP

Nowe i usprawnione możliwości:

  • Automatyczna analiza wydajności w aplikacji Visual Profiler
  • Nowe funkcje cuda-gdb i obsługa systemu MacOS
  • Dodana obsługa operatorów języka C++, np. new/delete i funkcji wirtualnych
  • Nowy deasembler binarny dla procesorów graficznych

Wersja „Release Candidate” zostanie udostępniona bezpłatnie z dniem 4 marca 2011 r. Uzyska się do niej dostęp po rejestracji w programie CUDA Registered Developer pod adresem: www.nvidia.pl/paralleldeveloper. W ramach programu CUDA Registered Developer można uzyskać dostęp do bogatego zbioru narzędzi, zasobów i informacji dla programistów aplikacji równoległych, który umożliwia jak najpełniejsze wykorzystanie potencjału architektury CUDA.

Więcej informacji na nvidia.pl/cuda.