Tags Posts tagged with "compute unified device architecture"

compute unified device architecture

przez -
4 534
nVidia

nVidia ogłosiła publiczne wydanie nVidia CUDA Toolkit 6.5. CUDA to opracowana przez firmę nVidia uniwersalna architektura procesorów wielordzeniowych (głównie kart graficznych), umożliwiająca wykorzystanie ich mocy obliczeniowej do rozwiązywania ogólnych problemów numerycznych, w sposób wydajniejszy niż w tradycyjnych, sekwencyjnych procesorach ogólnego zastosowania. CUDA Toolkit jest przeznaczony do tworzenia aplikacji wykorzystujących obliczenia równoległe na procesorach graficznych nVidia.

Zmiany, jakie zaszły:

  • Dodano obsługę architektury AArch64
  • Dodano cuFFT Device Callbacks
  • Udoskonalono obsługę narzędzi Fortrana
  • CUDA Occupancy Calculator APIs
  • Dodano wsparcie dla Visual Studio 2013
  • Udoskonalono wydajność podwójnej precyzji
  • Pojawiły się statyczne biblioteki cuBLAS, cuSPARSE, cuFFT, cuRAND, NPP
  • Dodano nowe narzędzie nvprune
  • Udoskonalono raportowanie błędów Xid

przez -
2 518
nVidia

Firma nVidia ogłosiła wydanie CUDA Toolkit 6.0. Compute Unified Device Architecture to opracowana przez firmę nVidia uniwersalna architektura procesorów wielordzeniowych (głównie kart graficznych), umożliwiająca wykorzystanie ich mocy obliczeniowej do rozwiązywania ogólnych problemów numerycznych, w sposób wydajniejszy niż w tradycyjnych, sekwencyjnych procesorach ogólnego zastosowania. CUDA Toolkit jest prznaczony do tworzenia aplikacji wykorzystujących obliczenia równoległe na procesorach graficznych nVidia.

Główne cechy platformy CUDA 6 to:

  • Zunifikowana pamięć – upraszcza programowanie, zapewniając aplikacjom dostęp do procesora centralnego i graficznego bez konieczności kopiowania danych między dwoma układami, a także znacznie ułatwia wprowadzanie obsługi procesora graficznego w szerokiej gamie języków programowania.
  • Biblioteki typu drop-in – automatycznie przyspieszają obliczenia BLAS i FFTW nawet ośmiokrotnie. Wystarczy zastąpić istniejące biblioteki korzystające z procesora centralnego ich odpowiednikami wykorzystującymi procesor graficzny.
  • Skalowanie na wiele procesorów graficznych – przeprojektowane biblioteki BLAS i FFT automatycznie skalują swoją wydajność, dostosowując się nawet do ośmiu procesorów graficznych zainstalowanych w jednym węźle, umożliwiając osiągnięcie do dziewięciu TFLOPS wydajności obliczeniowej o podwójnej precyzji, a także obsłużenie większych zadań niż kiedykolwiek (do 512 GB). Skalowanie do wielu procesorów graficznych działa również w nowej bibliotece BLAS typu drop-in.

nVidia CUDA Toolkit 6 zostanie udostępniona na początku 2014 roku. Wszyscy uczestnicy programu CUDA-GPU Computing Registered Developer zostaną powiadomieni, gdy będzie ona dostępna do pobrania.

przez -
11 314
nVidia

Daniel Dadap z nVidia poinformował o kilku planach firmy, związanych z pakietem CUDA. Pierwszym z nich jest porzucenie rozwoju 32 bitowej wersji dla Linux x86, w tym zakończenie oferowania nowych funkcji dla 32 bitowych aplikacji. Oczywiście powyższe nie dotyczy 32 bitowego sterownika CUDA, który będzie nadal wspierany w obu wersjach sterownika graficznego nVidia Linux Display Driver 331.xx. nVidia zamierza także przestać oferować sterowniki CUDA w pakiecie sterowników graficznych.

Wszystkie powyższe informacje nie dotyczą architektury ARM, która nadal będzie w pełni wspierana.

przez -
2 571
nVidia

Firma nVidia ogłosiła wydanie CUDA Toolkit 5.5. Compute Unified Device Architecture to opracowana przez firmę nVidia uniwersalna architektura procesorów wielordzeniowych (głównie kart graficznych), umożliwiająca wykorzystanie ich mocy obliczeniowej do rozwiązywania ogólnych problemów numerycznych, w sposób wydajniejszy niż w tradycyjnych, sekwencyjnych procesorach ogólnego zastosowania.

  • Usprawniona obsługa Hyper-Q – teraz dostępna w wielu procesach MPI i wszystkich systemach Linux.
  • Priorytety obciążenia MPI – pozwala programistom ustawić priorytet strumieni CUDA dla najważniejszych ścieżek, optymalizując funkcjonowanie aplikacji.
  • Nowa wspomagana analiza wydajności — narzędzia Visual Profiler i Nsight Eclipse Edition przeprowadzają programistę krok po kroku przez proces wykrywania wąskich gardeł wydajności i optymalizowania tych punktów.
  • Szybka kompilacja wzajemna na platformach x86 – pakiet skraca czas tworzenia rozwiązań dla dużych aplikacji, ponieważ umożliwia skompilowanie kodu ARM na platformach x86 i przeniesienie gotowej aplikacji na platformę docelową.

Oprócz tego wersja CUDA 5.5 zawiera pełen zestaw narzędzi programistycznych, bibliotek matematycznych akcelerowanych przez procesory graficzne oraz dokumentacje dla platform opartych na architekturę x86 oraz ARM:

  • Rozbudowane narzędzia programistyczne — pełna obsługa kompilatora CUDA, narzędzia do debugowania i analizy wydajności.
  • Biblioteki matematyczne akcelerowane przez procesory graficzne – FFT, RNG, BLAS, operacje na macierzach rzadkich oraz nieomal 5000 prymitywów do przetwarzania sygnałów i obrazów dostępnych w bibliotece NVIDIA Performance Primitives (NPP).
  • Dokumentacja i przewodniki dla programistów — pełna dokumentacja, próbki kodu oraz inne materiały, które pozwolą programistom szybko opanować programowanie kodu akcelerowanego przez procesory graficzne.

przez -
6 481
nVidia

Firma nVidia ogłosiła wydanie CUDA Toolkit 5.0. Compute Unified Device Architecture to opracowana przez firmę nVidia uniwersalna architektura procesorów wielordzeniowych (głównie kart graficznych), umożliwiająca wykorzystanie ich mocy obliczeniowej do rozwiązywania ogólnych problemów numerycznych, w sposób wydajniejszy niż w tradycyjnych, sekwencyjnych procesorach ogólnego zastosowania.

Co znajdziemy w najnowszym wydaniu:

  • nVidia Nsight Eclipse Edition – zintegrowane środowisko graficzne do produkcji aplikacji, które wykorzystują akcelerację kart graficznych
  • RDMA dla GPUDirect – bezpośrednio komunikacja kart graficznych i innych urządzeń PCIe
  • GPU Library Object Linking – zbiór wtyczek i dodatków dla programistów
  • Dynamic Parallelism – łatwa równoległa akceleracja zagnieżdżonych pętli z użyciem kart graficznych Tesla K20, opartych na architekturze Kepler

przez -
0 411
nVidia

Firmia nVidia ogłosiła wydanie CUDA Toolkit 4.1, który to zestaw został zapowiedziany w dniu otwarcia źródeł platformy CUDA. Compute Unified Device Architecture to opracowana przez firmę Nvidia uniwersalna architektura procesorów wielordzeniowych (głównie kart graficznych), umożliwiająca wykorzystanie ich mocy obliczeniowej do rozwiązywania ogólnych problemów numerycznych, w sposób wydajniejszy niż w tradycyjnych, sekwencyjnych procesorach ogólnego zastosowania.

Co znajdziemy w nowej platformie:

  • Nowy kompilator CUDA oparty o LLVM, zwiększający wydajność aplikacji o 10%
  • Ponad 1000 nowych funkcji przetwarzania obrazów i sygnałów, zostało dodanych do biblioteki NVIDIA Performance Primitives. Jeżeli ktoś przetwarza obrazy, NPP posiada specjalną funkcję akceleracji przy pomocy procesora graficznego
  • Przeprojektowano całkowicie narzędzie Visual Profiler, w którym dodano stopniowy, zaawansowany i automatyczny system optymalizacji wydajności

Warto również odwiedzić stronę, gdzie znajdziemy pełną dokumentację, ze sterownikami i SDK.

przez -
4 506
nVidia

13 grudnia 2011 roku NVDIA ogłosiła otwarcie platformy CUDA, uwalniając w ten sposób cały kod źródłowy kompilatora CUDA. Compute Unified Device Architecture to opracowana przez firmę Nvidia uniwersalna architektura procesorów wielordzeniowych (głównie kart graficznych), umożliwiająca wykorzystanie ich mocy obliczeniowej do rozwiązywania ogólnych problemów numerycznych, w sposób wydajniejszy niż w tradycyjnych, sekwencyjnych procesorach ogólnego zastosowania.

Używając kodu źródłowego dla nowego kompilatora bazującego na LLVM, całość zostanie wydana w postaci CUDA Toolkit 4.1 i będzie przeznaczone dla badaczy i dostawców oprogramowania specjalistycznego.

Diagram kompilatora LLVM

Możliwości:

  • Wsparcie akceleracji GPU w większej liczbie języków programowania, włączając w to wiele nowych, jak i istniejących już języków specjalizowanych (domain-specific language – DSL).
  • Nowe zaawansowane możliwości w architekturze procesora i badawczych systemach heterogenicznych
  • Wsparcie aplikacji CUDA w szerokim spektrum maszyn wieloprocesorowych i procesorach wielordzeniowych

przez -
1 350
nVidia

Pojawiła się nowa wersja zestawu narzędzi nVidia CUDA 3.2, które są dedykowane do obliczeń GPGPU. CUDA (Compute Unified Device Architecture), to opracowana przez firmę NVidia uniwersalna architektura procesorów wielordzeniowych (głównie kart graficznych) umożliwiająca wykorzystanie ich mocy obliczeniowej do rozwiązywania ogólnych problemów numerycznych, w sposób wydajniejszy niż w tradycyjnych, sekwencyjnych procesorach ogólnego zastosowania (CPU).

Z najważniejszych zmian warto wymienić:

  • zwiększenie wydajności CUBLAS od 50 do 300% dla kart Fermi GeForce 400/ 5000
  • powiększenie wydajności CUFFT
  • nowe biblioteki GPU dla zwiększenia procedur
  • biblioteki kodowania i dekodowania H.264 są od teraz w pakiecie CUDA
  • wsparcie wielordzeniowego odśmiecania
  • wsparcie NVCC dla kompilatora Intel C na systemach Linux x64
  • wsparcie zarządzania pamięcią używając funkcji malloc() i free() wykorzystując jądra obliczeń CUDA C
  • System Zarządzania Interfejsem NVIDIA ( komenda nvidia-smi ) potrafi teraz pokazywać w procentach, jak bardzo jest zajęte GPU

Ostatnia funkcja jest o tyle ciekawa, iż można wykorzystać to w różnych benchmarkach monitorujących wykorzystanie rdzenia karty graficznej. Warto wspomnieć, iż AMD posiada od dość dawna to, w postaci rozszerzenia OverDrive oraz dzięki sterownikom open source po przez monitorowanie fence count.

Polecane

Prasa, Czasopismo

1 897
Ukazało się Linux Magazine – numer 161. Lipcowe wydanie magazynu zawiera analizę tworzenia bardziej czytelnych wyrażeń regularnych z Simple Regex Language, instrukcje zabezpieczania i...