Tags Posts tagged with "cuda"

cuda

przez -
1 1256
nVidia

Firma nVidia ogłosiła wydanie CUDA 7.5, uniwersalnej architektury procesorów graficznych, która umożliwia wykorzystanie ich mocy obliczeniowej do rozwiązywania ogólnych problemów numerycznych, w sposób wydajniejszy niż w tradycyjnych, sekwencyjnych procesorach ogólnego zastosowania. Technologia CUDA jest przeznaczona do tworzenia aplikacji wykorzystujących obliczenia równoległe, przy pomocy kilku prostych rozszerzeń języka C i C++. Programista ma do wyboru możliwość wyrażenia tej równoległości zarówno za pomocą języków programowania wysokiego poziomu, takich jak C, C++, Fortran jak i z użyciem otwartych standardów, jak dyrektywy OpenACC.

Najważniejszą zmianą jest dodanie obsługi Instruction-Level Profiling w nVidia Visual Profiler. Nowa funkcja, dostępna na kartach z rdzeniem Maxwell (GM200) i późniejszych, pomaga zidentyfikować wąskie gardła wydajności. Dzięki temu deweloperzy mogą szybko znaleźć konkretne linie kodu ograniczające wydajność karty graficznej, razem z opóźnionym wykonywaniem danych funkcji.

Pojawiła się także obsługa 16 bitowych zmiennoprzecinkowych danych (FP16), co pozwoli przechowywać o wiele więcej danych w pamięci karty graficznej. Dodano eksperymentalne wsparcie dla wyrażeń lambda w GPU z języka C++ oraz nowe procedury cuSPARSE dla przyspieszenia przetwarzania języka naturalnego.

przez -
0 1169
nVidia

Firma nVidia ogłosiła wydanie CUDA 7.0, uniwersalnej architektury procesorów graficznych, która umożliwia wykorzystanie ich mocy obliczeniowej do rozwiązywania ogólnych problemów numerycznych, w sposób wydajniejszy niż w tradycyjnych, sekwencyjnych procesorach ogólnego zastosowania. Technologia CUDA jest przeznaczona do tworzenia aplikacji wykorzystujących obliczenia równoległe, przy pomocy kilku prostych rozszerzeń języka C i C++. Programista ma do wyboru możliwość wyrażenia tej równoległości zarówno za pomocą języków programowania wysokiego poziomu, takich jak C, C++, Fortran jak i z użyciem otwartych standardów, jak dyrektywy OpenACC.

nVidia zaimplementowała pełną obsługę standardu C++11, dodała nową bibliotekę cuSOLVER oraz wsparcie dla kompilacji podczas wykonywania programu.

przez -
4 544
nVidia

nVidia ogłosiła publiczne wydanie nVidia CUDA Toolkit 6.5. CUDA to opracowana przez firmę nVidia uniwersalna architektura procesorów wielordzeniowych (głównie kart graficznych), umożliwiająca wykorzystanie ich mocy obliczeniowej do rozwiązywania ogólnych problemów numerycznych, w sposób wydajniejszy niż w tradycyjnych, sekwencyjnych procesorach ogólnego zastosowania. CUDA Toolkit jest przeznaczony do tworzenia aplikacji wykorzystujących obliczenia równoległe na procesorach graficznych nVidia.

Zmiany, jakie zaszły:

  • Dodano obsługę architektury AArch64
  • Dodano cuFFT Device Callbacks
  • Udoskonalono obsługę narzędzi Fortrana
  • CUDA Occupancy Calculator APIs
  • Dodano wsparcie dla Visual Studio 2013
  • Udoskonalono wydajność podwójnej precyzji
  • Pojawiły się statyczne biblioteki cuBLAS, cuSPARSE, cuFFT, cuRAND, NPP
  • Dodano nowe narzędzie nvprune
  • Udoskonalono raportowanie błędów Xid

przez -
1 461
nVidia

nVidia ogłosiła publiczne wydanie nVidia CUDA Toolkit 6, którego pierwsza zapowiedź miała miejsce pod koniec listopada tamtego roku. CUDA to opracowana przez firmę nVidia uniwersalna architektura procesorów wielordzeniowych (głównie kart graficznych), umożliwiająca wykorzystanie ich mocy obliczeniowej do rozwiązywania ogólnych problemów numerycznych, w sposób wydajniejszy niż w tradycyjnych, sekwencyjnych procesorach ogólnego zastosowania. CUDA Toolkit jest przeznaczony do tworzenia aplikacji wykorzystujących obliczenia równoległe na procesorach graficznych nVidia.

Najważniejsze funkcje platformy CUDA 6:

  • Zunifikowana pamięć
  • Obsługa Tegra K1
  • Biblioteki typu drop-in NVVBLAS i cuBLAS XT, umożliwiające skalowanie na wiele procesorów graficznych
  • Zdalne programowanie z użyciem NSight Eclipse Edition
  • Udoskonalone profilowanie, dzięki NVIDIA Visual Profiler i NSight Eclipse Edition

przez -
2 539
nVidia

Firma nVidia ogłosiła wydanie CUDA Toolkit 6.0. Compute Unified Device Architecture to opracowana przez firmę nVidia uniwersalna architektura procesorów wielordzeniowych (głównie kart graficznych), umożliwiająca wykorzystanie ich mocy obliczeniowej do rozwiązywania ogólnych problemów numerycznych, w sposób wydajniejszy niż w tradycyjnych, sekwencyjnych procesorach ogólnego zastosowania. CUDA Toolkit jest prznaczony do tworzenia aplikacji wykorzystujących obliczenia równoległe na procesorach graficznych nVidia.

Główne cechy platformy CUDA 6 to:

  • Zunifikowana pamięć – upraszcza programowanie, zapewniając aplikacjom dostęp do procesora centralnego i graficznego bez konieczności kopiowania danych między dwoma układami, a także znacznie ułatwia wprowadzanie obsługi procesora graficznego w szerokiej gamie języków programowania.
  • Biblioteki typu drop-in – automatycznie przyspieszają obliczenia BLAS i FFTW nawet ośmiokrotnie. Wystarczy zastąpić istniejące biblioteki korzystające z procesora centralnego ich odpowiednikami wykorzystującymi procesor graficzny.
  • Skalowanie na wiele procesorów graficznych – przeprojektowane biblioteki BLAS i FFT automatycznie skalują swoją wydajność, dostosowując się nawet do ośmiu procesorów graficznych zainstalowanych w jednym węźle, umożliwiając osiągnięcie do dziewięciu TFLOPS wydajności obliczeniowej o podwójnej precyzji, a także obsłużenie większych zadań niż kiedykolwiek (do 512 GB). Skalowanie do wielu procesorów graficznych działa również w nowej bibliotece BLAS typu drop-in.

nVidia CUDA Toolkit 6 zostanie udostępniona na początku 2014 roku. Wszyscy uczestnicy programu CUDA-GPU Computing Registered Developer zostaną powiadomieni, gdy będzie ona dostępna do pobrania.

przez -
11 340
nVidia

Daniel Dadap z nVidia poinformował o kilku planach firmy, związanych z pakietem CUDA. Pierwszym z nich jest porzucenie rozwoju 32 bitowej wersji dla Linux x86, w tym zakończenie oferowania nowych funkcji dla 32 bitowych aplikacji. Oczywiście powyższe nie dotyczy 32 bitowego sterownika CUDA, który będzie nadal wspierany w obu wersjach sterownika graficznego nVidia Linux Display Driver 331.xx. nVidia zamierza także przestać oferować sterowniki CUDA w pakiecie sterowników graficznych.

Wszystkie powyższe informacje nie dotyczą architektury ARM, która nadal będzie w pełni wspierana.

przez -
0 351
nVidia

Continuum Analytics ogłosiła wydanie NumbaPro 0.12, kompilatora języka Python ze wsparciem architektury CUDA. W najnowszej wprowadzono obsługę CUDA Toolkit 5.5, dzięki czemu NumbraPro może zapewnić te same funkcje matematyczne, co CUDA-C. Dodatkowo owe narzędzia są także dołączane do paczki, co zmniejszy prawdopodobieństwo błędów podczas instalacji. Zaimplementowano również Warp Occupancy Calculator.

przez -
2 595
nVidia

Firma nVidia ogłosiła wydanie CUDA Toolkit 5.5. Compute Unified Device Architecture to opracowana przez firmę nVidia uniwersalna architektura procesorów wielordzeniowych (głównie kart graficznych), umożliwiająca wykorzystanie ich mocy obliczeniowej do rozwiązywania ogólnych problemów numerycznych, w sposób wydajniejszy niż w tradycyjnych, sekwencyjnych procesorach ogólnego zastosowania.

  • Usprawniona obsługa Hyper-Q – teraz dostępna w wielu procesach MPI i wszystkich systemach Linux.
  • Priorytety obciążenia MPI – pozwala programistom ustawić priorytet strumieni CUDA dla najważniejszych ścieżek, optymalizując funkcjonowanie aplikacji.
  • Nowa wspomagana analiza wydajności — narzędzia Visual Profiler i Nsight Eclipse Edition przeprowadzają programistę krok po kroku przez proces wykrywania wąskich gardeł wydajności i optymalizowania tych punktów.
  • Szybka kompilacja wzajemna na platformach x86 – pakiet skraca czas tworzenia rozwiązań dla dużych aplikacji, ponieważ umożliwia skompilowanie kodu ARM na platformach x86 i przeniesienie gotowej aplikacji na platformę docelową.

Oprócz tego wersja CUDA 5.5 zawiera pełen zestaw narzędzi programistycznych, bibliotek matematycznych akcelerowanych przez procesory graficzne oraz dokumentacje dla platform opartych na architekturę x86 oraz ARM:

  • Rozbudowane narzędzia programistyczne — pełna obsługa kompilatora CUDA, narzędzia do debugowania i analizy wydajności.
  • Biblioteki matematyczne akcelerowane przez procesory graficzne – FFT, RNG, BLAS, operacje na macierzach rzadkich oraz nieomal 5000 prymitywów do przetwarzania sygnałów i obrazów dostępnych w bibliotece NVIDIA Performance Primitives (NPP).
  • Dokumentacja i przewodniki dla programistów — pełna dokumentacja, próbki kodu oraz inne materiały, które pozwolą programistom szybko opanować programowanie kodu akcelerowanego przez procesory graficzne.

Polecane

Jesień Linuksowa

1 1095
Polska Grupa Użytkowników Linuksa ma zaszczyt zaprosić na konferencję Jesień Linuksowa 2017, która odbędzie się w dniach 22 – 24 września 2017 roku. Jako...