CUDA 7.5 z obsługą Instruction-Level Profiling w nVidia Visual Profiler

CUDA 7.5 z obsługą Instruction-Level Profiling w nVidia Visual Profiler

    przez -
    1 1052
    nVidia
    Firma nVidia ogłosiła wydanie CUDA 7.5, uniwersalnej architektury procesorów graficznych, która umożliwia wykorzystanie ich mocy obliczeniowej do rozwiązywania ogólnych problemów numerycznych, w sposób wydajniejszy niż w tradycyjnych, sekwencyjnych procesorach ogólnego zastosowania. Technologia CUDA jest przeznaczona do tworzenia aplikacji wykorzystujących obliczenia równoległe, przy pomocy kilku prostych rozszerzeń języka C i C++. Programista ma do wyboru możliwość wyrażenia tej równoległości zarówno za pomocą języków programowania wysokiego poziomu, takich jak C, C++, Fortran jak i z użyciem otwartych standardów, jak dyrektywy OpenACC.

    Najważniejszą zmianą jest dodanie obsługi Instruction-Level Profiling w nVidia Visual Profiler. Nowa funkcja, dostępna na kartach z rdzeniem Maxwell (GM200) i późniejszych, pomaga zidentyfikować wąskie gardła wydajności. Dzięki temu deweloperzy mogą szybko znaleźć konkretne linie kodu ograniczające wydajność karty graficznej, razem z opóźnionym wykonywaniem danych funkcji.

    Pojawiła się także obsługa 16 bitowych zmiennoprzecinkowych danych (FP16), co pozwoli przechowywać o wiele więcej danych w pamięci karty graficznej. Dodano eksperymentalne wsparcie dla wyrażeń lambda w GPU z języka C++ oraz nowe procedury cuSPARSE dla przyspieszenia przetwarzania języka naturalnego.