giovedì 09 maggio 2024 06:36mobile    |    3dfxzone.it    |    amdzone.it    |    atizone.it    |    forumzone.it    |    hwsetup.it    |    nvidiazone.it    |    unixzone.it 
NVIDIAZONE.IT
              proudly powered by 3dfxzone.it
Home    |    News    |    Headlines    |    Articoli    |    Download    |    Community    |    Condividi    |    Contatti    |    Tag    |    Ricerca    |    Sitemap
 
Pubblicità CUDA 4.0 rende la programmazione in parallelo ancora più facile Ultime News
Notizia pubblicata in data: 02.03.2011
Condividi su Facebook Condividi su Twitter Condividi su WhatsApp Condividi su reddit

NVIDIA ha annunciato la nuova versione del toolkit di NVIDIA CUDA per lo sviluppo di applicazioni di parallel computing che utilizzano la potenza delle GPU NVIDIA.

Il nuovo toolkit NVIDIA CUDA 4.0 è stato progettato per rendere ancora più semplice la programmazione in parallelo e consente a un numero ancora maggiore di sviluppatori di eseguire il porting delle loro applicazioni sulle GPU. Questo toolkit si fonda su tre caratteristiche principali:

  • La tecnologia NVIDIA GPUDirect 2.0 – supporta la comunicazione peer-to-peer tra le GPU all'interno di un singolo server o workstation. Questo semplifica e rende più rapida la programmazione multi-GPU e aumenta le prestazioni delle applicazioni.
  • Unified Virtual Addressing (UVA) – fornisce un singolo spazio unificato di indirizzamento per la memoria di sistema principale e le memorie delle GPU. Questa soluzione rende più rapida e semplifica la programmazione in parallelo.
  • Librerie di primitive e modelli C++ Thrust – offrono una raccolta di potenti strutture dati e algoritmi paralleli C++ open source che semplificano la programmazione agli sviluppatori di C++. Grazie a Thrust, le routine quali l'ordinamento parallelo sono da 5 a 100 volte più rapide rispetto alla Standard Template Library (STL) e ai Threading Building Blocks (TBB).

"Nuove caratteristiche quali Unified Virtual Addressing e la maggiore rapidità delle comunicazioni tra GPU facilitano gli sviluppatori che vogliono sfruttare le capacità di parallel computing delle GPU", ha dichiarato John Stone, Senior Research Programmer, University of Illinois, Urbana-Champaign.

"Avere accesso al GPU Computing tramite l'interfaccia dei template standard aumenta nettamente la produttività di una vasta gamma di operazioni, dalla semplice generazione di flussi di cassa ai calcoli più complessi con i modelli del mercato Libor, rendite variabili o gli aggiustamenti della valutazione del credito", ha dichiarato Peter Decrem, Direttore dei Rates Products per Quantifi. "La libreria C++ di Thrust ha considerevolmente ridotto le difficoltà di accesso prendendosi cura delle funzionalità di basso livello quali l'accesso alla memoria e la sua assegnazione. Questo consente agli esperti di informatica per i servizi finanziari di concentrarsi sullo sviluppo di algoritmi in un ambiente ottimizzato dalle GPU".

La nuova release 4.0 dell'architettura CUDA comprende molte altre caratteristiche e capacità fondamentali, fra cui:

  • Integrazione di MPI con le applicazioni CUDA – le implementazioni di MPI modificate quali OpenMPI spostano automaticamente i dati da e per la memoria GPU usando Infiniband quando un'applicazione esegue o riceve una chiamata MPI.
  • Condivisione multi-thread delle GPU – più thread host delle CPU possono condividere contesti su una singola GPU, semplificando la condivisione di una singola GPU da parte delle applicazioni multi-thread.
  • Condivisione multi-GPU di un singolo thread di CPU – un singolo thread host di CPU può accedere a tutte le GPU di un sistema. Gli sviluppatori possono facilmente coordinare il lavoro su più GPU per operazioni quali gli scambi "halo" nelle applicazioni.
  • Nuova immagine NPP e libreria Computer Vision – una ricca serie di operazioni di trasformazione delle immagini che permette lo sviluppo rapido di applicazioni di imaging e computer vision.
  • Capacità nuove e migliorate
    • Auto-analisi delle prestazioni nel Visual Profiler
    • Nuove caratteristiche in cuda-gdb e aggiunta del supporto di MacOS.
    • Aggiunta del supporto di caratteristiche di C++ quali new/delete e le funzioni virtuali
    • Nuovo disassembler di binari per GPU

Una RC (Release Candidate) di CUDA Toolkit 4.0 sarà resa disponibile gratuitamente a partire dal 4 marzo 2011- Per ottenerla è sufficiente iscriversi al CUDA Registered Developer Program all'indirizzo: www.nvidia.it/paralleldeveloper. Il CUDA Registered Developer Program offre agli sviluppatori di applicazioni in parallelo una straordinaria quantità di strumenti, risorse ed informazioni che consentono di massimizzare il potenziale di CUDA.

Per ulteriori informazioni sulle caratteristiche e sulle capacità di CUDA Toolkit e delle applicazioni GPGPU, visitare l'indirizzo: www.nvidia.it/cuda.



NVIDIA today announced the latest version of the NVIDIA® CUDA® Toolkit for developing parallel applications using NVIDIA GPUs.

The NVIDIA CUDA 4.0 Toolkit was designed to make parallel programming easier, and enable more developers to port their applications to GPUs. This has resulted in three main features:

  • NVIDIA GPUDirect™ 2.0 Technology -- Offers support for peer-to-peer communication among GPUs within a single server or workstation. This enables easier and faster multi-GPU programming and application performance.
  • Unified Virtual Addressing (UVA) -- Provides a single merged-memory address space for the main system memory and the GPU memories, enabling quicker and easier parallel programming.
  • Thrust C++ Template Performance Primitives Libraries -- Provides a collection of powerful open source C++ parallel algorithms and data structures that ease programming for C++ developers. With Thrust, routines such as parallel sorting are 5X to 100X faster than with Standard Template Library (STL) and Threading Building Blocks (TBB).

"Unified virtual addressing and faster GPU-to-GPU communication makes it easier for developers to take advantage of the parallel computing capability of GPUs," said John Stone, senior research programmer, University of Illinois, Urbana-Champaign.

"Having access to GPU computing through the standard template interface greatly increases productivity for a wide range of tasks, from simple cashflow generation to complex computations with Libor market models, variable annuities or CVA adjustments," said Peter Decrem, director of Rates Products at Quantifi. "The Thrust C++ library has lowered the barrier of entry significantly by taking care of low-level functionality like memory access and allocation, allowing the financial engineer to focus on algorithm development in a GPU-enhanced environment."

The CUDA 4.0 architecture release includes a number of other key features and capabilities, including:

  • MPI Integration with CUDA Applications -- Modified MPI implementations automatically move data from and to the GPU memory over Infiniband when an application does an MPI send or receive call.
  • Multi-thread Sharing of GPUs -- Multiple CPU host threads can share contexts on a single GPU, making it easier to share a single GPU by multi-threaded applications.
  • Multi-GPU Sharing by Single CPU Thread -- A single CPU host thread can access all GPUs in a system. Developers can easily coordinate work across multiple GPUs for tasks such as "halo" exchange in applications.
  • New NPP Image and Computer Vision Library -- A rich set of image transformation operations that enable rapid development of imaging and computer vision applications.
  • New and Improved Capabilities
    • Auto performance analysis in the Visual Profiler
    • New features in cuda-gdb and added support for MacOS
    • Added support for C++ features like new/delete and virtual functions
    • New GPU binary disassembler

A release candidate of CUDA Toolkit 4.0 will be available free of charge beginning March 4, 2011, by enrolling in the CUDA Registered Developer Program at: www.nvidia.com/paralleldeveloper. The CUDA Registered Developer Program provides a wealth of tools, resources, and information for parallel application developers to maximize the potential of CUDA.





News Source: NVIDIA Press Release
Links

Tag: parallelo  |  programmazione


 News precedente Indice News News successiva 
08.05.2024  
Rufus 4.5 beta formatta e crea drive flash USB avviabili da immagini ISO
Apple annuncia gli iPad Pro 2024 con SoC M4 e display Ultra Retina XDR
Apple introduce il SoC M4 a 3nm per gli iPad intelligenti di nuova generazione
Benchmark & Stability Testing: Prime95 30.19 build 15 - Windows, Linux, BSD, Mac
OpenGL Testing & Benchmark GPU Tools: FurMark OpenGL Benchmark 2.3.0.0
System Information & Windows Tools: USB Device Tree Viewer 4.2.4 - Bug fixing
07.05.2024  
SoundSwitch 6.10.3 cambia al volo la device audio per il playback o il recording
Hardware & System | Information & Monitoring Utilities: HWiNFO 8.02 [Portable]
06.05.2024  
XFX introduce la video card non reference Radeon RX 7900 XTX Phoenix Nirvana
Free Antivirus & Antimalware Utilities: Trellix Stinger 13.0.0.117 [Portable]
Free RAM Information Utilities: RAMMon 3.2 build 1000 - SDRAM DDR5 Ready
KeePassXC 2.7.8 è un password manager free e open source per Windows a 64-bit
05.05.2024  
Free & Open Source Image Editing: GIMP 2.10.38 - Windows & Linux & macOS
FastCopy 5.7.10 copia file e directory, e sincronizza in modalità incrementale
SystemRescueCd 11.01 consente di ripristinare e configurare Linux e Windows
04.05.2024  
Wine 9.8 esegue il software nativo per Windows su Linux, Unix e MacOS
GPU Shark 2.3.0 ora gestisce correttamente il sensore GPU usage per Intel Arc
Oracle rilascia VirtualBox 7.0.18 per Windows, Linux, macOS e Unix Solaris
03.05.2024  
Free Audio & Multimedia Windows Players: foobar2000 2.1.5 - Windows 11 Ready
Free Benchmark & Testing Information Utilities: Futuremark SystemInfo 5.72
Indice delle news 
Ultimi File
Prime95 30.19 build 15 - Windows 64-bit
Prime95 30.19 build 15 - Windows 32-bit
Prime95 30.19 build 15 - Mac OS X
Prime95 30.19 build 15 - Linux 64-bit
Prime95 30.19 build 15 - Linux 32-bit
Prime95 30.19 build 15 - FreeBSD 64-bit
FurMark OpenGL Benchmark 2.3.0.0
HWiNFO 8.02 [Portable]
GPU Shark 2.3.0 [Portable]
Futuremark SystemInfo 5.72
Indice dei file 
3dfxzone.it   ][   amdzone.it   ][   atizone.it   ][   forumzone.it   ][   hwsetup.it   ][   nvidiazone.it   ][   unixzone.it   ][   links   ][   feed rss   ][   chi siamo   ][   sitemap
NVIDIAZONE.IT è servito da una applicazione proprietaria di cui è vietata la replicazione parziale o totale (layout e/o logica). I marchi e le sigle in esso citate sono proprietà degli aventi diritto. Note Legali. Privacy.