Autor Thema: Schneller rechnen mit CUDA (Gelesen 1795 mal)

SiLæncer · « **am:** 18 Februar, 2007, 12:28 »

Nvidia stellt das Entwicklungskit für seine CUDA genannte Technik zur Beschleunigung wissenschaftlicher Berechnungen zum allgemeinen Download bereit. Zuvor mussten Interessenten als Profi-Entwickler bei Nvidia registriert sein, um an die immer noch im Beta-Stadium steckende Software zu gelangen. Bislang steht die Software für Windows XP und Red Hat Enterprise Linux 4 zur Verfügung.

Der bei Privatanwendern häufig nur für Spiele genutzte Grafikchip soll mittels der Compute Unified Device Architecture auch als Co-Prozessor zum Einsatz kommen. Als Anwendungsbeispiele nennt Nvidia etwa die Lösung seismologischer oder geologischer Probleme oder die Simulation elektromagnetischer Felder. Das Entwicklungskit enthält unter anderem eine komplette Entwicklungsumgebung, einen C-Compiler und die notwendigen Bibliotheken.

Quelle : www.heise.de

SiLæncer · « **Antwort #1 am:** 09 Mai, 2009, 11:51 »

Nach einigen Wochen Beta-Phase hat der Chiphersteller Nvidia die Version 2.2 der Programmierschnittstelle CUDA (Compute Unified Device Architecture) fertiggestellt. Neben Linux, Mac OS X sowie Windows XP und Vista lassen sich GeForce- und Quadro-Grafikkarten nun auch unter Windows 7 als GPGPU-Beschleuniger (General Purpose Computation on Graphic Processing Unit) verwenden.

Zu den neuen Funktionen des SDK gehört unter anderem ein grafischer Profiler, der Engpässe bei Speicherzugriffen aufdeckt. An der Performanceschraube drehte Nvidia ebenfalls: So arbeitet CUDA nun enger mit OpenGL-Anwendungen zusammen und bei Videoberechnungen wird effizienter mit der Speicherbandbreite umgegangen.

Passend zum aktualisierten SDK steht ein neuer Treiber mit der Versionsnummer 185.85 sowohl in der CUDA Zone als auch im üblichen Treiberbereich zum Download bereit. Seit zwei Wochen bietet der Chiphersteller zudem für registrierte Entwickler einen Beta-Treiber an, der die plattformübergreifende Schnittstelle OpenCL unterstützt.

Quelle : www.heise.de

SiLæncer · « **Antwort #2 am:** 20 März, 2010, 18:20 »

Offiziell will Nvidia Grafikkarten wie die GeForce GTX 470 mit seiner neuen Grafikarchitektur Fermi erst Ende März vorstellen. Zur Vorbereitung hat der Grafikchiphersteller nun das CUDA-3.0-Entwicklerpaket für Windows, Linux und MacOS bereitgestellt. Mit Werkzeugen wie CUDA oder ATIs Stream können Programmierer die zahlreichen Prozessorkerne in modernen Grafikchips für massiv parallele Datenverarbeitung nutzen (GPGPU, General-Purpose Computation on Graphics Processing Unit).

Einige der wesentlichen Neuerungen bei CUDA 3.0 sind Unterstützung für die Fermi-Architektur inklusive 64-Bit-GPUs, paralleles Ausführen der Kernel sowie Support für Hardware-Debugging und -Profiling. C++-Programmierer profitieren von der eingeführten Vererbung bei Klassen und Templates. Außerdem hat Nvidia das API für Direct3D und OpenGL vereinheitlicht. Wie das Dr. Dobb's Journal meint, werden insbesondere Forscher auf dem Gebiet der Quantenchromodynamik von CUDA 3.0 profitieren: Sie sollen dann ihre rechenaufwändigen Simulationen auf GPGPU-bestückten PCs statt auf großen Rechnerclustern laufen lassen können.

Quelle : www.heise.de

McCom · « **Antwort #3 am:** 22 März, 2010, 09:33 »

Hab das gestern übern RSS-Reader gelesen. Hm, hat da schon jemand etwas mit gespielt? Ct hatte vor Monaten mal nen Bericht drüber, welche Video-Software davon profitiert etc. Gibts bei euch irgendwelche Erfahrungen?

SiLæncer · « **Antwort #4 am:** 22 März, 2010, 09:43 »

Moin , der Mediacoder z.B. nutzt CUDA ...

SiLæncer · « **Antwort #5 am:** 22 September, 2010, 10:38 »

CUDA-Programme sollen bald auch auf x86-Hauptprozessoren lauffähig sein. Dies hat Nvidia-Chef Jen-Hsun Huang auf der GPU Technology Conference (GTC) im kalifornischen San Jose angekündigt. So wird die Portland Group (PGI) einen speziellen, kostenpflichtigen Compiler – CUDA-x86 – anbieten, der CUDA-Code für x86-Prozessoren (32/64 Bit) von AMD und Intel übersetzt, deren Kerne dann im Zusammenspiel mit ihren SIMD-Streaming-Fähigkeiten die Ausführung paralleler Befehle übernehmen.

Vorstellen will PGI den CUDA-C-Compiler auf der Supercomputing Conference in New Orleans, die vom 13. bis 19. November stattfindet.Nvidia vergrößert damit die Reichweite von CUDA drastisch. CUDA-Programme lassen sich dann auch ohne entsprechende Grafikkarte testen und debuggen. Bis dato verarbeiten nur Nvidia-Grafikchips (ab G80) mit Unified-Shader-Architektur entsprechenden GPGPU-Code. Derzeit ermöglicht lediglich die Open Computing Language (OpenCL), deren Spezifikation bereits Ende 2008 verabschiedet wurde, das Programmieren von Applikationen, die auf CPU und GPUs gleichermaßen laufen.

Zufrieden zeigte sich Huang außerdem über das immer weiter zunehmende Interesse an CUDA. So habe sich 2010 im Vergleich zu 2009 die Zahl der CUDA-SDK-Downloads mit 668.000 Stück mehr als verdoppelt, die Zahl der Tesla-Systeme anbietenden OEMs von 1 auf 9 erhöht und die GTC-Einreichungen auf 334 verfünffacht. Huang kündigte auch noch mit Tesla-Rechenkarten bestückte Blades für die Supercomputing-Systeme IBM BladeCenter, T-Platforms TB2 und Cray XE6 an.

Quelle : www.heise.de

SiLæncer · « **Antwort #6 am:** 26 November, 2010, 09:05 »

Nvidia hat seine GPGPU-Bibliothek Cuda in der Version 3.2 veröffentlicht. Einzelne Berechnungsmethoden hat Nvidia dabei um ein Vielfaches beschleunigt.

Cuda erlaubt es, beliebige Berechnungen auf einer Nvidia-GPU auszuführen. Die Version 3.2 der Bibliothek soll dabei deutlich schneller sein als ihr Vorgänger. So soll Nividias Blas-Implementierung (Basic Linear Algebra Subprograms) namens Cublas auf Fermi-Chips Matrixmultiplikationen aller Datentypen 50 bis 300 Prozent schneller durchführen. Die Bibliothek Cufft für schnelle Fourier-Transformationen soll bei einzelnen Berechnungen sogar zwei- bis zehnmal schneller sein als ihr Vorgänger.

Mit Cusparse gebe es zudem eine neue Bibliothek zum Umgang mit dünnbesetzten Matrizen (Sparse Matrix), mit der dank GPU-Beschleunigung einige Operationen fünf- bis 30-mal schneller abgewickelt werden könnten als mit Intels Math Kernel Library (MKL), so Nvidia. Ähnliches gelte für Curand, eine Bibliothek zur Erzeugung von Pseudo-Zufallszahlen. Hier gibt Nvidia an, dass Berechnungen zehn- bis 20-mal schneller abliefen als mit MKL.

Darüber hinaus hat Nvidia Encoder und Decoder für H.264 in das Cuda-Toolkit integriert, unterstützt Quadro- und Tesla-Produkte mit 6 GByte Speicher und den Modus Tesla Compute Cluster (TCC) auf Windows-Desktops.

Die Entwicklerwerkzeuge wurden um Multi-GPU-Debugging, einen erweiterten Cuda-Memcheck für alle Fermi-Architekturen und NVCC um Unterstützung für Intels C Compiler (ICC) in der Version 11.1 auf 64-Bit-Linux-Systemen erweitert. Mit Nvidia-SMI gibt es eine neue Schnittstelle zur Überwachung von Leistungswerten der GPU.

Cuda 3.2 steht unter developer.nvidia.com für Windows, Linux und Mac OS X zum Download bereit.

Quelle : www.golem.de

SiLæncer · « **Antwort #7 am:** 28 Februar, 2011, 15:19 »

Mit drei bedeutenden Erweiterungen wartet die "Super Computer Company" Nvidia in der neuen CUDA-Version (Compute Unified Device Architecture) 4.0 auf: GPU Direct 2.0, Unified Virtual Adressing und die C++-Template-Bibliothek Thrust.

GPU Direct 2.0 erweitert das aktuelle Konzept des direkten Zugriffs auf den Kartenspeicher unter Umgehung der CPU und des Hauptspeichers. Bislang nutzten nur die Infiniband-Treiber von Mellanox und QLogic diese Möglichkeit, nun ermöglicht Nvidia den direkten Datentransfer zwischen mehreren GPU-Karten (Peer-to-Peer memory access) sowie direkte MPI-Kommunikation.

Das gemeinsame virtuelle Speichermodell UVA sorgt zwar nicht unbedingt für mehr Performance, vereinfacht aber erheblich die Programmierung. Es benötigt für den gemeinsamen Adressraum mehr als 32 Bit, ist daher nur für 64-Bit-Programme verfügbar. Damit muss sich der Programmierer nicht mehr explizit um Datentransfers zwischen Haupt- und Kartenspeicher kümmern, das erledigen Treiber und die Bibliotheken automatisch. Die Pointer sind nun gewissermaßen markiert, so dass man unmittelbar an der Adresse feststellen kann, wo sich der damit angesprochene Speicherbereich befindet. Das vereinfacht und optimiert insbesondere auch den Umgang mit standardisierten Bibliotheken wie CuBLAS oder CuFFT.

Die dritte größere Neuerung ist die Thrust-Bibliothek, die ähnlich wie die C++-Standard Template Library aufgebaut ist, aber erweitert um parallele Algorithmen und Datenstrukturen. Thrust teilt den Job auf GPUs und CPUs auf und kann zur Compile-Zeit automatisch den wahrscheinlich schnellsten Codepfad auswählen. Paralleles Sortieren soll zum Beispiel 5- bis 100-mal schneller sein als mit STL und Intels Threading Bulding Blocks (TBB) – allerdings ist unklar, welche Hardware Nvidia für diesen Vergleich zugrundelegte.

Hinzu kommen in Cuda 4.0 neue C/C++-Features, etwa um mehrere GPUs bequem anzusprechen, eine neue NPP Image/Video Processing Library, Layered Textures. Auch das Performance Monitorung und Debugging wurde erweitert, unter anderem gibt es nun auch einen Debugger für Mac-OS.

Das CUDA-Toolkit 4.0 ist zunächst für eingetragene Entwickler verfügbar und dürfte wie üblich in ein paar Monaten für jedermann auf Nvidias Developer Zone zum Download bereit stehen.

Quelle : www.heise.de

McCom · « **Antwort #8 am:** 28 Februar, 2011, 22:54 »

Manchmal bereue ich es meinen Weg eingeschlagen zu haben, und nicht wie zwei Freunde in Erlangen an die Uni gegangen zu sein und nun ihren Traum von Info am Frauenhofer leben... Ich würde gerne mal wieder ins echte Programmieren eintauchen. Nur wo die Zeit klauen, um sich der Sache hinzugeben und keinen Murks zu bauen^^

Aber nach ein paar Jahrn CUDA die frage an euch CUBEr, hat einer von euch schon Erfahrungen damit gesammelt? Ist es gut? Kann man damit umgehen? Lohnt es sich eine gute CUDA-Karte zu kaufen? Leider hat die c't schon lange nicht mehr über die Entwicklung in der ecke berichtet...

berti · « **Antwort #9 am:** 01 März, 2011, 03:03 »

naja, soo prall sieht das für den normalen anwender nicht aus, sehr viele programme werben zwar mit cuda unterstützung, aber bei vielen bringt das einfach nix. anders sieht das da im semi und professionellen bereich aus: als beispiel sieht das im bereich spezialeffekte bei videoverarbeitung und bei der 3d animation ( meist das rendern) schon etwas anders aus, hier gibt es einen erheblichen leistungsschub.

SiLæncer · « **Antwort #10 am:** 14 Dezember, 2011, 18:00 »

NVIDIA hat anlässlich der hauseigenen Konferenz GTC in Peking den Quellcode seines auf dem LLVM-Projekt aufgebauten CUDA-Compilers veröffentlicht. Der speziell auf parallele GPU-Berechnungen ausgelegte Compiler ist Teil der CUDA-Entwicklungsplattform und soll die Technik für neue Programmiersprachen und alternative Prozessor-Architekturen zugänglich machen – darunter auch die Grafikprozessoren von AMD und Intel.

Der Compiler ist Teil der erst vor wenigen Tagen vorgestellten CUDA-Version 4.1, bei NVIDIA registrierte Entwickler erhalten kostenlos Zugriff auf den Quellcode. NVIDIA spricht davon, dass man die Plattform so weiter öffne und zitiert Sudhakar Yalamanchili, Professor am Georgia Institute of Technology und Leiter des Ocelot-Projektes, mit den Worten, dass die Zukunft der Computerwissenschaften plattformübergreifend sei und das CUDA-Projekt Entwickler auf verschiedenen Prozessor-Architekturen unterstützen würde – darunter namentlich AMD-GPUs und Intel-x86-CPUs.

Aktuell unterstützt das System die Entwicklung unter C und C++, eine Erweiterung der Portland Group (PGI) erlaubt auch Fortran als CUDA-Programmiersprache. Als Zielplattform kommen derzeit NVIDIAs eigene GPUs und x86-Intel-CPUs in Frage. Langfristig will NVIDIA mit der Offenlegung der Technik den Weg zum Exascale-Computig ebnen, sprich deren Einsatz auf Supercomputern und anderen Hochleistungsplattformen.

Quelle und Links : http://www.heise.de/newsticker/meldung/NVIDIAs-CUDA-Technik-bald-auch-fuer-AMD-GPUs-1395220.html

SiLæncer · « **Antwort #11 am:** 27 Januar, 2012, 13:25 »

Nvidia hat die Version 4.1 der kostenlosen CUDA-Entwicklungsumgebung (Compute Unified Device Architecture) veröffentlicht. Integriert wurde erstmals ein auf der quelloffenen Low Level Virtual Machine (LLVM) aufbauender Compiler, von dem sich das Unternehmen ein etwa 10 Prozent schnelleres Anwendungsverhalten verspricht. Der speziell auf parallele GPU-Berechnungen ausgelegte Compiler soll CUDA für neue Programmiersprachen und alternative Prozessor-Architekturen zugänglich machen – darunter auch die Grafikprozessoren von AMD und Intel.

Darüber hinaus sind offenbar rund 1000 neue Signalverarbeitungsfunktionen in der NPP-Bibliothek Nividia Performance Primitives) zur Bildverarbeitung unter Nvidia-GPUs hinzugekommen. Die Bibliothek enthält mittlerweile über 2200 Funktionen und ist laut Nvidia wohl 40 Prozent performanter als Intels Konkurrenzbibliothek. Komplett überarbeitet hat der Hersteller seinen Visual Profiler, er enthält zum Beispiel ein neues automatisiertes System für schrittweise durchgeführte Performanceverbesserungen.

Mit CUDA 4.1 hat Nvidia auch die Version 2.1 der sich in Visual Studio integrierenden GPU-Entwickler-Tools Parallel Nsight veröffentlicht. Es bietet unter anderem Analyzer-Werkzeuge für Cuda C/C++, OpenGL, OpenCL sowie DirectX und enthält die in den CUDA-Toolkits größtenteils vorhandenen GPU-Entwickler-Tools, sodass sich Programme aus Visual Studio heraus debuggen, inspizieren und analysieren lassen.

Quelle : www.heise.de

SiLæncer · « **Antwort #12 am:** 15 Oktober, 2012, 16:30 »

Nvidia löst die Preview-Version der GPGPU-Schnittstelle CUDA 5.0 heute mit der finalen Version ab. Sie unterstützt beispielsweise die Funktion Dynamic Parallelism, durch die ein auf der GPU ablaufender Thread dynamisch neue Kernel erzeugen kann. Das entlastet die CPU, erleichtert die Programmierung und ermöglicht das Ausführen noch komplexerer Algorithmen als bisher. Auf der GPU Technology Conference hatte Nvidia im Mai 2012 erklärt, dass Entwickler durch die neue Funktion auch Programmcode sparen könnten: So ließe sich ein zwischen 200 und 300 Zeilen langer Code auf rund 30 Zeilen runterbrechen.

Der ganze Artikel

Quelle : www.heise.de

SiLæncer · « **Antwort #13 am:** 15 November, 2013, 13:54 »

Nvidia hat einen Einblick in die nächste Version seiner CUDA-Plattform für parallele Berechnungen gewährt. Das für Anfang 2014 angekündigte CUDA 6 soll durch Verbesserungen Programme um den Faktor 8 beschleunigen können, indem Entwickler die vorhandenen CPU-Bibliotheken mit ihren GPU-Pendants ersetzen. Die Beschleunigung der BLAS- (Basic Linear Algebra Subprograms) und FFTW-Berechnungen erfolgt danach automatisch.

Neue BLAS- und FFT-GPU-Bibliotheken skalieren anscheinend automatisch über bis zu 8 GPUs in einem Single Node und liefern über 9 Teraflops Leistung über Double-Precision-Berechnungen pro Knoten. Mit CUDA werden ferner anscheinend größere Workloads als je zuvor unterstützt (bis zu 512 GB). Die Skalierung von Multi-GPUs lässt sich wohl auch mit der neuen BLAS Drop-in Library von CUDA nutzen.

Der ganze Artikel

Quelle : www.heise.de

SiLæncer · « **Antwort #14 am:** 21 August, 2014, 16:49 »

Das Erscheinen von CUDA 6 ist gerade mal vier Monate her, da gibt es schon ein neues Release, über das sich dieses mal auch Fortran-Entwickler freuen dürfen.

Nvidia bietet seine Architektur für parallele Berechnungen CUDA (Compute Unified Device Architecture) jetzt auf seiner Entwickler-Website in der Version 6.5 als kostenlosen Download an. Zu den Neuerungen der Plattform für parallele Berechnungen gehören die offizielle Unterstützung für 64-Bit-Systeme von ARM, der CUDA-Fortran-Werkzeuge (Debugger, Profiler, Memchecks) sowie der CUDA-Bibliothek für schnelle Fourier-Transformation (cuFFT).

CUDA 6.5 bietet außerdem neue Occupancy Calculator APIs und Verbesserungen bei Double-Precision-Berechnungen. Als neue Compiler-Zielplattform ist Visual Studio 2013 hinzugekommen. Für Linux und Mac OS gibt es mit dem neuen CUDA-Release nun statische Versionen der Bibliotheken cuBLAS, cuSPARSE, cuFFT, cuRAND und NPP.

Weitere Neuerungen fasst ein längerer Beitrag im "Parallel Forall"-Blog zusammen, der die hier vorgestellten Änderungen detailliert beschreibt oder auf ausführliche Dokumentationen verweist.

Quelle und Links : http://www.heise.de/newsticker/meldung/Parallel-Computing-Nvidia-veroeffentlicht-CUDA-6-5-2299405.html

Neuigkeiten:

Autor Thema: Schneller rechnen mit CUDA (Gelesen 1795 mal)

SiLæncer

Schneller rechnen mit CUDA

SiLæncer

Nvidia veröffentlicht CUDA 2.2

SiLæncer

CUDA 3.0 verfügbar

McCom

Re: CUDA 3.0 verfügbar

SiLæncer

Re: CUDA 3.0 verfügbar

SiLæncer

CUDA-Programme bald auch auf CPUs lauffähig

SiLæncer

Cuda 3.2 - Nvidia beschleunigt GPGPU-Computing

SiLæncer

Nvidias CUDA 4.0 bringt zahlreiche Neuerungen

McCom

Re: Nvidias CUDA 4.0 bringt zahlreiche Neuerungen

berti

Re: Nvidias CUDA 4.0 bringt zahlreiche Neuerungen

SiLæncer

NVIDIAs CUDA-Technik bald auch für AMD-GPUs

SiLæncer

Nvidia veröffentlicht CUDA 4.1 mit LLVM-Compiler

SiLæncer

Nvidia veröffentlicht finale Version von CUDA 5.0

SiLæncer

Nvidias CUDA 6 führt Unified-Memory-Konzept ein

SiLæncer

Parallel Computing: Nvidia veröffentlicht CUDA 6.5