Nvidia verdoppelt Leistung

gonso-01

[FONT="Arial Black"][color="Yellow"]Nvidia verdoppelt Leistung der Tesla-Rechenknechte [/color][/FONT]

Auf engstem Raum packt Nvidia 4 TeraFLOPS Rechenleistung beim Tesla S1070.

Parallel zum neuen Grafikchip GT200 präsentiert Nvidia auch seine davon abgeleiteten Applikationsbeschleuniger Tesla C1060 und S1070. Auf der Erweiterungskarte Telsa C1060 sitzt ein T10P-Chip mit 240 sogenannten Thread-Prozessoren (TP), welche mit 1,33 GHz Taktfrequenz arbeiten, sowie 4 GByte GDDR3-Speicher. Durch den mit 800 MHz getakteten 512-Bit-Speicherbus steht eine maximale Speicherbandbreite von 102 GByte/s zur Verfügung. Im Vergleich zu den Vorgängern der Tesla-8-Serie soll sich die Single-Precision-Rechenleistung bei der zweiten Tesla-Generation von 500 GigaFLOPS auf 1 TeraFLOPS verdoppelt haben. Damit tritt der Tesla C1060 in direkte Konkurrenz zum AMD FireStream 9250. Die typische Leistungsaufnahme gibt Nvidia mit 160 Watt an. Der voluminöse Kühler der 27 Zentimeter langen Karte benötigt den Raum eines zweiten Steckplatzes.

Der Tesla C1060 unterscheidet sich äußerlich von einer GeForce GTX 280 nur durch die fehlenden DVI-Ausgänge.

Gleich vier T10P-GPUs verbaut der Hersteller in den Tesla-S1070-Rackeinschub mit einer Höheneinheit. Die Performance der insgesamt 960 TP mit 1,5 GHz Taktfrequenz soll 4 TeraFLOPS erreichen. Jeder Chip besitzt, wie beim Tesla C1060, 4 GByte GDDR3-Speicher (800 MHz) mit einem 512 Bit Interface. Die Anbindung des externen Coprozessors mit einer typischen Leistungsaufnahme von 700 Watt erfolgt per Kabel über zwei Interface-Karten mit PCI Express 2.0 und jeweils 16 Lanes. Durch Zusammenschalten von Rechnern mit mehreren Tesla-Einschüben lassen sich leicht Cluster aus mehreren Zehntausend Thread-Prozessoren aufbauen.

Laut Nvidia verwenden bereits über 250 Firmen die Rechenleistung von GPUs für HPC-Anwendungen, wie Molekül- und Wettersimulationen, Auswertung von seismischen Daten in der Ölförderung und Chipdesign. Mit den neuen Tesla-Beschleunigern veröffentlicht der Hersteller auch Version 2.0 von CUDA. Das Entwicklerpaket für GPGPU-Applikationen unterstützt nun auch Multi-Core-Prozessoren. Über Preise und Markteinführung der neuen Tesla-Serie gibt es noch keine Informationen.

[SIZE="1"][color="Red"]heise[/color][/SIZE]

gonso-01

[color="Yellow"]Nvidia kratzt mit neuen Grafik- und Compute-Prozessoren an der TFLOPS-Schallmauer [/color]

Der Grafikspezialist Nvidia erkämpft mit den DirectX-10-Prozessoren GeForce GTX 280/260 neue Höchstwerte bei 3D-Grafik- und Rechenleistung. Neue Rekordwerte gibt es aber auch bei der Leistungsaufnahme.

Nvidias positioniert sein neues Flaggschiff GeForce GTX 280 als Grafikkarte und Beschleuniger für rechenintensive Anwendungen.

Die neuen DirectX-10-Chips GeForce GTX 280 und GeForce GTX 260 mit der internen Bezeichnung GT200 schöpfen ihre Rechenleistung aus einer hohen Zahl von Shader-ALUs, die im Vergleich zum Vorgänger G92 fast verdoppelt wurde. Das Spitzenmodell vereint 240 Rechenkerne, die in zehn Clustern zu je dreimal acht ALUs angeordnet sind. Sie erreichen bei 1296 MHz und drei Operation pro Takt (MAD, MUL) zusammen eine theoretische Spitzenleistung von beachtlichen 933 GFLOPS. Die 128 ALUs des schnellsten Vorgängers GeForce 9800 GTX kommen lediglich auf 648 GFLOPS. Dafür musste Nvidia imposante 1,4 Milliarden Transistoren auf dem neuen Chip unterbringen, der sich zusammen mit 1 GByte Grafikspeicher bis zu rekordverdächtigen 236 Watt aus dem Netzteil genehmigt. In vielen Betriebszuständen liegt die Stromaufnahme aber deutlich niedriger. Mit diesem Aufwand sollen aktuelle und kommende DirectX-10-Spiele mit ausgefeilten Grafikeffekten auf HD-Monitoren mit 1920 × 1200 Bildpunkten und mehr spielbar sein.

Die Texturleistung hat Nvidia erstmalig nicht in gleichem Maße erhöht, sondern lediglich von 64 auf 80 Texel/Takt angehoben und berücksichtigt damit das sich verändernde Verhältnis zwischen Arithmetik- und Textur-Operationen in den Shader-Programmen. Die Zahl der Blend-Operationen in den Raster-Endstufen stieg dafür kräftig von 12 auf 32 Pixel/Takt. Der Chiptakt liegt bei moderaten 602 MHz. Hier konnte Nvidia nicht zulegen, da man den GT200 im selben 65-nm-Prozess fertigt wie den Vorgänger GeForce 9800 GTX (G92). Das Speicherinterface läuft mit 1107 MHz und steuert 1 GByte GDDR3-Speicher über einen 512 breiten Datenbus an. Die dadurch hohen Kosten für den Chip und die Leiterplatte nimmt Nvidia bei diesen hochpreisigen Produkten offenbar in Kauf. Vom Konkurrenten AMD erwartet man dagegen schon den Wechsel zu GDDR5-Speicher, der die gleiche Speicherleistung auch über ein kostengünstigeres 256-Bit-Interface erzielen soll.

Nvidia hat sich aber nicht nur auf schiere Rechenkraft konzentriert, sondern sich auch der Schwachstellen des Vorgängers angenommen. Die Zahl der Arbeitsregister pro Thread wurde verdoppelt, was komplexen Shader-Programmen zugute kommt. Der interne Streamout-Buffer soll jetzt sechsmal schneller arbeiten und behindert die ALUs dadurch nicht mehr in der Konfiguration als Geometrieshader. Auch sollen zahlreiche interne Optimierungen des internen Datenflusses die Effizienz gegenüber dem Vorgänger verbessern und beispielsweise dafür sorgen, dass der GTX 280/260 näher an seine theoretische Texturleistung herankommt als die Vorgänger aus der 8er- und 9er-Reihe.

[SIZE="1"][color="Red"]heise[/color][/SIZE]

Nvidia verdoppelt Leistung

Jetzt mitmachen!

Illegales IPTV: Wann Nutzer mit Konsequenzen rechnen müssen

KI-gestützte Cyberkriminalität erreicht neues Niveau

Neue Bedrohung für Windows-Systeme: LegacyHive entdeckt

Neue Bedrohung durch Fake-SMS im Smartphone-Diebstahl

Urteil im Cyberangriff auf Transport for London: Zwei junge Täter hinter Gittern

OnionHop: Ein Einblick in das Tool zur Datenanonymisierung

Sky und FACT setzen gegen illegale Set-Top-Boxen ein

Skandal um Suno: KI-Musikgeneratoren im Kreuzfeuer der Kritik

Zukunft der Verkehrssicherheit in der EU: Pläne für eine Tempo-Bremse

Alarmierende Datenleaks bei Telegram und anderen Plattformen

Intel wirft Atombombe auf AMD

Ich brauche Hilfe

Laptop stürzt ständig ab

PC fährt nicht hoch und piept

Wechsel zu 1und1

com problem . bitte um hilfe

Notebook, welches ist zu empfehlen?

Hilfe bei Raid?

Kaufempfehlung NAS / Server / Betriebssystem

t-com Magenta1 und Hybrid Router