1. Dashboard
  2. Mitglieder
    1. Letzte Aktivitäten
    2. Benutzer online
    3. Team
    4. Mitgliedersuche
  3. Filebase
  4. Forum
  5. Zebradem-WIKI
  6. Foren-Regeln
  7. Spenden Liste
    1. Spenden
  • Anmelden
  • Registrieren
  • Suche
ZebraDem-Sponsoring
Dieses Thema
  • Alles
  • Dieses Thema
  • Dieses Forum
  • Seiten
  • Dateien
  • Forum
  • Erweiterte Suche
  1. Forum
  2. Computer Ecke
  3. Hardware

Nvidia verdoppelt Leistung

  • gonso-01
  • 16. Juni 2008 um 16:00
  • gonso-01
    Gast
    • 16. Juni 2008 um 16:00
    • #1

    [FONT="Arial Black"][color="Yellow"]Nvidia verdoppelt Leistung der Tesla-Rechenknechte [/color][/FONT]


    Auf engstem Raum packt Nvidia 4 TeraFLOPS Rechenleistung beim Tesla S1070.

    Parallel zum neuen Grafikchip GT200 präsentiert Nvidia auch seine davon abgeleiteten Applikationsbeschleuniger Tesla C1060 und S1070. Auf der Erweiterungskarte Telsa C1060 sitzt ein T10P-Chip mit 240 sogenannten Thread-Prozessoren (TP), welche mit 1,33 GHz Taktfrequenz arbeiten, sowie 4 GByte GDDR3-Speicher. Durch den mit 800 MHz getakteten 512-Bit-Speicherbus steht eine maximale Speicherbandbreite von 102 GByte/s zur Verfügung. Im Vergleich zu den Vorgängern der Tesla-8-Serie soll sich die Single-Precision-Rechenleistung bei der zweiten Tesla-Generation von 500 GigaFLOPS auf 1 TeraFLOPS verdoppelt haben. Damit tritt der Tesla C1060 in direkte Konkurrenz zum AMD FireStream 9250. Die typische Leistungsaufnahme gibt Nvidia mit 160 Watt an. Der voluminöse Kühler der 27 Zentimeter langen Karte benötigt den Raum eines zweiten Steckplatzes.


    Der Tesla C1060 unterscheidet sich äußerlich von einer GeForce GTX 280 nur durch die fehlenden DVI-Ausgänge.

    Gleich vier T10P-GPUs verbaut der Hersteller in den Tesla-S1070-Rackeinschub mit einer Höheneinheit. Die Performance der insgesamt 960 TP mit 1,5 GHz Taktfrequenz soll 4 TeraFLOPS erreichen. Jeder Chip besitzt, wie beim Tesla C1060, 4 GByte GDDR3-Speicher (800 MHz) mit einem 512 Bit Interface. Die Anbindung des externen Coprozessors mit einer typischen Leistungsaufnahme von 700 Watt erfolgt per Kabel über zwei Interface-Karten mit PCI Express 2.0 und jeweils 16 Lanes. Durch Zusammenschalten von Rechnern mit mehreren Tesla-Einschüben lassen sich leicht Cluster aus mehreren Zehntausend Thread-Prozessoren aufbauen.

    Laut Nvidia verwenden bereits über 250 Firmen die Rechenleistung von GPUs für HPC-Anwendungen, wie Molekül- und Wettersimulationen, Auswertung von seismischen Daten in der Ölförderung und Chipdesign. Mit den neuen Tesla-Beschleunigern veröffentlicht der Hersteller auch Version 2.0 von CUDA. Das Entwicklerpaket für GPGPU-Applikationen unterstützt nun auch Multi-Core-Prozessoren. Über Preise und Markteinführung der neuen Tesla-Serie gibt es noch keine Informationen.

    [SIZE="1"][color="Red"]heise[/color][/SIZE]

  • gonso-01
    Gast
    • 16. Juni 2008 um 16:03
    • #2

    [color="Yellow"]Nvidia kratzt mit neuen Grafik- und Compute-Prozessoren an der TFLOPS-Schallmauer [/color]

    Der Grafikspezialist Nvidia erkämpft mit den DirectX-10-Prozessoren GeForce GTX 280/260 neue Höchstwerte bei 3D-Grafik- und Rechenleistung. Neue Rekordwerte gibt es aber auch bei der Leistungsaufnahme.


    Nvidias positioniert sein neues Flaggschiff GeForce GTX 280 als Grafikkarte und Beschleuniger für rechenintensive Anwendungen.

    Die neuen DirectX-10-Chips GeForce GTX 280 und GeForce GTX 260 mit der internen Bezeichnung GT200 schöpfen ihre Rechenleistung aus einer hohen Zahl von Shader-ALUs, die im Vergleich zum Vorgänger G92 fast verdoppelt wurde. Das Spitzenmodell vereint 240 Rechenkerne, die in zehn Clustern zu je dreimal acht ALUs angeordnet sind. Sie erreichen bei 1296 MHz und drei Operation pro Takt (MAD, MUL) zusammen eine theoretische Spitzenleistung von beachtlichen 933 GFLOPS. Die 128 ALUs des schnellsten Vorgängers GeForce 9800 GTX kommen lediglich auf 648 GFLOPS. Dafür musste Nvidia imposante 1,4 Milliarden Transistoren auf dem neuen Chip unterbringen, der sich zusammen mit 1 GByte Grafikspeicher bis zu rekordverdächtigen 236 Watt aus dem Netzteil genehmigt. In vielen Betriebszuständen liegt die Stromaufnahme aber deutlich niedriger. Mit diesem Aufwand sollen aktuelle und kommende DirectX-10-Spiele mit ausgefeilten Grafikeffekten auf HD-Monitoren mit 1920 × 1200 Bildpunkten und mehr spielbar sein.

    Die Texturleistung hat Nvidia erstmalig nicht in gleichem Maße erhöht, sondern lediglich von 64 auf 80 Texel/Takt angehoben und berücksichtigt damit das sich verändernde Verhältnis zwischen Arithmetik- und Textur-Operationen in den Shader-Programmen. Die Zahl der Blend-Operationen in den Raster-Endstufen stieg dafür kräftig von 12 auf 32 Pixel/Takt. Der Chiptakt liegt bei moderaten 602 MHz. Hier konnte Nvidia nicht zulegen, da man den GT200 im selben 65-nm-Prozess fertigt wie den Vorgänger GeForce 9800 GTX (G92). Das Speicherinterface läuft mit 1107 MHz und steuert 1 GByte GDDR3-Speicher über einen 512 breiten Datenbus an. Die dadurch hohen Kosten für den Chip und die Leiterplatte nimmt Nvidia bei diesen hochpreisigen Produkten offenbar in Kauf. Vom Konkurrenten AMD erwartet man dagegen schon den Wechsel zu GDDR5-Speicher, der die gleiche Speicherleistung auch über ein kostengünstigeres 256-Bit-Interface erzielen soll.

    Nvidia hat sich aber nicht nur auf schiere Rechenkraft konzentriert, sondern sich auch der Schwachstellen des Vorgängers angenommen. Die Zahl der Arbeitsregister pro Thread wurde verdoppelt, was komplexen Shader-Programmen zugute kommt. Der interne Streamout-Buffer soll jetzt sechsmal schneller arbeiten und behindert die ALUs dadurch nicht mehr in der Konfiguration als Geometrieshader. Auch sollen zahlreiche interne Optimierungen des internen Datenflusses die Effizienz gegenüber dem Vorgänger verbessern und beispielsweise dafür sorgen, dass der GTX 280/260 näher an seine theoretische Texturleistung herankommt als die Vorgänger aus der 8er- und 9er-Reihe.

    [SIZE="1"][color="Red"]heise[/color][/SIZE]

Jetzt mitmachen!

Du hast noch kein Benutzerkonto auf unserer Seite? Registriere dich kostenlos und nimm an unserer Community teil!

Benutzerkonto erstellen Anmelden

Spenden

Vielen Dank für die Unterstützung!
Hiermit unterstützt du Zebradem.
Das beinhaltet überwiegend die Serverkosten und Lizenzgebühren.
Spenden

Letzte Beiträge

  1. Eine neue Bedrohung: Der adaptive KI-Wurm

    heugabel
    4. Juni 2026 um 18:27
  2. Revolution oder Risiko? KI-gestützte Hörbücher im Wandel

    heugabel
    4. Juni 2026 um 12:27
  3. Großrazzia gegen organisiertes Verbrechen in Sachsen-Anhalt

    heugabel
    4. Juni 2026 um 11:27
  4. Wieder online: Warez-Forum Data-Load kehrt zurück nach einer unerwarteten Zwangspause

    heugabel
    4. Juni 2026 um 10:27
  5. Geplante Änderungen bei der Vorratsdatenspeicherung: Ein Überblick

    heugabel
    3. Juni 2026 um 14:27
  6. Existenz eines vermeintlichen Limits bei Google durchMassive Löschungen in Frage gestellt

    heugabel
    3. Juni 2026 um 10:27
  7. Ubuntu 26.04: Der Weg in die KI-Zukunft oder nur ein Marketing-Schachzug?

    heugabel
    3. Juni 2026 um 09:27
  8. Illegale IPTV-Dienste: Eine versteckte Geldquelle für einen britischen Postboten

    heugabel
    3. Juni 2026 um 08:27
  9. Großfahndung gegen IPTV-Piraten in Großbritannien

    heugabel
    2. Juni 2026 um 18:27
  10. Datenleak an der Universität Saarland — Über 40.000 Accounts betroffen

    heugabel
    2. Juni 2026 um 12:27

Aktivste Themen

  1. Intel wirft Atombombe auf AMD

    122 Antworten
  2. Ich brauche Hilfe

    67 Antworten
  3. Laptop stürzt ständig ab

    48 Antworten
  4. PC fährt nicht hoch und piept

    40 Antworten
  5. Wechsel zu 1und1

    38 Antworten
  6. com problem . bitte um hilfe

    35 Antworten
  7. Notebook, welches ist zu empfehlen?

    28 Antworten
  8. Hilfe bei Raid?

    28 Antworten
  9. Kaufempfehlung NAS / Server / Betriebssystem

    25 Antworten
  10. t-com Magenta1 und Hybrid Router

    24 Antworten
© 2024 Zebradem - Software by WoltLab