GPU Metal Bench/ PCIe /VRAM Speed Test

  • Da müsste VSync deaktiviert werden.

    Wie kann man unter 12.5 VSync deaktivieren ?

  • sudo xattr -cr com.apple.quarantin

    Funktioniert bei mir nicht...

  • sudo xattr -cr com.apple.quarantin GPU_Bench_OceanWave_Bandwidth.app

    oder

    sudo xattr -dr com.apple.quarantin GPU_Bench_OceanWave_Bandwidth.app

    probieren.

    Damit werden alle Apple App Sicherheitsmechanismen deaktiviert, ich hoffe es ist kein Virus drin ;-)

    Einmal editiert, zuletzt von khe91 () aus folgendem Grund: Typo

  • Das ist der korrekte Befehl:

    sudo xattr -cr /Users/christopher/Downloads/GPU_Bench_OceanWave_Bandwidth.app

    LG Chris


    Meine Hardware:

  • Hi Leute, war im Urlaub... Danke für die Feedbacks.

    1. Nvidia Logo statt M1 ... wird zügig gefixt

    2. VYSNC off beim Test etwas aufwändiger - evtl. sinnvoller gleich anderen, METAL basierenden Bench einzubauen statt OceanWave (mit bis zu 1500 FPS ;))

    Jedoch Hauptgrund für Update der schon älteren App war update der Speedmessing PCIe und VRAM um die dort sehr guten M1 Werte abzubilden. Diese sind mit ein Grund weshalb diese Apple GPUs so zügig laufen - bei gleicher PCIe / VRAM Speed wie bei uns, PC/AMD sähen die Apple GPUs in manchen Anwendungen gar nicht mehr so gut aus.


    EDIT:

    Hi Leute,

    statt OceanWave (opencl, Vsync limitiert) würde ich Nbody Metal als Speedmeter nehmen- ist unabhängig von Vsync, misst GigaFlops.


    Testet die App mal bitte kurz ob die sowohl auf Midrange AMDs als auch M1 noch gut läuft.

    Läuft 10 sec, beendet automatisch. Klar wird später das Ergebnis (Max Gigaflops) in der eigentlichen Bench App angezeigt, wie bei Oceanwave.


    Ansonsten würde ich die Anzahl der Objekte (65K) etwas erniedrigen. Auf meiner RX 570 mit 5GB läuft sie noch rund - kann sein ne RX 560 ist bei der 80K Objektanzahl schon etwas laggy ..

    RX 570 ca. 2800 Gigaflops (Min 2780 ....Max 2850)


    Wenn das bei Euch läuft ersetze ich die Oceanwave (Vysnc limittiert & old OpenCL) mit Gigaflops Nbody.

    ...


    DL siehe Posting weiter unten, DL V2.3

    6 Mal editiert, zuletzt von mitchde ()

  • Danke Chris! Wow dachte der M1 könnte da evtl. etwas einbrechen - aber falsch gedacht!!!

    4860 Gigaflops M1 Max 32C vs 2800 Gigaflops meiner RX 570 ... jut!

    Bin mal auf die Radeon VII gespannt oder ne 5600XT (wohl meine nächste gebrauchte..;) wenn deutlich unter 200€)

    Werde dieses Nbody Metal daher in den nächsten Tagen in die eigentliche App einbauen und natürlich noch ICON M1 für M1 statt Nvidia fixen. Bis vor kurzem gabs ja nur AMD oder NV - daher meine Programmierung:

    IF GPU=AMD then AMD Icon

    ELSE

    NVIDIA ICON;

    Was seit M1 natürlich net klappt!

    ;)


    PS: Habe Link für die Vorab NBody Metal Gigaflops Messung im Post #1 hinzugefügt, integration in die eigentliche App in Kürze...

  • So, Update der GPU Bench.... auf V2.2, nun Metal Bench statt OpenCL sowie - hoffe M1 Icon beim M1 ;)

    DL LINK in erstem Posting....


  • Mein VRAM Speed ist ziemlich niedrig im Vergleich zu den anderen Ergebnissen hier.

    Stimmt da bei mir irgendwas nicht?


    Hab die App noch ein paar mal ausgeführt, das Ergebnis variieret wohl einfach immer sehr stark. Hat grad 55GB/s und direkt drauf 166GB/s


    Mac Pro 1.1 Case, i5 12600K, ASUS Z690M-Prime D4, 32GB RAM, RX 6800 XT

    Einmal editiert, zuletzt von Arstidir ()

  • Der Messung der VRAM Speed erzeugt - gerade auf sehr flinken Karten - sehr wenig GPU Last. Je nach Zusammenspiel VBIOS und Apple Treibern (und AGPM) erhöht sich die speziell die VRAM Taktung nicht voll oder sehr spät.

    Bei meiner RX 570 ist kaum Änderung zw. den Runs sowohl bei GigaFlops als auch VRAM im Bereich von nur einstelligen % . Sprich bei meinen rund 155 GB/s ca. 3-4 GS/S Unterschied. Bei Gigaflops auch nur ca. 2-3% Diff (bei 2800 sind das ca. 50-70 Gigaflops/S diff.

    Evtl. lasse ich die enthaltenen VRAM MEssung mehrfach laufen, dauert nur je 2-3 Sec - und das ergibt dann mehr Unabhäbigigkeit von evtl. zu starkem Energiesparen = VRAM CLK bleibt bei nur 300-600MHZ = idle - der GPU ...


    Ganz gut sieht man, dass dein Board/GPU die neuere PCIe Bandbreite gut ausnutzt. Mehr geht da kaum, weil die max. möglichen 31 GB/s PCIe 4.0 ein rein theoretisches Brutto sind - real Netto weniger - wie auch bei PCIe 3.0 kaum einer auf 15,5 GB/s kommt.


    Verlauf GPU CLK / VRAM CLK bei meiner RX 570

    VRAM CLK (rot) öfters bei Idle 300 MHz, jedoch während Nbody läuft bzw. VRAM Speed Messung bleibt es bei 1000 MHz. (OpenGL Driver Monitor.. als Dl Zusätzliche Tools zu Xcode https://download.developer.app…_Tools_for_Xcode_13.4.dmg) . Man sieht das die GPU CLK häufiger hoch geht wie die VRAM CLK..

    2 Mal editiert, zuletzt von mitchde ()

  • VII sehr hohe VRAM Speed / VRAM Bandbreite.

    Die davor gemessene RX 6800 XT ( sicher weniger VRAM Speed wie VII, aber 250 GB/s+ hätte ich erwartet) kommt mir bei den max. 166 GB/s doch etwas komisch vor. Da meine alte RX 570er ja schon max. 156 GB/s schafft!!! Auch das das so stark zw. nur extrem langsamen 55 GB/S und 166 GB/s schankt wundert mich - normal sollten das höchstens 10 GB/s +/- rund um 160 GB/s sein.

    Ob da bei der 6800 XT ein passender Powerplaytable inject was ändern würde?


    EDIT: Update V2.3, misst VRAM Speed mehrfach und zeigt davon max. Messwert an.

    Jedoch bei mir wie schon gesagt kaum Änderungen (bei 155 GB/s +- 2GB Diff) auch bei nur einer Messung.

    Einmal editiert, zuletzt von mitchde ()

  • PS: Deine PCIe Transferwerte sind mit unter 7 GB/S echt niedrig für PCIE 3.0.. meine RX 570 lieferte in meinem älteren Mainbaord (auch PCIe 3.0) ca. 13 GB/s!!! Was real, ab ca. 12 GB/s das maximum bei PCIe 3.0 ist. Mit PCI 4.0 GPU und Intel CPU / Chipsatz kommt man sogar über 20 GB/s.

    Aktuelle Version V2.3 (Universal).

    Meine (neue) ;) RX 5600 XT




    DL

    GPU_Bench_NBodyMetal_BW_V2.3.zip

  • Ich auch nochmal mit dem M1 Max (32C / 32GB) in der aktuellen Benchmark Version mit Ventura 12.2 B1.

    LG Chris


    Meine Hardware:

  • Wieder Hammer 65 GB/s Transferspeed bei CPU GPU ... dat erreicht nie ne externe GPU... erst mit PCIe 6.0 - was noch erfunden werden muss...;)

    PS: Das ist das 10 fache der - ungewöhnlich langsamen Werte von DerTschnigs RX 580- und immer noch vielfach (2,5 fach ) der schnellsten PCI 4.0 Werte hier (22 GB/s). 4 - 5 fach unserer PCI 3.0 Werte mit 10-13 GB/s , Ausnahme DerTschnigs mit 6 GB/s.

    Auch diese Transferspeed macht sicher mit den Erstaunlichen Erfolg der M1 GPU aus - selbst wenn sie von den GFlops nicht alle GPUs wegblasen kann. In realer Welt beflügelt das deutliche mehr (vielfache!) an Transferspeed durchaus auch den Flow. Bei nur 20-30% Diff bei der Transferspeed würde man das in der Realität - im Gegensatz zu 20-30% schnellerem GPU/VRAM nicht spüren.