post featured

02/10/2024

Benchmark Raspberry Pi 5

Der Raspberry Pi 5 hat sich im Vergleich zum Raspberry 4 stark verändert.
Das RPi5 ist in vielen Bereichen schneller geworden.

Wir haben hier bei ElektronicaVoorJou unsere eigenen Tests durchgeführt und unten finden Sie unsere Ergebnisse.

Punkte, die wir uns angesehen haben, sind:

  • CPU
  • GPU (Grafikprozessor)
  • Lagerung
  • Netzwerk und WLAN

CPU
Nachfolgend finden Sie die verschiedenen Treffen.
Im Allgemeinen viel schneller, aber das macht sich auch an der Temperatur bemerkbar.
Der RPi5 heizt sich schneller auf als der RPi4 und aktive Kühlung ist daher kein unnötiger Luxus.

Der Raspberry Pi 5 ist mit dem Broadcom BCM2712 Quad-Core Arm Cortex A76 Prozessor mit einer Taktrate von 2,4 GHz ausgestattet.

Der Raspberry Pi 4 ist mit dem Broadcom BCM2711, Quad-Core-Cortex-A72 (ARM v8) 64-Bit-SoC mit einer Taktrate von 1,8 GHz ausgestattet

Obwohl also immer noch 4 Kerne, ist die Geschwindigkeit ohne Übertaktung bereits im Standard um ein Drittel höher.

GPU
Nachfolgend finden Sie die verschiedenen Treffen.
Auch bei Grafikaufgaben kann sich das RPi5 schnell erwärmen.
Man muss sagen, dass die Art und Weise, wie der Grafikprozessor heißt, Einfluss auf die Temperatur hat.

OpenGL ist eine grafische Open-Source-Programmierschnittstelle (API), die es Entwicklern ermöglicht, 2D- und 3D-Grafiken für verschiedene Anwendungen wie Videospiele und wissenschaftliche Visualisierungen zu erstellen.

Vulkan macht das Gleiche, ist aber speziell auf Multithreading ausgelegt, sodass Entwickler moderne Multi-Core-Prozessoren effizienter nutzen können.

Dadurch ist Vulkan-optimierter Code im Allgemeinen schneller und führt zu einer geringeren Erwärmung des Raspberry .

Lagerung
Die traditionelle Art der Datenspeicherung und der Installation des Betriebssystems ist eine MicroSD-Karte.
Es ist jedoch auch möglich, von USB zu booten.
(USB-Stick, SSD mit USB-Adapter oder sogar NVMe)

Netzwerk

Auch im Netzwerkbereich wurden Optimierungen durchgeführt.
Obwohl wir keine wirklichen Unterschiede zu einem kabelgebundenen Ethernet-Netzwerk feststellen konnten, ist WLAN auf dem RPi5 schneller.

Messen Sie Ergebnisse und Werkzeuge.

Nachfolgend finden Sie die Messergebnisse und die von uns verwendeten Softwaretools.
Das RPi4 und das RPi5 verwendeten die gleichen Micro-SD-Karten und SSDs.
Auch der Ort, an dem die WLAN-Tests durchgeführt wurden, ist in beiden Fällen derselbe.

CPU-Treffen

Verwendete Tools: Sysbench und 7z

RPi5 mit dem Befehl „sysbench cpu run“

sysbench cpu run sysbench 1.0.20 (unter Verwendung des Systems LuaJIT 2.1.0-beta3) Ausführen des Tests mit folgenden Optionen: Anzahl der Threads: 1 Initialisierung des Zufallszahlengenerators ab der aktuellen Zeit. Primzahlenlimit: 10000 Initialisierung der Arbeitsthreads ... Threads gestartet! CPU-Geschwindigkeit: Ereignisse pro Sekunde: 2730,50 Allgemeine Statistiken: Gesamtzeit: 10,0003 s Gesamtzahl der Ereignisse: 27309 Latenz (ms): Min.: 0,36 Durchschnitt: 0,37 Maximal: 0,62 95. Perzentil: 0,37 Summe: 9995,65 Thread-Fairness: Ereignisse (Durchschnitt/ stddev): 27309,0000/0,00 Ausführungszeit (Durchschnitt/stddev): 9,9957/0,00

RPi4 mit dem Befehl „sysbench cpu run

Sysbench-CPU-Lauf
sysbench 1.0.20 (unter Verwendung des Systems LuaJIT 2.1.0-beta3)

Führen Sie den Test mit folgenden Optionen aus:
Anzahl der Threads: 1
Initialisierung des Zufallszahlengenerators ab der aktuellen Zeit
Primzahllimit: 10000
Arbeitsthreads werden initialisiert...
Threads gestartet!
CPU-Geschwindigkeit:
Ereignisse pro Sekunde: 1471,46
Allgemeine Statistiken:
Gesamtzeit: 10,0005s
Gesamtzahl der Ereignisse: 14722
Latenz (ms):
minus: 0,67
Durchschnitt: 0,68
max: 1,14
95. Perzentil: 0,68
Summe: 9994,77
Thread-Fairness:
Ereignisse (Durchschnitt/Standarddev): 14722,0000/0,00
Ausführungszeit (Durchschnitt/StdDev): 9,9948/0,00

Habe das Treffen mit 7z abgeschlossen.

(7z ist ein Dateikomprimierungsprogramm und -format, ähnlich wie ZIP, das eine hohe Komprimierungsrate bietet und Open Source ist. Es verfügt aber auch über eine Benchmark-Option.)

Um einen Single-Thread-Benchmark auszuführen, müssen Sie den folgenden Befehl ausführen

7z b -mmt1

Für einen Multi-Thread-Benchmark-Test kann die letzte Option weggelassen werden

7z b

RPi5 mit dem Befehl „7z b -mmt1“

7-Zip [64] 16.02: Copyright (c) 1999-2016 Igor Pavlov: 21.05.2016
p7zip Version 16.02 (locale=en_GB.UTF-8,Utf16=on,HugeFiles=on,64 Bits,4 CPUs LE)
LE
CPU-Frequenz: - - - - - - - - -
RAM-Größe: 8049 MB, Anzahl CPU-Hardware-Threads: 4
RAM-Nutzung: 435 MB, # Benchmark-Threads: 1
Komprimieren | Dekomprimieren
Dict Geschwindigkeitsnutzung R/U-Bewertung | Geschwindigkeitsnutzungs-R/U-Bewertung
KiB/s % MIPS MIPS | KiB/s % MIPS MIPS
22: 2955 100 2876 2875 | 39071 100 3339 3336
23: 2825 100 2879 2879 | 38558 100 3338 3338
24: 2728 100 2934 2933 | 37821 100 3321 3320
25: 2649 100 3026 3025 | 36791 100 3276 3275
---------------------------------- | -------------
Avr: 100 2929 2928 | 100 3318 3317
An: 100 3124 3123

RPi5 mit Befehl „7z b“

7-Zip [64] 16.02: Copyright (c) 1999-2016 Igor Pavlov: 21.05.2016
p7zip Version 16.02 (locale=en_GB.UTF-8,Utf16=on,HugeFiles=on,64 Bits,4 CPUs LE)
LE
CPU-Frequenz: - - - - - - 512000000 - -
RAM-Größe: 8049 MB, Anzahl CPU-Hardware-Threads: 4
RAM-Nutzung: 882 MB, # Benchmark-Threads: 4
Komprimieren | Dekomprimieren
Dict Geschwindigkeitsnutzung R/U-Bewertung | Geschwindigkeitsnutzungs-R/U-Bewertung
KiB/s % MIPS MIPS | KiB/s % MIPS MIPS
22: 9384 381 2396 9129 | 152484 399 3262 13009
23: 8784 384 2328 8950 | 148477 398 3226 12847
24: 8440 378 2403 9075 | 144927 398 3194 12723
25: 8088 374 2469 9235 | 141389 399 3152 12583
---------------------------------- | -------------
Avr: 379 2399 9098 | 399 3209 12791
An: 389 2804 10944

RPI4 mit dem Befehl „7z b -mmt1“

7-Zip [64] 16.02: Copyright (c) 1999-2016 Igor Pavlov: 21.05.2016
p7zip Version 16.02 (locale=en_GB.UTF-8,Utf16=on,HugeFiles=on,64 Bits,4 CPUs LE)
LE
CPU-Frequenz: - - - - - - - - -
RAM-Größe: 3792 MB, Anzahl CPU-Hardware-Threads: 4
RAM-Nutzung: 435 MB, # Benchmark-Threads: 1
Komprimieren | Dekomprimieren
Dict Geschwindigkeitsnutzung R/U-Bewertung | Geschwindigkeitsnutzungs-R/U-Bewertung
KiB/s % MIPS MIPS | KiB/s % MIPS MIPS
22: 1433 100 1395 1394 | 18991 100 1622 1622
23: 1358 100 1384 1384 | 18713 100 1620 1620
24: 1277 100 1374 1374 | 18402 100 1616 1616
25: 1199 100 1370 1370 | 17953 100 1598 1598
---------------------------------- | -------------
Avr: 100 1381 1380 | 100 1614 1614
An: 100 1497 1497

RPi4 mit dem Befehl „7z b“

7-Zip [64] 16.02: Copyright (c) 1999-2016 Igor Pavlov: 21.05.2016
p7zip Version 16.02 (locale=en_GB.UTF-8,Utf16=on,HugeFiles=on,64 Bits,4 CPUs LE)
LE
CPU-Frequenz: 64000000 64000000 - - - - - - -
RAM-Größe: 3792 MB, Anzahl CPU-Hardware-Threads: 4
RAM-Nutzung: 882 MB, # Benchmark-Threads: 4
Komprimieren | Dekomprimieren
Dict Geschwindigkeitsnutzung R/U-Bewertung | Geschwindigkeitsnutzungs-R/U-Bewertung
KiB/s % MIPS MIPS | KiB/s % MIPS MIPS
22: 3868 338 1114 3764 | 73832 399 1578 6299
23: 3734 355 1073 3805 | 72478 399 1572 6271
24: 3597 363 1065 3868 | 71181 399 1565 6249
25: 3481 368 1081 3975 | 69457 399 1548 6182
---------------------------------- | -------------
Avr: 356 1083 3853 | 399 1566 6250
An: 377 1325 5052

Ein weiteres ungetestetes Tool ist stress-ng

CPU-Fazit

Sysbench

RPi4

RPi5

Prozentsatz

Ereignisse/Sek

1471

2730

185 %

7z

RPi4

RPi5

Prozentsatz

Einzel

1497

3123

208 %

Multi

5052

10944

216 %

In manchen Fällen ist die CPU doppelt so schnell.

GPU

Für die Geschwindigkeit des Grafikprozessors haben wir die folgenden Tools verwendet:

Glmark2

Und

Vkmark

Das Geekbench-Tool hat einen Kompilierungsfehler erhalten und wir konnten es noch nicht testen.

Wir waren auch neugierig auf den Unterschied zwischen der Anzahl der Bilder pro Sekunde von quake2.

Allerdings produzierte die Vulkanversion seltsame Artefakte und auch dieser Test wird weiterverfolgt.

Es gibt keine Hardware-Codec-Beschleunigung, nur HEVC-Dekodierung.
(H265-Hardware-Dekodierung bei 4k60 und VC1-Hardware-Dekodierung)

RPi5

[build] use-vbo=false

1041

0,961

[build] use-vbo=true

1196

0,836

[Textur] Texturfilter = am nächsten

1073

0,932

[Textur] Texturfilter=linear

1069

0,936

[texture] texturfilter=mipmap

1079

0,927

[Schattierung] Schattierung=Gouraud

1089

0,918

[shading] shading=blinn-phong-inf

1109

0,902

[Schattierung] Schattierung=phong

1054

0,949

[Schattierung] Schattierung=Zelle

1055

0,948

[bump] Bump-Render=High-Poly

783

1.278

[bump] Bump render=normals

1150

0,870

[bump] Bump render=height

1111

0,900

[effect2d] kernel=0,1,0;1,-4,1;0,1,0;

693

1.445

[effect2d] kernel=1,1,1,1,1;1,1,1,1,1;1,1,1,1,1;

363

2.760

[pulsar] light=false:quads=5:texture=false

1235

0,810

[desktop] Blur-Radius=5:Effekt=Blur:Passes=1:Separable=True:Windows=4

284

3.521

[Desktop] effect=shadow:windows=4

1041

0,961

[Puffer] iinterleave=false:update-dispersion=0.9:update-fraction=0.5:update-method=map

491

2.039

[Puffer] interleave=false:update-dispersion=0.9:update-fraction=0.5:update-method=subdata

456

2.195

[Puffer] interleave=true:update-dispersion=0.9:update-fraction=0.5:update-method=map

527

1.901

[Ideen] Geschwindigkeit=Dauer

1103

0,907

[Quallen]

891

1.123

[Gelände]

67

14.994

[Schatten]

157

6.386

[brechen]

72

14.072

[Bedingungen] fragment-steps=0:vertex-steps=0

1268

0,789

[Bedingungen] fragment-steps=5:vertex-steps=0

1238

0,808

[Bedingungen] fragment-steps=0:vertex-steps=5

1267

0,789

[Funktion] fragment-complexity=low:fragment-steps=5

1262

0,793

[Funktion] fragment-complexity=medium:fragment-steps=5

1100

0,910

[loop] fragment-loop=false:fragment-steps=5:vertex-steps=5

1255

0,797

[Schleife] fragment-steps=5:fragment-uniform=false:vertex-steps=5

1260

0,794

[Schleife] fragment-steps=5:fragment-uniform=true:vertex-steps=5

1107

0,904

RPi4

[build] use-vbo=false

559

1.792

Erfolg

[build] use-vbo=true

682

1.467

Erfolg

[Textur] Texturfilter = am nächsten

603

1.659

Erfolg

[Textur] Texturfilter=linear

559

1.792

Erfolg

[texture] texturfilter=mipmap

574

1.743

Erfolg

[Schattierung] Schattierung=Gouraud

620

1.614

Erfolg

[shading] shading=blinn-phong-inf

537

1.864

Erfolg

[Schattierung] Schattierung=phong

452

2.215

Erfolg

[Schattierung] Schattierung=Zelle

436

2.295

Erfolg

[bump] Bump-Render=High-Poly

391

2.563

Erfolg

[bump] Bump render=normals

611

1.638

Erfolg

[bump] Bump render=height

543

1.843

Erfolg

[effect2d] kernel=0,1,0;1,-4,1;0,1,0;

317

3.157

Erfolg

[effect2d] kernel=1,1,1,1,1;1,1,1,1,1;1,1,1,1,1;

168

5.961

Erfolg

[pulsar] light=false:quads=5:texture=false

648

1.545

Erfolg

[desktop] Blur-Radius=5:Effekt=Blur:Passes=1:Separable=True:Windows=4

111

9.081

Erfolg

[Desktop] effect=shadow:windows=4

443

2.261

Erfolg

[Puffer] interleave=false:update-dispersion=0.9:update-fraction=0.5:update-method=map

171

5.873

Erfolg

[buffer]interleave=false:update-dispersion=0.9:update-fraction=0.5:update-method=subdata

178

5.628

Erfolg

[buffer]iinterleave=true:update-dispersion=0.9:update-fraction=0.5:update-method=map

219

4.582

Erfolg

[Ideen] Geschwindigkeit=Dauer

556

1.800

Erfolg

[Quallen]

333

3.005

Erfolg

[Gelände]

24

42.579

Erfolg

[Schatten]

92

10.888

Erfolg

[brechen]

33

31.110

Erfolg

[Bedingungen] fragment-steps=0:vertex-steps=0

696

1.438

Erfolg

[Bedingungen] fragment-steps=5:vertex-steps=0

456

2.194

Erfolg

[Bedingungen] fragment-steps=0:vertex-steps=5

678

1.476

Erfolg

[Funktion] fragment-complexity=low:fragment-steps=5

582

1.718

Erfolg

[Funktion] fragment-complexity=medium:fragment-steps=5

412

2.431

Erfolg

[loop] fragment-loop=false:fragment-steps=5:vertex-steps=5

567

1.765

Erfolg

[Schleife] fragment-steps=5:fragment-uniform=false:vertex-steps=5

567

1.765

Erfolg

[Schleife] fragment-steps=5:fragment-uniform=true:vertex-steps=5

398

2.515

Erfolg

GPU-Fazit


Rpi4

Rpi5

Prozentsatz

glmark2

429

906

211 %

Die Vulkan-Variante war sogar noch schneller als der glmark2

Vulkan-Score-Durchschnitt im Internet gefunden 77 (glmark2) im Vergleich zu Vulkan (188)

Nachfolgend finden Sie die Temperatur eines RPi5 nach 5-minütiger Wiedergabe eines 4K-Videos.
(Verschiebliches Wärmebild und Foto der Himbeere sind auf die Doppelkamera des Flir-Moduls zurückzuführen)

Speicher (IO)

Um die E/A-Geschwindigkeit des Speichers zu messen, haben wir die folgenden Tools verwendet.

Hdparm, dd, iozone3

Weitere Tools sind Bonnie und fio

Wir haben uns Folgendes angeschaut:

  • Lese-/Schreibaktionen auf der SD-Karte
  • Lese-/Schreibaktionen auf SSD über USB2-Schnittstelle
  • Lese-/Schreibaktionen auf SSD über USB3-Schnittstelle

Die SSD-Messungen wurden durchgeführt, indem ein USB3-zu-SATA-Adapter verwendet und an die USB-Anschlüsse des Raspberry angeschlossen wurde.

Es muss gesagt werden, dass das schnellste IO in einer Nvme-Lösung oder über das PCIe des RPi5 gesucht werden sollte. (Dies ist auf dem RPi4 nicht vorhanden)

Nachteile der SD-Karte, obwohl vieles verbessert wurde. Viele Schreibaktionen können bei älteren Karten zu Problemen führen.
Eine Lösung hierfür könnte sein: Deaktivieren der Protokollierung, Schreiben von Aktionen auf eine zweite externe Festplatte wie einen USB-Stick oder eine SSD.

Eine SD-Karte ist außerdem langsamer, weil:

  • Sequentielles Schreiben
  • Eingeschränktes Caching
  • Zersplitterung

Eine bessere Lösung besteht darin, eine SSD über eine SSD-zu-USB-Schnittstelle anzuschließen.

Nachteile einer SSD

  • Hierfür benötigen Sie eine SATA-zu-USB3-Schnittstelle oder ein SSD-Gehäuse mit integriertem USB-Konverter.
  • Aus den oben genannten Gründen teurer
  • Seien Sie vorsichtig mit TLC und QLC, sie werden langsamer, wenn die Festplatte voll ist.

Eine NVMe-Lösung ist am schnellsten, ein USB-Thumbdrive liegt irgendwo zwischen einer SD-Karte und einer SSD.

Am Ende dieses Dokuments finden Sie die ausführlichen Iozonendiagramme.

Einige Treffen

(IOPS steht für „Input/Output Operations Per Second“).

 

RPi4 NVME – Durchschnitt – 239 MB/s – 19.000 IOPS RPi5 NVME – Durchschnitt – 333 MB/s – 22.200 IOPS RPi4 SSD – Durchschnitt – 190 MB/s – 13.300 IOPS RPi5 SSD – Durchschnitt – 254 MB/s – 18.000 IOPS RPi4 SD-Karte – g - 27 MB/s - 3500 IOPS LESEN! 900 IOPS SCHREIBEN RPi5 SD-Karte – Durchschnitt – 41 MB/s – 4000 IOPS LESEN! SCHREIBEN 1000 IOPS

  Systemstartzeit vom Einschalten bis zum Öffnen des Desktops.
Diese Zeiten gelten mit SD-Karte, SSD ist schneller

RPI4 – durchschnittlich 35 Sek. RPI5 – durchschnittlich 17 Sek

  Durchsatzmessung mit DD

Der folgende Befehl wurde für Folgendes verwendet.

dd if=/dev/zero of=zerodatafile bs=1G count=1 conv=fdatasync

(Hinweis: Verwendet fdatasync, um sicherzustellen, dass der Schreibvorgang wartet, bis der Cache geleert ist und sich alles im Speicher befindet!)

RPi5 SD-Karte: 1073741824 Bytes (1,1 GB, 1,0 GiB) kopiert, 37,6299 s, 28,5 MB/s SSD – USB2: 1073741824 Bytes (1,1 GB, 1,0 GiB) kopiert, 40,0703 s, 26,8 MB/s SSD – USB3: 1073 741824 Bytes (1,1 GB, 1,0 GIB) KOPIERT, 3,94715 S, 272 MB/S RPI4 SDCARD: 1073741824 Bytes (1,1 GB, 1,0 GIB) KOPIERT, 51,6502 S, 20,8 MB/S SSD – USB 2: 1073741824 BYBETTA kopiert, 39.2004. s, 27.4 MB/s SSD – USB 3: 1073741824 Bytes (1,1 GB, 1,0 GiB) kopiert, 6,56438 s, 164 MB/s

Wie man sieht, können wir einige Dinge daraus schließen:

Die Geschwindigkeit der SD-Karte ist beim RPi5 etwas höher, über USB2 spielt das keine so große Rolle.

Allerdings ist die Ansprache der SSD über USB3 mehr als 1,5x schneller!

RPi4

RPi5

Prozentsatz

SD-Karte

20.8

28.5

137 %

USB2

27.4

26.8

98 %

usb3

164

272

166 %

RPi4 – Lesen – SSD

RPi4 – Schreiben – SSD

RPi5 – Lesen – SSD

RPi5 – Schreiben – SSD

Netzwerktreffen

Verwendete Tools: iperf3

Befehlsserver:
iperf3 -s

Client-Befehl:
iperf3 -c

Dieses Treffen misst ohne Datenspeicherung, daher hat die Geschwindigkeit der Speicherung keinen Einfluss.
Die Netzwerkdurchsatzgeschwindigkeit war kabelgebunden fast gleich, in beiden Fällen zu einem Remote-Computer ~900 Mbit/s

Die WLAN-Treffen sind unten aufgeführt

WLAN über das RPi5 in angemessener Entfernung vom Access Point.

Download 122 Mbit/s und Upload 200 Mbit/s.

Auf dem RPi4 war der Up- und Download mit 75 Mbit/s gleich

Abschluss

Die Himbeere wurde in vielerlei Hinsicht verbessert.

Die Prozessorgeschwindigkeit, die Grafikverarbeitung, der E/A-Durchsatz und das WLAN sind allesamt schneller als beim Raspberry 4.

Teilweise sogar 2- bis 3-mal schneller