Verlustfreier Komprimierungsalgorithmus und Architektur für reduzierten Speicherbandbreitenbedarf mit verbesserter Vorhersage basierend auf dem Multiple DPCM Golomb-Rice-Algorithmus

Jun 19, 2024

Abstrakt

In einer Computerumgebung erfordern höhere Auflösungen im Allgemeinen mehr Speicherbandbreite, was zwangsläufig zu einem höheren Stromverbrauch führt.

Dies kann für die Gesamtleistung mobiler Geräte und Grafikprozessoreinheiten bei erhöhtem Speicherzugriff und erhöhter Speicherbandbreite von entscheidender Bedeutung sein.

Es besteht eine enge Beziehung zwischen Umwelt und Erinnerung. Die Umgebung, in der Menschen leben und arbeiten, wirkt sich auf die körperliche und geistige Gesundheit sowie die Entwicklung und Leistung des Gedächtnisses aus.

Zunächst einmal kann ein gutes Umfeld die Entwicklung der Denk- und Wahrnehmungsfähigkeiten der Menschen fördern. Die Arbeits- und Lernumgebung sollte ruhig, ordentlich, warm und komfortabel sein, um die Aufmerksamkeit und Konzentration der Menschen effektiv zu verbessern und es ihnen leichter zu machen, sich auf das Denken und Erinnern zu konzentrieren. Wenn die Umgebung laut, chaotisch oder überfüllt ist, wird das menschliche Gehirn gestört, was sich auf die Lern- und Gedächtnisleistung auswirkt.

Zweitens kann ein positives Umfeld die Bildung einer positiven Mentalität und positiver Emotionen fördern. Ein positiver Geisteszustand wird das Bewusstsein und die Wahrnehmung der Menschen effektiv verbessern und die Kreativität und das Gedächtnis der Menschen verbessern. Im Gegenteil: Eine negative und deprimierende Umgebung führt dazu, dass Menschen positive Emotionen und Selbstvertrauen verlieren, was wiederum die Gedächtnisfunktion beeinträchtigt.

Schließlich kann eine sichere und gesunde Umgebung die Gesundheit von Körper und Gehirn der Menschen gewährleisten und dadurch das Gedächtnis effektiv verbessern. Körper und Geist brauchen ausreichend Ruhe und Bewegung, um besser Energie zu liefern und die Gedächtnisfunktion zu unterstützen. Gleichzeitig wirken sich Schadstoffe und Giftstoffe in der Umwelt direkt auf die körperliche und geistige Gesundheit der Menschen aus und beschleunigen den Gedächtnisverlust.

Kurz gesagt, eine gute Umgebung ist eine wichtige Voraussetzung für die Entwicklung unseres Gedächtnisses. Eine angepasste Lern- und Arbeitsumgebung, eine positive und gesunde Mentalität und Emotionen sowie ein gesundes und sicheres Lebensumfeld können die Entwicklung und Verbesserung des Gedächtnisses der Menschen aktiv fördern. Es ist ersichtlich, dass wir das Gedächtnis verbessern müssen, und Cistanche kann das Gedächtnis erheblich verbessern, da Cistanche auch das Gleichgewicht von Neurotransmittern regulieren kann, beispielsweise durch die Erhöhung des Acetylcholinspiegels und der Wachstumsfaktoren, die für das Gedächtnis und das Lernen sehr wichtig sind. Darüber hinaus kann Cistanche auch die Durchblutung verbessern und die Sauerstoffversorgung fördern, wodurch sichergestellt werden kann, dass das Gehirn ausreichend Nährstoffe und Energie erhält, wodurch die Vitalität und Ausdauer des Gehirns verbessert werden.

increase brain power

Klicken Sie auf Möglichkeiten zur Verbesserung der Gehirnfunktion

In diesem Artikel wird ein verlustfreier Komprimierungsalgorithmus mit einem Golomb-Rice-Code mit variablem Vorzeichen und mehrfacher differenzieller Pulscodemodulation vorgeschlagen, um den Speicherbandbreitenbedarf zu reduzieren. Die Effizienz der vorgeschlagenen multiplen differenziellen Pulscodemodulation wird durch die Auswahl des optimalen differenziellen Pulscodemodulationsmodus erhöht.

Die experimentellen Ergebnisse zeigen ein Komprimierungsverhältnis von 1,99 für Bildsequenzen mit hocheffizienter Videokodierung und dass die vorgeschlagene verlustfreie Komprimierungshardware den Busbandbreitenbedarf reduzieren kann.

Schlüsselwörter: Verlustfreie Bildkomprimierung, Hardwarearchitektur, Reduzierung der Speicherbandbreite.

1 Einleitung

Da die Auflösung der neuesten Mobilgeräte und Grafikprozessoreinheiten (GPUs) schnell zunimmt, erhöht sich auch die Speicherbandbreite, die für den Zugriff auf die im Bildpuffer gespeicherten Bilder erforderlich ist.

Dieser erhöhte Speicherzugriff beeinflusst die Gesamtleistung und den Stromverbrauch [1, 2, 9–11], ebenso wie die Speicherbandbreitennutzung [3, 12]. Zu diesem Zweck könnten verlustfreie Framebuffer-Komprimierung und Methoden zur Reduzierung der Speicherbandbreite wirksame Möglichkeiten sein, einen Hochleistungsbus als IP auszustatten.

Zu diesem Zweck wurden viele Studien durchgeführt [4–6]; der verlustfreie Komprimierungsalgorithmus mit differenzieller Pulscodemodulation und Golomb-Rice-Kodierung (DDPCM-GR), der verlustfreie Hochdurchsatz-Bildkomprimierungsalgorithmus mit differenzieller Pulscodemodulation und variabler Vorzeichencode-GR-Kodierung (DPCM-VSC GR) und der Rekomprimierungsalgorithmus mit multiplem DPCM-Modus-Durchschnitt Semi-Fixed-Length-Coding (MDA-SFL) wurde in [4, 5] bzw. [6] vorgeschlagen.

In diesem Artikel wird ein verlustfreier Komprimierungsalgorithmus mit einem Multiple-DPCM-(MDPCM)-Variablenzeichencode GR vorgeschlagen, um den Speicherbandbreitenbedarf zu reduzieren. Der Algorithmus verwendet MDPCM zur Vorhersage und Variable Signcode (VSC) GR zur Entropiecodierung [5]. Die Struktur des Papiers ist wie folgt. Abschnitt 2 gibt einen Überblick über frühere Studien zum Thema dieser Arbeit.

Abschnitt 3 stellt den vorgeschlagenen MDPCM-GR-Algorithmus vor. Abschnitt 4 stellt die vorgeschlagene Hardwarearchitektur für verlustfreie Komprimierung vor. Abschnitt 5 präsentiert die vorgeschlagenen Ergebnisse der Algorithmus- und Hardware-Leistungsüberprüfung. Die Schlussfolgerung findet sich in Abschnitt 6.

2 Hintergrund

In diesem Abschnitt überprüfen wir Arbeiten im Zusammenhang mit unserem vorgeschlagenen Algorithmus und unserer Hardwarearchitektur. Alle eingeschlossenen Studien legen nahe, dass sie die Leistung basierend auf dem DPCM-Algorithmus verbessert haben.

2.1 DPCM-Algorithmus

DPCM [7] ist ein weit verbreiteter Algorithmus zur reversiblen Datenkomprimierung. Es besteht aus der Vorhersagephase und der Entropiekodierung der Vorhersagefehlerergebnisse. Die Größe der Eingabepixeldaten kann mithilfe der räumlichen Lokalitätseigenschaften des Bildes reduziert werden.

DDPCM [8] ist der von ATI vorgeschlagene Algorithmus zur Reduzierung der Größe von Z-Daten in 3D-Grafiken durch Verbesserung des DPCM. Der DDPCM-Algorithmus berechnet die Differenzwerte für die X- und Y-Achsenrichtungen basierend auf den Ergebnissen des DPCM-Algorithmus.

improve your memory

2.2 DDPCM-GR

DDPCM-GR [4] ist der verlustfreie Komprimierungsalgorithmus, der DDPCM als Vorhersagefunktion und GR-Kodierung für die Entropiekodierung für „fixed-k“ ausführt, wobei k 2 ist. Für den Verarbeitungsblock im Originalbild wird DDPCM angewendet.

Für die Fehlerdaten von DDPCM wird eine GR-Kodierung durchgeführt. Die GR-Kodierung ist eine Entropiekodierungsmethode, die eine unäre Kodierung auf den Quotienten q anwendet, wobei der Eingabewert N durch den Parameter M dividiert wird und der Rest als Binärdaten gespeichert wird.

2.3 DPCM-VSC GR

DPCM-VSC GR [5] ist der Komprimierungsalgorithmus mit hohem Durchsatz, der DPCM als Vorhersagefunktion und VSC GR-Kodierung für die Entropiekodierung ausführt. Für den Verarbeitungsblock im Originalbild wird 2D-DPCM angewendet.

Der Quotientenwert wird berechnet, indem der resultierende Wert von DPCM durch den Wert $ 2 ∧ k $ dividiert wird, wobei k=0, 1, 2, 3. VSC-Werte und unäre Codewerte werden durch GR-Codierung und VSC erhalten.

Nachdem alle Schritte abgeschlossen sind, werden die Längen der komprimierten Daten und des Originalblocks verglichen. Wenn die Länge der Komprimierungsdaten kleiner als die Länge des Originalblocks ist, werden komprimierte Daten durch Packen aller zugehörigen Daten generiert.

Die zugehörigen Daten bestehen aus dem K-Wert, dem DPCM-Moduswert, dem Wert des ersten Faktors, dem verbleibenden Wert, dem unären Datenwert und den variablen Daten für ein Vorzeichen. Wenn der ursprüngliche Block länger ist als die komprimierten Daten, werden die komprimierten Daten nicht verwendet und der ursprüngliche Block bleibt erhalten.

3 Vorgeschlagener Algorithmus zur verlustfreien Komprimierung

In diesem Abschnitt wird der Ausführungsablauf des vorgeschlagenen Mehrfach-DPCMGR-Algorithmus (MDPCM-GR) für die Komprimierung und Dekomprimierung vorgestellt.

3.1 Gesamtprozess des vorgeschlagenen Komprimierungs- und Dekomprimierungsalgorithmus

Der vorgeschlagene MDPCM-GR-Algorithmus besteht aus einem Kompressor, der die Originaldaten komprimiert, und einem Dekompressor, der die komprimierten Daten wiederherstellt. Der Komprimierungsvorgang läuft wie folgt ab.

Zunächst wird MDPCM auf der Grundlage der ursprünglichen Blockdaten ausgeführt. Anschließend wird aus den berechneten DPCM-Kosten der DPCM-Modus mit den niedrigsten Kosten ausgewählt. Schließlich wird die VSC GR [5]-Kodierung auf die Fehlerwerte von MDPCM angewendet. Die Dekomprimierung folgt dem umgekehrten Prozess der Komprimierung. Abbildung 1 zeigt Diagramme dieser Prozesse.

3.2 Mehrfacher DPCM-Algorithmus

Der vorgeschlagene MDPCM-Algorithmus kann einen DPCM-Modus mit minimalen Kosten auswählen, indem er vier verschiedene gerichtete DPCMs durchführt; wie horizontales und vertikales DPCM und DDPCM.

boost memory

Das vorgeschlagene MDPCM verwendet vertikales und horizontales DDPCM, die jeweils auf der Grundlage von vertikalem und horizontalem DPCM durchgeführt werden. Bei der Durchführung von DDPCM wird die optimale Vorhersagefunktion als Vorhersagefunktionsergebnis ausgewählt und die Entropiekodierungskosten für das Vorhersagefunktionsergebnis werden basierend auf der Summe der Absolutwerte der DPCM-Ergebnisse berechnet.

Die Vorteile des vorgeschlagenen MDPCM sind wie folgt. Da DPCM und DDPCM sowohl horizontal als auch vertikal angewendet werden, wird sie erstens für Bilder vorhergesagt, die sowohl horizontale als auch vertikale räumliche Lokalitäten aufweisen.

Zweitens wird die DDPCM, die eine zusätzliche DPCM ausführt, auf den vorgeschlagenen Algorithmus angewendet und für Bilder mit schnellen Pixelunterschieden vorhergesagt. Schließlich beträgt der Overhead für die Anwendung von MDPCM nur 2 Bit, was sehr gering ist.

4 Vorgeschlagene Hardware-Architektur für verlustfreie Komprimierung

In diesem Abschnitt wird die vorgeschlagene Hardwarearchitektur für die verlustfreie Komprimierung vorgestellt und jedes Modul der Konfiguration und sein Betriebsablauf im Detail beschrieben.

4.1 Gesamthardwarearchitektur der vorgeschlagenen verlustfreien Komprimierung

Wie in Abbildung 2 dargestellt, besteht die vorgeschlagene Hardwarearchitektur für die verlustfreie Komprimierung aus den folgenden Einheiten: einer MDPCM-Einheit für die MDPCM-Ausführung; einer Vorzeichenkonvertereinheit zum Konvertieren eines negativen Werts aus den DPCM-Ergebnissen in einen positiven Wert; eine Datenverpackungseinheit zum Packen komprimierter Daten; parallelVSC-Kodierungseinheit; eine K-Splittereinheit; eine Kostenberechnungseinheit für das Ergebnis der Division von K-Werten; und eine parallele GR-Encodereinheit für die parallele GR-Codierung.

10 ways to improve memory

4.2 Gesamthardwarearchitektur der vorgeschlagenen verlustfreien Dekomprimierung

Abbildung 3 zeigt die gesamte vorgeschlagene Hardwarearchitektur für die verlustfreie Dekomprimierung, die aus den folgenden Einheiten besteht: einer parallelen InvMDPCM-Einheit zur Durchführung von parallelem inversem MDPCM; eine Vorzeichenumwandlungseinheit zur Vorzeichenumwandlung anhand von Vorzeichendaten und Größendaten; eine parallele GR-Decodereinheit zur parallelen GR-Decodierung; eine Nulldetektoreinheit, um zu prüfen, ob der DPCMerror-Wert 0 ist; eine parallele VSC-Dekodiereinheit zum parallelen Durchführen einer VSC-Dekodierung; eine Datenentpackeinheit, die die komprimierten Daten dekomprimiert; und eine variable unäre/VSC-Splittereinheit, die VSC- und unäre Daten aufteilt. Die Hardware der vorgeschlagenen verlustfreien Dekomprimierung wird wie folgt durchgeführt.

Um die komprimierten Daten zu dekomprimieren, entpackt die Datenentpackeinheit zunächst die Eingabedaten. Die von der Entpackeinheit empfangenen ungeteilten unären VSC-Daten werden in der unären VSC-Splittereinheit in unäre Daten und VSC-Daten aufgeteilt.

Die gespaltenen unären Daten werden an die parallele GR-Dekodiereinheit und die Nulldetektoreinheit übertragen, während gespaltene VSC-Daten an die parallele VSC-Dekodiereinheit übertragen werden.

Die Nulldetektoreinheit prüft anhand der unären Daten und der Restdaten, ob der DPCM-Fehlerwert Null ist. Das Nullerkennungsergebnis wird an das parallele VSC-Decodergerät geliefert, das die vorzeichenbehafteten Daten anhand des empfangenen Nullerkennungsergebnisses rekonstruiert und den VSC decodiert. Die unären Daten werden parallel von der parallelen GR-Decodereinheit decodiert, um die Quotientendaten wiederherzustellen.

Die Größendaten werden basierend auf den gespeicherten Quotientendaten und den Restdaten wiederhergestellt. Wenn die Vorzeichen- und Magnitudendaten wiederhergestellt sind, rekonstruiert die Vorzeichenkonvertereinheit den DPCM-Fehlerwert. Schließlich arbeitet die parallele InvMDPCM-Einheit parallel zum DPCM-Modus basierend auf Seed- und DPCM-Fehlerwerten, um die Pixeldaten zu rekonstruieren.

short term memory how to improve

5 Experimentelle Ergebnisse

In diesem Abschnitt werden die Simulationsergebnisse des vorgeschlagenen Algorithmus und der Hardwarearchitektur zusammengefasst. Die Leistung wird anhand der Komprimierungsrate des Algorithmus und der Busbandbreite in der Hardwarestruktur gemessen.

5.1 Kompressionsverhältnis

In diesem Artikel messen wir das Komprimierungsverhältnis (CR) komprimierter Bilder, um die Effizienz des verlustfreien Komprimierungsalgorithmus zu überprüfen. CR bezieht sich auf die komprimierte Bildgröße pro Originalbildgröße. Je höher die CR, desto effizienter ist der Komprimierungsalgorithmus. Die Gleichung für die CR lautet wie folgt.

CR =OriginalbildgrößeKomprimierte Bildgröße(3)

improving brain function

Sieben Bildsequenzen der Klassen A und B von Benchmarks für hocheffiziente Videokodierung (HEVC) wurden verwendet, um CR-Messungen im vorgeschlagenen verlustfreien Komprimierungsalgorithmus und in der Hardwarearchitektur zu erhalten.

Der vorgeschlagene verlustfreie Komprimierungsalgorithmus wurde mit den in [4, 5] und [6] entwickelten verglichen. Tabelle 1 zeigt die durchschnittliche CR des vorgeschlagenen Algorithmus und von [4, 5] und [6] für alle Frames der HEVC-Bildsequenzen .

Die experimentellen Ergebnisse für die HEVC-Bildsequenzen zeigen, dass die durchschnittlichen CR-Werte für den vorgeschlagenen verlustfreien Komprimierungsalgorithmus [4, 5] bzw. [6] 1,99, 1,63, 1,92 und 1,91 betragen.

Der vorgeschlagene verlustfreie Komprimierungsalgorithmus erreicht eine höhere CR in allen HEVC-Bildsequenzen als die anderen Algorithmen. Der vorgeschlagene MDPCM-Algorithmus erfordert einen 2-Bit-Overhead zum Speichern von DPCM-Modusinformationen. Wie aus den experimentellen Ergebnissen in Tabelle 1 hervorgeht, ist klar, dass die erhöhte Komprimierungsrate der Vorhersagefunktionsergebnisse des vorgeschlagenen MDPCM-Algorithmus ausreicht, um die Overhead-Anforderung zu erfüllen.

ways to improve memory

5.2 Leistungsanalyse für Busbandbreite

Der CR des vorgeschlagenen Komprimierungsalgorithmus kann durch die Busbandbreite begrenzt sein, da die über den Bus übertragenen Daten an seine Breite angepasst werden sollten. Daher können die über den Bus übertragenen Daten den CR um so viel verlieren, wie die Bandbreite der ausgerichteten Daten.

Um dies zu analysieren, haben wir die tatsächliche durchschnittliche CR der Verkehrsszene mit fünf verschiedenen Busbandbreiten von 8, 16, 32, 64 und 128 Bit gemessen. Abbildung 4 zeigt die experimentellen Ergebnisse der tatsächlichen CRs.

Hier ist der tatsächliche CR auf eine Busbreite von 128-Bit begrenzt, die gängigste Bandbreite. Der tatsächliche CR auf der 8--Bit-Busbreite ähnelt jedoch dem Idealfall des 1--Bitons, was bedeutet, dass die Leistung der vorgeschlagenen verlustfreien Komprimierungshardware auf dem 8--Bit gut ist Busbandbreite. Folglich kann die vorgeschlagene verlustfreie Komprimierungshardware die Anforderungen an die Busbandbreite reduzieren.

memory enhancement

6 Fazit

In diesem Artikel werden ein verlustfreier Komprimierungsalgorithmus und eine Hardwarearchitektur vorgeschlagen, um die Anforderungen an die Speicherbandbreite zu reduzieren. Die vorgeschlagene Hardwarearchitektur weist eine hohe Verarbeitungsgeschwindigkeit auf, da die Komprimierungs- und Dekomprimierungsschritte parallel durchgeführt werden können.

Darüber hinaus wurde eine hohe CR durch die Verbesserung der Vorhersagefunktion des vorhandenen Algorithmus erreicht. Die Vorhersagefunktion weist außerdem eine verbesserte Leistung auf, was die Vorteile von DPCM und DDPCM widerspiegelt. Wir haben die HEVC-Bildsequenz als Benchmark verwendet, um die Leistung des vorgeschlagenen Algorithmus und der Hardwarearchitektur zu überprüfen.

Als Ergebnis des Experiments erreichten wir eine durchschnittliche CR von 1,99 in den Klassen A und B der HEVC-Bildsequenz. Dadurch wurde verifiziert, dass die vorgeschlagene verlustfreie Komprimierungsarchitektur eine höhere CR als die Vergleichsalgorithmen erreicht. Da der Algorithmus dieser Studie außerdem eine hohe CR erreicht, kann die vorgeschlagene verlustfreie Komprimierungshardware die Anforderungen an die Busbandbreite reduzieren.

Somit eignet sich die vorgeschlagene verlustfreie Komprimierungshardware für Anwendungen, die eine hohe Speicherbandbreite und einen hohen Speicherzugriff erfordern, wie etwa GPUs und hochauflösende Videoprozessoren.

Anerkennung

Diese Forschung wurde teilweise vom MOTIE (Ministry of Trade, Industry & Energy) (10080568, Development of the Embedded GP-GPU for Deep Learning based Circumstances Recognition) und dem KSRC (Korea Semiconductor Research Consortium) Unterstützungsprogramm für die Entwicklung des zukünftigen Halbleiterbauelements unterstützt . Das EDA-Tool wurde vom ICDesign Education Center (IDEC), Korea, unterstützt.

supplements to boost memory


Referenzen

[1] D. Burger, JR Goodman, A. Kagi, „Begrenzte Bandbreite zur Beeinflussung des Prozessordesigns“, IEEE Micro, vol. 17, nein. 6, S. 55–62, November 1997.

[2] H. David, E. Gorbatov, UR Hanebutte, R. Khanna, C. Le, „RAPL: Speicherleistungsschätzung und -begrenzung“, 2010 ACM/IEEE International Symposium on Low-Power Electronics and Design (ISLPED), S. 189–194, August 2010.

[3] ARM Mali GPU OpenGL ES-Anwendungsoptimierungshandbuch, verfügbar unter.https://developer.arm.com/docs/dui0555/b/optimization-checklist/the-checklist/reduce-memory-bandwidth-usage

[4] H.-S. Kim, J.-H. Lee, H.-J. Kim, S.-H. Kang, W.-C. Park, „Eine verlustfreie Farbbildkomprimierungsarchitektur mit einem parallelen Golomb-RiceHardware-Codec“, IEEE Transactions on Circuits and Systems for VideoTechnology, vol. 21, Nr. 11, S. 1581–1587, November 2011.

[5] J. Lee, J. Yun, J. Lee, I. Hwang, D. Hong, Y. Kim, CG Kim, W.-C. Park, „Ein effektiver Algorithmus und eine effektive Architektur für die verlustfreie Komprimierung hochauflösender Bilder mit hohem Durchsatz“, IEEEAccess, Bd. 7, Ausgabe 1, S. 138803–138815. September 2019.

[6] L. Guo, D. Zhou, S. Goto, „Ein neuer Referenzrahmen-Rekompressionsalgorithmus und seine VLSI-Architektur für UHD-TV-Videocodec“, IEEETransactions on Multimedia, vol. 16, S. 2323–2332, Dez. 2014.

[7] AD Mitra, PK Srimani, „Differential Pulse-Code Modulation“, Int. J.Electron., vol. 46, S. 633–637, Juni 1972.

[8] S. Morein, „ATI Radeon Hyper Technology“, In Proceedings of the Graphics Hardware, 2000.

[9] D. Silveira, G. Povala, L. Amaral, B. Zatt, L. Agostini, M. Proto, „Effizientes Referenzbildkomprimierungsschema für Videokodierungssysteme: Algorithmus und VLSI-Design“, Journal of Real-Time Image Verarbeitung 16, S. 391–411, 2019.

[10] Yu-Hsuan Lee, Tzu-Chieh Chen, Hsuan-Chi Liang, Jian-Xiang Liao, „Algorithm and Architecture Design of FAST-C Image Corner DetectionEngine“, Very Large Scale Integration (VLSI) System IEEE Transactionon, vol. 29, nein. 4, S. 788–799, 2021.

[11] Sungchul Yoon, Sungho Jun, Yongkwon Cho, Kilwhan Lee, HyukjaeJang, Tae Hee Han, „Optimized Lossless Embedded Compression forMobile Multimedia Applications“, Electronics, vol. 9, S. 868, 2020.

[12] Yu-Hsuan Lee, Cheng-Hung Kuei, Yue-Zhan Kao, Shih-Song Fan Jiang, „Algorithm and VLSI Architecture Designs of A Lossless Embedded Compression Encoder for HD Video Coding Systems“, Journal of Circuits, Systems, and Computers , 2020.


For more information:1950477648nn@gmail.com


Das könnte dir auch gefallen