Inhaltsverzeichnis
Dieses Tutorial befindet sich noch im Aufbau. Mehr zum Projekt auf https://github.com/luxeria/foip
Einführung in die Bildverarbeitung mit GNU Octave
In diesem Artikel sollen die grundlegenden Operationen der Bilderverarbeitung mit Octave zusammengefasst werden.
Installation
Die Installation von GNU Octave erfolgt bei Unixoiden Systemen über den Paketmanager und kann direkt per Kommandozeile erfolgen. Hier das Beispiel für den Paketmanager pacman von Archlinux
sudo pacman -S octave
und aptitude von Ubuntu (Debian)
sudo apt-get install octave
Für die Verwendung vom image
Pakets muss Octave ab Version 4 installiert werden. Für Archlinux gibt es Octave ab Version 4 derzeit nur im AUR
Erweiterungen
Die Instalation von Erweiterungen von Octave kann direkt aus der Kommandozeile von Octave erfolgen. Hierzu kann entweder das gewünschte Softwarepaket manuell lokal heruntergeladen und danach installiert werden oder direkt aus der Datenbank bezogen und installiert werden durch Octave.
pkg install -forge image
Ist eine solche Erweiterung installiert wird diese nicht automatisch geladen wenn eine neue Octave session eröffnet wird, sondern muss manuell geladen werden.
pkg load image
Bei der Verwendung von vielen Erweiterungen können auch sämtliche mit der
Angabe all
geladen werden.
pkg load all
Daten laden und speichern
Einstieg in jegliche Bildverarbeitung ist das Einlesen der Bilddaten und auch deren Speicherung. Im einfachsten Fall kann der Prozess in drei Teile gegliedert werden:
- Originaldatei einlesen
- Manipulation
- Manipulierte Daten ablegen
Graustufenbilder
Diese drei elementaren Schritte sind hier mit den beiden Funktionen
imread()
und imwrite()
des image package ein
einem Pseudobeispiel dargestellt:
I = imread("input_image.png"); % read image J = my_image_processing(I); % manipulate image imwrite(J, "output_image.png"); % write image
Durch die Verwendung von imread()
auf Graustufenbilder wird
die Grafik in eine entsprechende Matrix gespeichert mit den Pixelwerten.
Diese kann per imshow()
betrachtet werden.
RGB Dateien
Beim Einlesen von Graustufenbildern sind die Pixelwerte direkt in einer 2D Matrix ableget. Beim Einlesen von RGB-Bildern wird die Grafik in eine mehrschichtige 2D Matrix ableget, wobei jede Matrix die Pixelwerte für eine Farbe enthält. Die einzelnen Matrizen können wiederum als Graustufenbilder behandelt werden. Im Folgenden wird das Zerlegen eines RGB-Bildes in die einzelnen Farblayer aufgezeigt.
Image = imread("input_rgb_image.png"); % read the RGB image Red = Image(:,:,1); % extract red layer Green = Image(:,:,2); % extract green layer Blue = Image(:,:,3); % extract blue layer
Alternativ kann das GRB Bild auch direkt umgewandelt werden in ein Graustufenbild mittels rgb2gray()
.
ImageRGB = imread("image_rgb.png"); ImageGray = rgb2gray(ImageRGB); imwrite(ImageGray, "image_gray.png");
Beispiel 1
Das folgende Beispiel 1 liest eine RGB Bildatei ein und wandelt diese in ein Graustufenbild um. Die beiden Bilder werden in einem Plot gegenübergestellt und das neu erstellte Graustugenbild gespichert.
ImageOrig = imread(imageSource); % convert the RGB image to a grayscale image ImageGray = rgb2gray(ImageOrig); % show the two images figure(1); subplot(1,2,1); imshow(ImageOrig); title("Original RGB Image"); subplot(1,2,2); imshow(ImageGray); title("Converted Grayscale Image"); % save the grayscale image imwrite(ImageGray, "building_gray.jpg");
Pixel lesen und schreiben
Geladene Bilder sind in Octave einfache 2D Arrays bzw. Matrizen und können auch wie solche behandelt werden. Eine solche Matrix hat Spalten (x) und Zeilen (y) und wird als folgende Struktur dargestellt
Image = x1y1 x2y1 x3y1 x4y1 ... xny1 x1y2 x2y1 x3y2 x4y2 ... xny2 x1y3 x2y3 x3y3 x4y3 ... xny3 x1y4 x2y4 x3y4 x4y4 ... xny4 ... ... ... ... ... x1ym x2ym x3ym x4ym xnym
Beispiel 2
Das Beispiel 2 zeigt wie Zeilen aus einem Bild gelesen werden. Diese Zeilen werden dann im einem Plot jeweils dargestellt.
% load the image Image = imread(imageSource); % get the size of the image [sy, sx] = size(Image); % define pixel lines to read from redLine = floor(1*sy/10); greenLine = floor(5*sy/10); blueLine = floor(9*sy/10); % extract pixel data redPixels = Image(redLine,:); greenPixels = Image(greenLine,:); bluePixels = Image(blueLine,:);
Statistik
Für die Behandlung von Bilddaten sind statistische Auswertungen ein grundlegendes Werkzeug. Im folgenen sollen einige Grundbegriffe kurz erläutert werden.
Absolutes Auftreten
Nimmt man ein Graustufenbild und zählt für jeden Grauwert wie viele Pixel diesen Wert haben, dann erhält man damit das absolute Auftreten der Grauwerte. Mit diesem 'Zählen' erhält man eine Basis für weitere Auswertungen. Um ein Bild auf das absolute Auftreten von Grauwerten zu untersuchen gibt es die Funktion imhist()
.
[count, value] = imhist(Image);
Relative Häufigkeit
Die relative Häufigkeit beschreibt die Auftretenshäufigkeit eines Grauwertes in Prozent. Um die relative Häufigkeit zu erhalten wird das absolute Auftreten dividiert durch die Anzahl Pixel des Bildes. Mit dem Wert der relativen Häufigkeit kann also die Aussage gemacht werden, wie viel Prozent des Bildes genau diesen Grauwert haben.
[count, value] = imhist(Image); relCount = count/numel(Image);
Kummulative Häufigkeit
Die kummulative Häufigkeit beschreibt den prozentualen Anteil der Pixel welche den Graustufenwert unterschreiten. Die y-Achse der kummulativen Häufigkeit ist also limitiert von 0 bis 1. Die Aussage welche gemacht werden kann ist, dass y% des Bildes einen Graustufenwert kleiner als x aufweist. Die Aussage kann auch umgedreht werden mit der Subtraktion von 1. Wenn also beispielsweise 30% der Pixel einen Graustufenwert kleiner als 128 haben, dann kann die Aussage getroffen werden, dass 1 - 0.3 = 0.7 = 70%
aller Pixel einen Wert höher als 128 haben.
Um die kummulative Häufigkeit eines Bildes zu erhalten muss die kummulative Summe berechnet werden der relativen Häufigkeit wie im Folgenden gezeigt wird
[count, value] = imhist(Image); relCount = count/numel(Image); cumCount = cumsum(relCount);
Mittelwert
Der (arithmetische) Mittelwert gibt den Wert an, der sich bei Summierung aller Werte dividiert duch die Anzahl Werte ergibt (sozusagen den Schwerpunkt).
In Octave kann der Mittelwert (engl. 'mean') eines Arrays bzw. Vecotrs mit der Funktion mean()
ermittelt werden. Bilder sind jedoch ein 2D-Array bzw. eine Matrix und somit kommt abgeleitete Funktion mean2()
zum Einsatz.
grayMean = mean2(Image);
Standardabweichung
Die Standardabweichung ist ein statistisches Mass für die Streuung. Es beschreibt eine mittlere Abweichung vom Mittelwert. Ein kleiner Wert bedeutet, dass viele Werte nahe beieinander liegen beim Mittelwert. Ein grosser Wert bedeutet dagegen, dass die Werte weit verstreut sind. Ein Bild mit vielen Abstufungen wird also eine grosse Standardabweichung aufweisen, ein eintöniges Bild eine kleine Standardabweichung.
grayStdDev = std2(Image);
Beispiel 3
Das Beispiel 3 zeigt auf wie das Histogramm eines Bildes ermittelt wird als auch die absolute, relative und kummulative Häufigkeit von Pixelwerten.
% load the image Image = imread(imageSource); % get histogramm results and do some calculations [count, value] = imhist(Image); relCount = count/numel(Image); % calculate relative counts cumCount = cumsum(relCount); % calculate cumulative count grayMean = mean2(Image); % calculate mean (2D) grayStdDev = std2(Image); % calculate standard deviation (2D)
Quantisierung
Die Quantisierung eines Bildes gibt an, wie fein abgestuft die Pixelwerte sind in Anzahl Bit. Eine Quantisierung mit 8 Bit hat also eine Abstufung der Grauwerte in 256 Schritten, 6 Bit in 64 Schritten, 4 Bit in 16 Schritten usw.
Um ein gegebenes Bild gröber abzustufen z.B von 8 Bit auf 4 Bit, müssen die Pixelwerte dividiert werden durch die Stufendifferenz (8 Bit - 4 Bit = 4 Bit = 16), gerundet auf ganze Zahlen und danach wieder multipliziert werden mit der Stufendifferenz um die richtige Helligkeit zurück zu erhalten.
Veranschaulichung vom Informationsverlust
Bei der Division und Rundung geht Information verloren, d.h. bei diesem Schritt findet die eigentliche Umwandlung statt. Angenommen wir haben eine Zeile von Pixelwerten zwischen 100 und 120. Es gibt also 20 Abstufungen der Werte.
100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120
Dividiert man nun diese durch 16 (4 Bit) und rundet die Ergebnisse so befinden sich die Lösungen in einem Zahlenraum zwischen 25 und 30. Dies sind lediglich 5 Abstufungen statt wie vorher 20. Multipliziert man nun diese Werte wieder mit 16 so ergibt sich
96 96 96 96 96 96 96 96 96 96 96 96 112 112 112 112 112 112 112 112 112
Diese Werte haben nun zwar die Richtigen Helligkeitsstufen damit das Bild einigermassen richtig aussieht, jedoch geht die Detailträue deutlich zurück.
Beispiel 4
Das Beispiel 4 zeigt wie ein Bild von 8 Bit auf 6, 4, und 2 Bit qantisiert wird.
% load the image Image = imread(imageSource); % create the reduced images Image8bit = Image; Image6bit = floor(Image8bit/4)*4; Image4bit = floor(Image8bit/16)*16; Image2bit = floor(Image8bit/64)*64;
Rasterung
Die Rasterung beschreibt die räumliche Auflösung (Pixelzahl) eines Bildes (im Gegensatz dazu die Quantisierung, welche die Abstufung der Pixelwerte beschreibt).
Diese kann im Octave mittel der Funktion imresize()
verändert werden.
Beispiel 5
Das Beispiel 5 zeigt wie ein Bild umgewandelt werden kann auf eine andere Auflösung.
% load the image Image = imread(imageSource); % create reduced images Image1 = Image; Image2 = imresize(Image1, 0.5); Image3 = imresize(Image2, 0.5);
LUT - look up table
Eine LUT (look up table) wird verwendet für die Zuordnung von Pixelwerten. Die Idee und Operation dazu ist relativ simpel. Für jeden Pixelwert gibt es genau einen korresponiderenden Eintag in einer Tabelle (LUT) welcher übernommen wird. Der gelesene Wert im Original dient dabei als Index für die Tabelle (LUT). Es findet also eine lineare und eindeutige Zuordnung von Werten statt beim Anwenden einer LUT.
Im Folgenden ein Prinzipbeispiel einer invertierenden LUT
LUT Index 0 1 2 3 4 5 6 7 8 LUT Wert 8 7 6 5 4 3 2 1 0 ---- Image 0 1 1 2 3 1 1 2 3 4 2 3 3 4 5 4 4 5 6 7 5 6 7 8 8 apllyLUT(Image) 8 7 7 6 5 7 7 6 5 4 6 5 5 4 3 4 4 3 2 1 3 2 1 0 0
Beispiel 6
Das Beispiel 6 zeigt wie verschiedene LUT definiert and angewendet werden.
% load the image Image = imread(imageSource); % define look-up-table (LUT) LUT_inverse = uint8([255:-1:0]); LUT_bright = uint8([0:255].*2); LUT_special = uint8(horzcat([0:1:64], [64:2:((255-64)*2+62)])); % apply LUTs ImageInverse = intlut(Image, LUT_inverse); ImageBright = intlut(Image, LUT_bright); ImageSpecial = intlut(Image, LUT_special);