Entwurf eines Multi-Source-Bildverarbeitungs- und Analysesystems
2026-02-21 10:54:25··#1
Das Multi-Source Image Processing and Analysis System (MSIMAGES) ist ein Subsystem des Geographischen Informationssystems (MAPGIS). Dieser Artikel erläutert das Designkonzept, die Prinzipien und die Systemstruktur von MSIMAGES, stellt die Klassifizierung der Systemfunktionen und die Auswahl der Systemplattform vor und analysiert die im Bildsystem verwendeten Dateitypen und deren Funktionen. Schlüsselwörter: Geographisches Informationssystem, Bildverarbeitung, Bildanalyse. Hauptziel des MSIMAGES-Systems ist die Verarbeitung und Analyse rasterisierter zweidimensionaler räumlicher Verteilungsdaten. Diese umfassen verschiedene Fernerkundungsdaten, Luftbilddaten, Radardaten, fotografische Bilddaten sowie digitalisierte und gerasterte geologische und topographische Karten, geophysikalische und geochemische Daten und weitere professionelle Bilddaten. Die Bedeutung der Forschung an MSIMAGES liegt in der schnellen Verarbeitung und Analyse von Multi-Source-Bilddaten auf einem Mikrocomputer. Dies eröffnet neue Wege für die Realisierung rasterisierter Geographischer Informationssysteme. 1. Systemkonzept und -prinzipien (1) Das Design des Systems zur Verarbeitung und Analyse von Bildern aus verschiedenen Quellen sollte den Prinzipien der Softwareentwicklung folgen und einen modularen Ansatz verfolgen. Die zugrundeliegenden Softwaremodule sollten portabel und wartungsfreundlich sein, um die Portabilität auf verschiedenen Software- und Hardwareplattformen zu gewährleisten. Die übergeordneten Module des Systems in der Windows-Betriebssystemumgebung sollten hochgradig portabel und unabhängig von der Hardwareplattform sein. Hinsichtlich der funktionalen Trennung zwischen dem System zur Verarbeitung und Analyse von Bildern aus verschiedenen Quellen und dem Windows-Betriebssystem wird empfohlen, dass alle Aufgaben, die vom Betriebssystem ausgeführt werden sollen, auch vom Betriebssystem ausgeführt werden. Die Bedienoberfläche ist nach dem Prinzip der Mensch-Computer-Interaktion gestaltet und auf einfache Bedienung ausgelegt. Das System ist in C programmiert. (2) Ein Designziel des Systems zur Verarbeitung und Analyse von Bildern aus verschiedenen Quellen ist die Fähigkeit, große Bilder mit Datenmengen von mehreren Hundert Megabyte bis zu mehreren Gigabyte zu verarbeiten und zu analysieren. Daher muss der Systementwurf große Bilddaten als Ausgangspunkt nehmen und die Definition von Datenstrukturen, die Implementierung von Algorithmen sowie die Auswahl der Systemsoftware- und Hardwareplattformen umfassend berücksichtigen. Der Funktionsentwurf des Systems zur Verarbeitung und Analyse von Bildern aus verschiedenen Quellen sollte auf der Datenstruktur des Systems basieren. Unter der Voraussetzung einer wohldefinierten Datenstruktur können die Funktionen mehr oder weniger stark ausgeprägt sein, um ein offenes System zu bilden. (3) Als professionelles Bildinformationssystem muss es die Fähigkeit besitzen, verschiedene professionelle Daten zu verarbeiten und zu analysieren. Nach der Analyse und Zusammenfassung der Datentypen verschiedener Fachbereiche führt das System zur Bildverarbeitung und -analyse aus mehreren Quellen die folgenden Bildtypen ein: Binärbild, Graustufenbild, 256-Farben-Index- und Klassifizierungsbild (Einzelbyte-Bild), 64K-Hochfarbbild (Indexbild, Klassifizierungsbild und ganzzahlige Fachdaten) (Doppelbyte-Bild), RGB-Echtfarbenbild (3-Byte-Bild), RGBP-Transparent-Echtfarben-Overlay-Bild (4-Byte-Bild), 4-Byte-Gleitkomma-Datenbild (verwendet für verschiedene Frequenzbereichstransformationen und verschiedene Fachbilddaten sowie Zwischenergebnisse von Bildberechnungen) und komplexe Zahl (verwendet für Frequenzbereichstransformationen). (4) Obwohl das System zur Bildverarbeitung und -analyse aus mehreren Quellen ein auf Rasterdaten basierendes Geoinformationssystem ist, muss es als Teil des Geoinformationssystems MAPGIS Funktionen wie die gemischte Darstellung von Raster- und Vektorbildern, die umfassende Verarbeitung und die umfassende Analyse unterstützen. (5) Als Kerndatenstruktur moderner Geoinformationssysteme sind Ebenen von großer Bedeutung für die Datenorganisation, -verwaltung, Datenüberlagerungsanalyse und die umfassende Verarbeitung. Das System zur Bildverarbeitung und -analyse aus mehreren Quellen führt das Konzept von Ebenen ein (Unterstützung von 1024 oder 256 Ebenen (WIN)). 32S)) ermöglicht die dynamische und transparente Überlagerung und Anzeige der Raster- oder Vektorgrafiken jeder Ebene für einen umfassenden dynamischen Vergleich und eine Analyse. (6) Es wird eine Farbdatenbank erstellt, die die Farbauswahl, Farbanpassung und Registrierung von RGB, HLS und HSV unterstützt. Die 236-Farben-Palette wird optimiert, um die Simulation der Echtfarbendarstellung auf 256-Farben-Monitoren zu unterstützen (Erstellung einer Indextabelle von RGB bis 236 Farben). Außerdem werden HLS- und HSV-Farbbibliotheken erstellt und einige häufig verwendete kontinuierliche Farbdaten zur Darstellung von Bildern mit kontinuierlichen Daten und signifikanter Größe bereitgestellt. (7) Die Verarbeitung, Analyse, der Überlagerungsvergleich, die Überlagerungsanalyse, das Mosaikieren und andere Operationen zwischen Bildern und zwischen Bildern und Grafiken erfordern, dass jedes Bild und jede Grafik über einheitliche Koordinaten verfügt und verschiedene Projektionstransformationen und geometrische Korrekturen unterstützt (Einrichtung eines einheitlichen geografischen Koordinatensystems). (8) In der fortgeschrittenen und intelligenten Phase der Bildanalyse sind Bildclustering, Bildsegmentierung und automatische Bilderkennung die Hauptaufgaben der Bildverarbeitung und -analyse. Die resultierenden Bilder enthalten unsichere Daten. Die Unterstützung von undefinierten Daten und reservierten Datenbits (zur Darstellung dieser Bits) sollte daher ein zentraler Aspekt von Systemen zur Verarbeitung und Analyse von Bildern aus verschiedenen Quellen sein. (9) Als Mensch-Computer-Schnittstelle überträgt der Farbbildschirm verschiedene Bilder, Grafiken und andere Informationen in Form von Rot-, Grün- und Blau-Farbpunkten (RGB). Das RGB-Farbmodell ist ein objektives Farbmodell und eignet sich gut für Hardware. Für Menschen ist es jedoch schwierig, das RGB-Farbmodell zu beherrschen. Um das RGB-Farbmodell besser zu steuern, ist ein intermediäres Farbmodell erforderlich, das für Menschen besser geeignet ist. Das doppelte hexagonale Pyramiden-Farbmodell [1] und das einfache hexagonale Pyramiden-Farbmodell [1] (HLS und HSV) sind zwei Beispiele für solche subjektiven Farbmodelle. Dies ist die theoretische Grundlage für Farbsynthese, Farbzerlegung, Farbanpassung und automatische Farbzuordnung des Systems zur Verarbeitung und Analyse von Mehrquellen-Bilddaten. (10) Als Mensch-Computer-Schnittstelle sind sowohl die Farbanzeige als auch die Eingabe- und Ausgabereaktion des menschlichen Auges nichtlineare Systeme. Dies unterstützt die Gammakorrektur und Farbkorrektur der Anzeige [2], wodurch das System zur Verarbeitung und Analyse von Mehrquellen-Bilddaten eine optimierte Farbgestaltung ermöglicht. (11) Rasterbilddaten sind oft sehr umfangreich, während der Zielbereich des Benutzers sehr klein sein kann. Um das Ausprobieren in kleinen Bereichen zu unterstützen, bietet das System Funktionen wie Auswahl und Zuschneiden sowie lokale Operationen. Der Standardauswahlbereich umfasst das gesamte Bild. (12) Zur Anzeige des Systemstatus werden eine Statusanzeigezeile mit Anmerkungen und ein Wartecursor eingeführt. Bildinformationen werden im Fenstertitel angezeigt. Zudem werden die Koordinaten des Clientbereichs, die Bildposition und die geografischen Bildkoordinaten des Cursors angezeigt. (13) Es werden verschiedene Arten von Unterfenstern für mehrere Dokumente unterstützt, darunter Bilder (Grafiken), Text und Tabellen. (14) Um große Bilder zu unterstützen und Speicherplatz zu sparen, wird der im Clientbereich angezeigte Inhalt dynamisch generiert. (15) Da Bilder mit professionellen Integer-Daten und 4-Byte-Gleitkomma-Daten nicht direkt angezeigt werden können, kann ein Parameter festgelegt werden, der die Darstellung dieser Bilddaten angibt. (16) Bei Binärbildern und 256-Farben-Bildern mit 64K-Kodierung repräsentieren die Farbwerte die Klassen. Klasse, Fläche, Varianz usw. können direkt anhand der Farbwerte ermittelt werden. Dilatation, Medianfilterung, Kreuzmedianfilterung und Filterung des häufigsten Werts sind ebenfalls möglich. (17) Daten müssen vor der Eingabe in das System zur Verarbeitung und Analyse von Mehrquellenbildern formatiert werden. Das System unterstützt nur sein eigenes Datenformat. Andere Datenformate müssen mit einem Konvertierungsprogramm konvertiert werden. Dies vereinfacht die Entwicklung und Programmierung des Systems zur Verarbeitung und Analyse von Mehrquellenbildern. (18) Die Konzepte der Datenbankentwicklung und des Datenbankprojekts werden vorgestellt. Um den Dateiverwaltungsmechanismus des Systems zu vereinfachen, wird eine Beziehung zwischen den Konzepten Entwicklung, Projekt und Schicht hergestellt. 2 Gesamtstruktur des Systems Die Gesamtstruktur des Systems verwendet die Windows-Mehrdokumentenfenster-Schnittstelle, die Windows-Technologie für virtuelles Speichermanagement [3], die Windows-Technologie für speicherabgebildete Dateien und das für die Bildverarbeitung und -analyse mehrerer Quellen definierte Dateisystem. Unter der Steuerung der Mehrdokumentenfenster-Schnittstelle wird für jedes Bild, das verschiedenen Datendateien entspricht, ein Unterbilddokumentfenster mittels speicherabgebildeter Dateien und virtuellem Speichermanagement erstellt. Unter der Steuerung der Mehrdokumentenfenster-Schnittstelle werden die Menübefehle und die Nachrichtenkommunikation realisiert. Die Mehrdokumentenschnittstelle (MDI) ist eine Spezifikation von Microsoft Windows Text Processing Application [4, 5], die die Fensterstruktur und die Benutzeroberfläche beschreibt, die es Benutzern ermöglicht, mehrere Dokumente in einer einzigen Anwendung zu verwenden. Mithilfe der MDI-Technologie können beliebig viele Bilder (sofern Arbeitsspeicher und virtueller Speicher dies zulassen) als Dokumente geöffnet und generiert werden, die gleichzeitig im Clientbereich gespeichert werden können. Durch virtuelles Speichermanagement [3] erhält das System 2 GB Adressraum. Dies ermöglicht es der Bildverarbeitung und -analyse aus mehreren Quellen, sich erstmals vom segmentierten Speicherverwaltungsmechanismus von DOS und Windows 3.1 zu lösen und die Implementierung dieser Funktionen auf einem Mikrocomputer zu realisieren. Die Memory-Mapped-File-Technologie ist ein neuer Dateizugriffsmechanismus von Windows NT. Mithilfe dieser Technologie kann das System einen Teil des 2 GB großen Adressraums für Dateien reservieren und diese diesem reservierten Bereich zuordnen. Nach der Zuordnung der Dateien übernimmt Windows NT die Seitenzuordnung, das Puffern und das Hochgeschwindigkeits-Caching. 3. Systemfunktionsdesign: Das Funktionsdesign des Systems zur Bildverarbeitung und -analyse aus mehreren Quellen basiert auf der Datenstruktur des Systems. Unter der Voraussetzung einer wohldefinierten Datenstruktur können die Funktionen mehr oder weniger stark vereinfacht werden, um ein offenes System zu bilden. Die aktuell entwickelten Funktionen sind wie folgt: (1) Ein-/Ausgabefunktionen. Diese umfassen die Ein- und Ausgabe verschiedener Datenformate und -typen sowie die Konvertierung zwischen Vektor-, Raster- und Tabellendaten und Funktionen zur Ausgabe von Annotationen (TIGAR, BMP, TIFF, RAW, PCX, GIF-Rasterformat, WMF, MAPGIS-Vektorformat, FOXPRO-Datenbanktabelle). (2) Vektoroperationsfunktionen. Diese unterstützen die Rasterisierung verschiedener Vektordaten, darunter Liniensegment-Vektorkarten, Polygon-Vektorkarten und Punkttabellenkarten (zur Konvertierung von MAPGIS-Vektorkarten in Rasterkarten). (3) Bildanzeigefunktion. Unterstützt das Abrufen und Bearbeiten von Farbtabellen (für 256 Farben, 64K-Indexkarten und Klassifizierungskarten), das Kopieren, Ausschneiden und Einfügen von Rasterkarten, das Abrufen von Pixelinformationen (Klassifizierungsinformationen der Klassifizierungskarte umfassen Farbe, Fläche und Kategorie), die 3D-Perspektivdarstellung (generiert mit DEM), die Generierung von Stereobildpaaren (generiert mit DEM), die Generierung von Ansichtskarten (generiert mit DEM), räumliche Abfragen mit Cursor- und Koordinateneingabe, die 3D-Geländedarstellung, die Generierung von optimalen Pfadkarten, Dichteschnittkarten, Dichteprofilkarten, Histogrammdarstellung, Bildrasterung (Kilometerraster, Breiten- und Längengradraster), planare Konturkarten, das Zeichnen von Vektor-Stereo-Perspektivansichten, automatisches Bild-Roaming, Bildannotation, die Generierung von Beleuchtungs- und Schattenkarten, Relief-Stereokarten und die Überlagerung mehrschichtiger Bilder. (4) Funktionen zur räumlichen Analyse. Dazu gehören benutzerdefinierte Makrooperationen auf mehreren Bildern, Bildmischung, Regionsnummerierung, Distanzkartengenerierung, Interpolationsrasterisierung (Konturinterpolation, Punktinterpolation, Raster-Resampling), plattformübergreifende Datenregistrierung und Resampling, geografische Bildkoordinatenreferenzierung (Koordinatenaddition, geometrische Transformation, Bildregistrierung, geometrische Korrektur, Skalierung und Kartenprojektionstransformation), Distanzmessung, Flächenstatistik, Konturextraktion, räumliche Verteilung bestimmter Attribute, Texturmerkmalextraktion, räumliche Analyse codierter Bilder (räumliche Logikoperationen, Bitlogikoperationen von Binärbildern, Generierung von Ko-Okkurrenzindexbildern), morphologische Bildanalyse (Öffnung, Schließung, Treffer, Dilatation, Erosion usw.), Pufferanalyse, dreidimensionale Schnittanalyse, Bildkorrelationsmatrixanalyse und Verhältnisanalyse. (5) Bildverarbeitungsfunktionen. Dazu gehören Anzeige und Speicherung, Bearbeitung von Farbtabellen, verschiedene Graustufen- und Farbtransformationen, Farbsynthese und -zerlegung verschiedener Farbmodelle, Filterung verschiedener niederfrequenter, hochfrequenter, linearer und nichtlinearer Funktionen, radiometrische Korrektur, atmosphärische Korrektur, Streifenentfernung von Fernerkundungsbildern, Farbverbesserung, Farbtransformation von Mehrbandbildern, Falschfarbenverbesserung durch Filterung, Pseudofarbenkonvertierung, Farbschattierung, Bildvergrößerung, -verkleinerung, Formattransformation, benutzerdefinierte Filterung, Fourier-Transformation, Binärbildverarbeitung, Kantenschärfung, lineare Volumenverbesserung, Verhältnisfarbsynthese, Farbraumtransformation und Funktionen zur Verbesserung von Sättigung, Helligkeit und Farbton [6]. (6) Statistische Klassifizierungsfunktionen. Dazu gehören Histogrammstatistik, multivariate Statistik, Hauptkomponentenanalyse, Klassifizierung (Sampling, Klassifizierung und Dichteschnitt), unüberwachtes Clustering (Parallelogrammklassifizierung, hierarchische Klassifizierung und dynamische Clusterklassifizierung), überwachte Klassifizierung (minimale Distanzklassifizierung, generalisierte Distanzklassifizierung, Maximum-Likelihood-Ratio-Klassifizierung und lineare Diskriminanzanalyse), Bildsegmentierung (Punktkorrelationssegmentierung, Regionskorrelationssegmentierung) usw. (7) Tabellenverwaltungsfunktion. Umfasst Tabellenverwaltung (Beziehungstabellen), Tabellenabfrage, Datenbankverwaltungsschnittstelle und weitere Funktionen. 4 Auswahl der Systemhardware- und Softwareplattform. Hinsichtlich der Auswahl der Systemsoftwareplattform verwendet das System die Die WIN 32S API-Softwareplattform ist eine weit verbreitete Option [7]. Sie unterstützt die Softwareplattformen WINDOWS 3.1+WIN 32S1.2, WIN 95 und WINDOWS NT. Minimale Hardwarekonfiguration: 486-Mikroprozessor + 16 MB Arbeitsspeicher + 400 MB Festplatte + 256-Farben-Grafikkarte; Empfohlene Hardwarekonfiguration: 586-Mikroprozessor + 32 MB Arbeitsspeicher + 1000 MB Festplatte + True-Color-Grafikkarte. 5. Design der Systemdateitypen: Als umfangreiches Bildverarbeitungssystem ist ein umfassendes Systeminformationsmanagementsystem erforderlich. Dieses System umfasst die folgenden 19 Dateitypen: (1) Bilddatei. Sie dient der Verwaltung der notwendigen Informationen für jedes Bild und besteht hauptsächlich aus dem Bilddateikopf und den Bilddaten. Der Bilddateikopf enthält Bildtyp, Bildzeilen- und -spaltenwerte, Bildkoordinatentyp (0: keine Koordinaten…), positive und negative Transformationspolynome zwischen Bildzeilen- und -spaltenwerten und geografischen Koordinaten, Maximalwert, Minimalwert und Koordinaten. Einheit, Koordinatenbereich, undefinierter Wert und Bildverarbeitungsmethode (für professionelle Integer-Datenbilder und 4-Byte-Gleitkomma-Datenbilder); der Bilddatenteil umfasst Lookup-Tabellendaten und Bildattributdaten. (2) Kontrollpunktdatei. Wird für geometrische Korrekturen und Projektionstransformationen verwendet. (3) Farb-Lookup-Tabellendatei. Wird verwendet, um die Farbtabelle der LUT (einschließlich 256 Farben und 64K Farben) zu speichern. (4) Systemkonfigurationsdatei. Wird verwendet, um Systemparameter, einschließlich Systemdateiverzeichnis und Standardwerte der Systemumgebung, zu speichern. (5) Klassifizierungsstatistikdatei. Wird verwendet, um die statistischen Ergebnisse der Clusteranalyse, der überwachten Klassifizierung und der unüberwachten Klassifizierung zu speichern. (6) Histogrammstatistikdatei. Wird verwendet, um die Histogrammverteilung des Bildes zu speichern. (7) Pseudofarben-Lookup-Tabellendatei. Wird verwendet, um die Farbtabelle der LUT für die Pseudofarbentransformation (einschließlich 256 Farben und 64K Farben) zu speichern. (8) Trainingsbereichsdatei. Wird verwendet, um den Trainingsbereich für die überwachte Klassifizierung zu speichern und im Training der überwachten Klassifizierung zu verwenden. (9) Vektordatei mit Punkten, Linien und Flächen. (10) Bildannotationsdatei. Textdatei zur Beschreibung von Bildinformationen. (11) Datei mit benutzerdefinierten Filterparametern. Textdatei zur Aufzeichnung der Parameter eines benutzerdefinierten Filters. (12) Datei mit Cluster-Feature-Space. Zur Aufzeichnung der Trainingsergebnisse der überwachten Klassifizierung. (13) Datei mit Querverweistabellen. Zur Aufzeichnung der Vergleichsergebnisse von multitemporalen Bildern oder zwei Bildern. (14) Datei mit Klassifizierungshistogramminformationen. Zur Aufzeichnung der Histogramminformationen des Klassifizierungsbildes. (15) 3D-Ansichtspunktdatei. Zur Aufzeichnung verschiedener Parameter der Stereobeobachtung. (16) Projektdatei. Zur Verwaltung aller Projektdateien. (17) 3D-Datendatei. Zur Aufzeichnung von 3D-Raumdaten. (18) Datei mit Systemparametern und -optionen. Zur Aufzeichnung verschiedener Systemparameter. (19) Datenwörterbuchdatei. Zur Aufzeichnung von Funktions-, Fehler- und Parametercodes. Referenz 1 Rogers DF; übersetzt 1. Von Liang Shidong, Shi Jiaoying und Peng Qunsheng. Algorithmische Grundlagen der Computergrafik. Peking: Science Press, 1987. S. 111–137. 2. Conlacco; übersetzt von Shi Jiaoying und Huang Jianfeng. Rastergrafik-Handbuch. Peking: Science Press, 1988. S. 66–84. 3. Richter J; übersetzt von Zheng Quanzhan, Wang Yi und Luo Shui. Fortgeschrittene Programmiertechniken für Windows NT. Peking: Tsinghua University Press, 1994. S. 58–122. 4. Ezzell B; übersetzt von Fu Zuyun, Duan Chenghua und Xu Jinhua. Grafikprogrammiertechniken für Windows NT 3.1. Peking: Electronic Industry Press, 1994. S. 124–300. 5. Petzold C; übersetzt von Wen Du. Programmierung von Windows 3.1. Peking: Ocean Press, 1993. 725–766. 6. Wang Runsheng, Yang Wenli, Huang Danian u. a. Geologische Explorationsbildanalyse und -synthese. Peking: Geologischer Verlag, 1992. 1–37. 7 Heller M; Zhu Yuanling, Feng Yu (Übersetzer). Fortgeschrittene WIN 32-Programmierung. Peking: Verlag der Elektronikindustrie, 1994. 77–131.