XML-Verarbeitung: Grundlagen zu XML

XML (Abkürzung für Extensible Markup Language) ist eine sogenannte Auszeichnungssprache, welche Daten strukturiert darstellen soll. XML-Dokumente können von Menschen ohne weiteres gelesen werden, da diese meist aus ASCII-Zeichen bestehen. Viele moderne Auszeichnungssprachen nutzen als Basis XML. So handelt es sich bei XHTML, SVG, RSS und vielen mehr um XML-Sprachen, welche über sogenannte Dokumenttypdefinitionen (kurz DTD) oder XML Schemen (kurz XSD) eine Regel zugewiesen wurde. Bei solchen Regeln wird angegeben, welche Elementnamen, Attribute und deren Werte erlaubt sind.
Wenn wir später zum Thema WPF kommen, werden Sie mit der XML-Sprache XAML arbeiten, um das Layout Ihres Formulars zu gestalten. Einige Programme nutzen heutzutage XML, um Informationen in einer Datei / einem Dokument zu speichern (z. B. Eagle von CadSoft). Gerne verwenden auch Hobby-Programmierer ein XML-Format, um Daten abzuspeichern. Dies kommt nicht nur daher, dass das Format gut leserlich und übersichtlich ist, sondern dass C# Schnittstellen zur einfachen Verarbeitung von XML-Dokumenten anbietet. Diese Schnittstellen werden wir in diesem Kapitel kennenlernen.
Meistens enthält ein XML-Dokument in der ersten Zeile eine XML-Deklaration. Unterhalb davon folgen nun sogenannte Elemente. Elemente werden in spitzen Klammern (< und >) notiert. Diese Elemente können beliebig verschaltet werden, sofern es sich um ein zweiteiliges Element handelt. Einteilige Elemente werden am Ende mit /> gekennzeichnet. Bei zweiteiligen Elementen gibt es immer einen öffnenden Tag und einen schließenden Tag. Dabei müssen Elemente in der umgekehrten Reihenfolge geschlossen werden, im Vergleich zu, wie diese geöffnet wurden. Die Elementnamen dürfen, sofern kein DTD oder XSD vorhanden, frei gewählt werden. Ein Element kann neben weiteren untergeordneten Elementen auch einen Text enthalten. In XML können im Start-Tag zusätzlich sogenannte Attribute notiert werden. Dabei werden hinter dem Attributname ein Gleichheitszeichen und anschließend der dazugehörige Wert in doppelten Anführungszeichen notiert. Auch die Attributnamen und dessen Werte sind, sofern kein DTD oder XSD vorhanden, frei wählbar. Das erste Element im XML-Dokument wird als Wurzelelement bezeichnet. Es kann immer nur ein Wurzelelement geben. Alle weiteren Verschachtelungen finden ausschließlich in den davon untergeordneten Elementen statt.
Eine ausführliche Erklärung zu XML und deren basierenden Sprachen finden Sie auf unserer Partnerwebseite unter http://www.homepage-webhilfe.de/XML/.

LinksRechts