Startseite » IT-Wissen – was ist XML?

IT-Wissen – was ist XML?

by Daniel Rottländer
XML – die softwareübergreifende Auszeichnungssprache

XML – die softwareübergreifende Auszeichnungssprache

In der IT-Welt dreht sich vieles um die standardisierte Definition und Übertragung von Daten, um vorhandene Informationen so effizient wie möglich zu nutzen. Dabei spielt die Extensible Markup Language (XML) eine zentrale Rolle. Doch was genau ist XML, und wofür wird es verwendet? In diesem Blogbeitrag erhalten Sie detaillierte Einblicke in die Funktionsweise und Einsatzgebiete von XML.

Was ist XML?

XML (Extensible Markup Language) ist eine universelle Auszeichnungssprache, die zur Darstellung und Speicherung strukturierter Daten genutzt wird. Diese textbasierte Sprache ermöglicht es, Informationen hierarchisch zu organisieren. Sie zeichnet sich durch ihre Flexibilität aus und eignet sich zur Darstellung unterschiedlichster Datentypen, von Texten und Zahlen bis hin zu Bildern. Zudem bildet XML eine wichtige Grundlage für den Datenaustausch und die Interoperabilität in verschiedenen Anwendungen und Branchen.

Anwendungsbeispiele für eine Nutzung von XML

Die Extensible Markup Language, kurz XML, bildet das Fundament für unzählige Anwendungen – von Standard-Produktivitätstools wie Textverarbeitungsprogrammen bis hin zu Software für Buchpublikationen und komplexen Systems für die Anwendungskonfiguration.

XML spielt eine wesentliche Rolle bei der Strukturierung von Daten auf Websites. Es arbeitet zusammen mit anderen Technologien wie HTML, um Nutzern konsistente und relevante Informationen bereitzustellen. Betrachten Sie etwa eine E-Commerce-Website, die Bekleidung anbietet. Statt jedem Besucher die gesamte Produktpalette zu zeigen, filtert die Seite mithilfe von XML und speziellen Tags wie <brand> die Angebote nach Benutzerpräferenzen.

Zudem lässt sich XML einsetzen, um strukturelle Informationen in technischen Dokumenten festzulegen. Andere Programme nutzen diese Strukturinformationen, um das Dokument für verschiedene Zwecke wie Druck oder Webpublikationen aufzubereiten. XML definiert beispielsweise Tags für Absätze, Elemente in nummerierten Listen oder Überschriften, die von der Software automatisch verarbeitet werden.

XML ermöglicht den Datenaustausch zwischen zwei Systemen, die dieselben Informationen in verschiedenen Formaten verarbeiten. Ein Beispiel: Während eine Website Daten im Format MM/TT/JJJJ speichert, verwendet ein Buchhaltungssystem das Format TT/MM/JJJJ. Durch XML können Daten von der Website in das Buchhaltungssystem übertragen werden.

Die XML-Dokumentarten im Überblick

XML-Dokumente erinnern auf den ersten Blick an HTML-Dokumente, was darauf zurückzuführen ist, dass HTML eine Anwendung der Extensible Markup Language ist und dieselben Tag- und Attributstrukturen verwendet.

Bei XML lässt sich eine Unterscheidung zwischen verschiedenen Arten von Dokumenten treffen. Dokumentzentrierte XML-Dokumente sind auch ohne zusätzliche Informationen für Menschen relativ leicht verständlich und weisen eine geringe Strukturierung auf, was ihre Lesbarkeit durch Maschinen beeinträchtigt. Im Gegensatz dazu stehen die datenzentrierten XML-Dokumente, die durch eine starke Strukturierung gekennzeichnet sind und daher eine hohe Maschinenlesbarkeit aufweisen, jedoch für den menschlichen Leser oft schwer verständlich sind. Als Mittelweg bieten sich die semistrukturierten Dokumente an, die sowohl für Menschen lesbar als auch für Maschinen gut verarbeitbar sind.

XML vs. HTML – es gibt Unterschiede

HTML, in seiner fünften Version als HTML5 bekannt, ähnelt aufgrund seiner XML-Basis optisch stark der Extensible Markup Language. Im Gegensatz zu HTML, das ein festgelegtes Set von Tags und Attributen besitzt, erlaubt XML den Entwicklern, ihre eigenen Tags und Attribute frei zu definieren. Zudem unterscheidet XML, anders als HTML, zwischen Groß- und Kleinschreibung. Ein weiterer wichtiger Unterschied ist, dass XML stets das Verwenden von schließenden Tags erfordert.

Was ist ein XML-Parser?

Ein XML-Parser ist eine Software, die dazu dient, XML-Dokumente zu lesen und die darin enthaltenen Informationen zu extrahieren. Diese Parser überprüfen zudem die Einhaltung der Syntax und der Regeln der XML-Dateien und validieren sie gegen ein spezifisches XML-Schema. Aufgrund der strikten Natur von XML führen Validierungs- oder Syntaxfehler dazu, dass die Datei vom Parser nicht verarbeitet wird. Fehlermeldungen werden beispielsweise ausgelöst, wenn:

  • Ein notwendiges schließendes Tag fehlt,
  • Anführungszeichen bei Attributwerten ausgelassen wurden,
  • Eine Bedingung des Schemas nicht erfüllt ist.

Anwendungen nutzen XML-Parser, um XML-Dateien in für die Software spezifische Datentypen zu konvertieren, wodurch Entwickler sich auf die Logik der Anwendung konzentrieren können, ohne sich in die XML-Details vertiefen zu müssen.

Weite Verbreitung – unter anderem Excel verarbeitet XML

Microsoft Excel vereinfacht den Import von XML-Daten (Extensible Markup Language), die in anderen Datenbanken und Anwendungen generiert wurden, indem es ermöglicht, XML-Elemente einem Arbeitsblatt zuzuordnen und anschließend die bearbeiteten XML-Daten für die weitere Verwendung in anderen Datenbanken und Anwendungen zu exportieren. Denken Sie an Excel als einen Generator für XML-Dateien mit einer benutzerfreundlichen Oberfläche.

Excel unterstützt hauptsächlich zwei Arten von XML-Dateien: Zum einen XML-Datendateien, die benutzerdefinierte Tags und strukturierte Daten umfassen, und zum anderen Schemadateien (.xsd), die Schematags für Regeln wie Datentypen und Validierungsparameter enthalten.

Um XML-Datendateien in Excel zu importieren und als XML-Tabelle darzustellen, nutzen Sie die „Entwicklertools“ und wählen dort „Importieren“. Im Dialogfeld „XML importieren“ suchen und wählen Sie die gewünschte XML-Datei aus und starten den Import durch Klicken auf den „Importieren“-Button.

Das könnte Ihnen auch gefallen