XML (eXtensible Markup Language) is een generieke opmaaktaal ontworpen door het World Wide Web Consortium (W3C) en wordt gebruikt in XML-documenten, een klasse van data objecten die het gedrag beschrijven van algoritmen waardoor ze worden verwerkt. XML is een applicatie-profiel en een gelimiteerde vorm van SGML (Standard Generalized Markup Language).
Het format van XML is in zijn meest basale aspecten gelijk aan platte tekst waardoor XML leesbaar is voor mensen. Met het toenemen van de complexiteit neemt die leesbaarheid af en zijn we voor interpretatie afhankelijk van gespecialiseerde applicaties. Dit betekent dat de mogelijkheden tot preserveren van XML over langere tijd afhankelijk zijn van de mate van complexiteit enerzijds en de beschikbaarheid op termijn van die gespecialiseerde applicaties anderzijds.

XML-document
Een XML-document bevat een of meerdere elementen binnen één root-element. Elk element bestaat uit een start-tag en een eind-tag of is een leeg element. Tussen start- en eind-tag bevindt zich de content van het element, dat kan bestaan uit tekst en/of onderliggende elementen. Een element kan een set van attributen bevatten die bestaan uit een naam en (tekst)waarde.
De opbouw van een geldig XML-document kan gevalideerd worden op syntax. Een voorbeeld van een online validator is de W3C Markup Validation Service:
https://validator.w3.org/

Encoding van XML-documenten
De encoding van XML-documenten wordt aangegeven in de XML-proloog, een declaratie vóór het root-element. Als er geen proloog aanwezig is, dan wordt aangenomen dat de encoding de default is voor XML-documenten: UTF-8.

Media-type
Het algemene media-type, of mime-type, voor XML-documenten is application/xml, ook wel text/xml. De gebruikelijke extensie is .xml.

XML subtypes
XML kent een grote variatie aan subtypes en gespecialiseerde toepassingen. Enkele van de meest gebruikte:
– XHTML – Extensible Hyper Text Markup Language, een meer strikte versie van html
– XSD – XML Schema Definition, een formele beschrijving van de elementen in een XML-document
– XSLT – XSL (eXtensible Stylesheet Language) Transformations, voor het transformeren van XML-documenten naar andere formaten (met name XML en HTML).

Gespecialiseerde toepassingen van XML zijn onder andere:
– RDF XML – RDF (Resource Description Framework) beschreven in XML, volgens RFC3870
– RSS XML – RSS (Realy Simple Syndication) een type van web feed
– WSDL XML – (Web Services Description Language) een XML-gebaseerde taal voor het beschrijven van web services
– GML – Geography Markup Language, een opmaaktaal voor het beschrijven van geografische kenmerken
– SVG – Scalable Vector Graphics, een opmaaktaal voor afbeeldingen

Zie ook
Planning for Library of Congress Collections: https://www.loc.gov/preservation/digital/formats/fdd/fdd000075.shtml

XML is een preferred format binnen bestandstype Opmaaktaal.