Unicode

Unicode werd geïntroduceerd met de belofte om de meeste karakterkwesties in oudere platte tekstcodering op te ruimen. De Unicode-standaard is een belangrijke prestatie. Het wijst niet alleen bijna elk geschreven karakter toe aan een uniek nummer, het definieert ook de noties van hoofdletters en kleine letters op intelligente wijze, en het definieert soorten tekens, zoals letters, cijfers, leestekens, en nog veel meer. Aan Unicode zijn verschillende coderingen gekoppeld om de unieke nummers op efficiënte manieren aan streams van bits toe te wijzen.

In de wereld van vandaag is UTF8 heel gebruikelijk, en vooral geschikt voor westerse talen, omdat het samenvalt met ASCII voor de ASCII-tekens. Andere coderingen zijn UTF16 en UTF32.

Unicode tekst is een preferred format onder bestandstype Platte tekst