{"id":11541,"date":"2021-09-14T16:02:57","date_gmt":"2021-09-14T14:02:57","guid":{"rendered":"https:\/\/dans.knaw.nl\/?page_id=11541"},"modified":"2021-09-14T16:02:57","modified_gmt":"2021-09-14T14:02:57","slug":"non-unicode","status":"publish","type":"page","link":"https:\/\/dans.knaw.nl\/nl\/bestandsformaten\/platte-tekst\/non-unicode\/","title":{"rendered":"Non-Unicode"},"content":{"rendered":"<p><span class=\"tlid-translation translation\">Wat een karakter is, wordt bepaald door een codering. Een codering is een systeem om karakters toe te wijzen aan reeksen bits.<\/span><\/p>\n<p><span class=\"tlid-translation translation\">De meest voorkomende karaktercodering is ASCII. Het codeert een set van 128 tekens. Dit is een basisset bestaande uit letters, hoofdletters en kleine letters, cijfers, leestekens, rekenkundige symbolen, enkele valutasymbolen, spatie, tab, nieuwe regel, regelterugloop en enkele andere.<\/span><\/p>\n<p><span class=\"tlid-translation translation\">Later werden extensies gedefinieerd voor letters met accenten en voor andere scripts zoals Cyrillisch en Grieks. De eerste was de CP437 van IBM. Deze uitbreidingssets werden gedefinieerd door codepagina&#8217;s, die elk een beperkt aantal niet-ASCII-tekens definieerden. Windows had zijn eigen notie van codepagina: 125x.<\/span><\/p>\n<p><span class=\"tlid-translation translation\">Dit alles was gebruikelijk v\u00f3\u00f3r\u00a0<a class=\"internal-link\" title=\"\" href=\"https:\/\/dans.knaw.nl\/nl\/over\/diensten\/easy\/toelichting-data-deponeren\/voor-het-deponeren\/bestandsformaten\/platte-tekst\/unicode\" target=\"_self\" rel=\"noopener\">Unicode<\/a>. Tekstbestanden uit deze tijd vormen de moeilijkheid dat niets in het bestand zelf aangeeft welke codepagina wordt gebruikt. Het is een kwestie van vallen en opstaan om de juiste codepagina te bepalen, en soms is het onmogelijk. Dit probleem wordt overgedragen naar oudere op tekst gebaseerde indelingen zoals CSV en SQL. Hoewel de structuur van SQL- en CSV-bestanden meestal goed is gedefinieerd, blijft het gebruik van niet-aangegeven codepagina&#8217;s een aansprakelijkheid.<\/span><\/p>\n<p><span class=\"tlid-translation translation\">Non-Unicode tekst is een non-preferred format binnen bestandstype <a href=\"https:\/\/dans.knaw.nl\/bestandsformaten\/platte-tekst\/\">Platte tekst<\/a>.\u00a0<\/span><\/p>\n","protected":false},"excerpt":{"rendered":"<p>Wat een karakter is, wordt bepaald door een codering. Een codering is een systeem om karakters toe te wijzen aan reeksen bits. De meest voorkomende karaktercodering is ASCII. Het codeert een set van 128 tekens. Dit is een basisset bestaande uit letters, hoofdletters en kleine letters, cijfers, leestekens, rekenkundige symbolen, enkele valutasymbolen, spatie, tab, nieuwe [&hellip;]<\/p>\n","protected":false},"author":8,"featured_media":0,"parent":11081,"menu_order":0,"comment_status":"closed","ping_status":"closed","template":"","meta":{"_acf_changed":false,"_et_pb_use_builder":"","_et_pb_old_content":"","_et_gb_content_width":"","inline_featured_image":false,"footnotes":""},"class_list":["post-11541","page","type-page","status-publish","hentry"],"acf":[],"yoast_head":"<!-- This site is optimized with the Yoast SEO plugin v27.4 - https:\/\/yoast.com\/product\/yoast-seo-wordpress\/ -->\n<title>Bestandsformaten: Non-Unicode | DANS<\/title>\n<meta name=\"robots\" content=\"index, follow, max-snippet:-1, max-image-preview:large, max-video-preview:-1\" \/>\n<link rel=\"canonical\" href=\"https:\/\/dans.knaw.nl\/nl\/bestandsformaten\/platte-tekst\/non-unicode\/\" \/>\n<meta property=\"og:locale\" content=\"nl_NL\" \/>\n<meta property=\"og:type\" content=\"article\" \/>\n<meta property=\"og:title\" content=\"Bestandsformaten: Non-Unicode | DANS\" \/>\n<meta property=\"og:description\" content=\"Wat een karakter is, wordt bepaald door een codering. Een codering is een systeem om karakters toe te wijzen aan reeksen bits. De meest voorkomende karaktercodering is ASCII. Het codeert een set van 128 tekens. Dit is een basisset bestaande uit letters, hoofdletters en kleine letters, cijfers, leestekens, rekenkundige symbolen, enkele valutasymbolen, spatie, tab, nieuwe [&hellip;]\" \/>\n<meta property=\"og:site_name\" content=\"DANS\" \/>\n<meta property=\"article:publisher\" content=\"https:\/\/www.facebook.com\/Data-Archiving-and-Networked-Services-DANS-140231255994524\/\" \/>\n<meta name=\"twitter:card\" content=\"summary_large_image\" \/>\n<meta name=\"twitter:site\" content=\"@dans_knaw_nwo\" \/>\n<meta name=\"twitter:label1\" content=\"Geschatte leestijd\" \/>\n\t<meta name=\"twitter:data1\" content=\"1 minuut\" \/>\n<script type=\"application\/ld+json\" class=\"yoast-schema-graph\">{\"@context\":\"https:\\\/\\\/schema.org\",\"@graph\":[{\"@type\":\"WebPage\",\"@id\":\"https:\\\/\\\/dans.knaw.nl\\\/nl\\\/bestandsformaten\\\/platte-tekst\\\/non-unicode\\\/\",\"url\":\"https:\\\/\\\/dans.knaw.nl\\\/nl\\\/bestandsformaten\\\/platte-tekst\\\/non-unicode\\\/\",\"name\":\"Bestandsformaten: Non-Unicode | DANS\",\"isPartOf\":{\"@id\":\"https:\\\/\\\/dans.knaw.nl\\\/nl\\\/#website\"},\"datePublished\":\"2021-09-14T14:02:57+00:00\",\"breadcrumb\":{\"@id\":\"https:\\\/\\\/dans.knaw.nl\\\/nl\\\/bestandsformaten\\\/platte-tekst\\\/non-unicode\\\/#breadcrumb\"},\"inLanguage\":\"nl-NL\",\"potentialAction\":[{\"@type\":\"ReadAction\",\"target\":[\"https:\\\/\\\/dans.knaw.nl\\\/nl\\\/bestandsformaten\\\/platte-tekst\\\/non-unicode\\\/\"]}]},{\"@type\":\"BreadcrumbList\",\"@id\":\"https:\\\/\\\/dans.knaw.nl\\\/nl\\\/bestandsformaten\\\/platte-tekst\\\/non-unicode\\\/#breadcrumb\",\"itemListElement\":[{\"@type\":\"ListItem\",\"position\":1,\"name\":\"Home\",\"item\":\"https:\\\/\\\/dans.knaw.nl\\\/nl\\\/\"},{\"@type\":\"ListItem\",\"position\":2,\"name\":\"Bestandsformaten\",\"item\":\"https:\\\/\\\/dans.knaw.nl\\\/nl\\\/bestandsformaten\\\/\"},{\"@type\":\"ListItem\",\"position\":3,\"name\":\"Platte tekst\",\"item\":\"https:\\\/\\\/dans.knaw.nl\\\/nl\\\/bestandsformaten\\\/platte-tekst\\\/\"},{\"@type\":\"ListItem\",\"position\":4,\"name\":\"Non-Unicode\"}]},{\"@type\":\"WebSite\",\"@id\":\"https:\\\/\\\/dans.knaw.nl\\\/nl\\\/#website\",\"url\":\"https:\\\/\\\/dans.knaw.nl\\\/nl\\\/\",\"name\":\"DANS\",\"description\":\"\",\"potentialAction\":[{\"@type\":\"SearchAction\",\"target\":{\"@type\":\"EntryPoint\",\"urlTemplate\":\"https:\\\/\\\/dans.knaw.nl\\\/nl\\\/?s={search_term_string}\"},\"query-input\":{\"@type\":\"PropertyValueSpecification\",\"valueRequired\":true,\"valueName\":\"search_term_string\"}}],\"inLanguage\":\"nl-NL\"}]}<\/script>\n<!-- \/ Yoast SEO plugin. -->","yoast_head_json":{"title":"Bestandsformaten: Non-Unicode | DANS","robots":{"index":"index","follow":"follow","max-snippet":"max-snippet:-1","max-image-preview":"max-image-preview:large","max-video-preview":"max-video-preview:-1"},"canonical":"https:\/\/dans.knaw.nl\/nl\/bestandsformaten\/platte-tekst\/non-unicode\/","og_locale":"nl_NL","og_type":"article","og_title":"Bestandsformaten: Non-Unicode | DANS","og_description":"Wat een karakter is, wordt bepaald door een codering. Een codering is een systeem om karakters toe te wijzen aan reeksen bits. De meest voorkomende karaktercodering is ASCII. Het codeert een set van 128 tekens. Dit is een basisset bestaande uit letters, hoofdletters en kleine letters, cijfers, leestekens, rekenkundige symbolen, enkele valutasymbolen, spatie, tab, nieuwe [&hellip;]","og_site_name":"DANS","article_publisher":"https:\/\/www.facebook.com\/Data-Archiving-and-Networked-Services-DANS-140231255994524\/","twitter_card":"summary_large_image","twitter_site":"@dans_knaw_nwo","twitter_misc":{"Geschatte leestijd":"1 minuut"},"schema":{"@context":"https:\/\/schema.org","@graph":[{"@type":"WebPage","@id":"https:\/\/dans.knaw.nl\/nl\/bestandsformaten\/platte-tekst\/non-unicode\/","url":"https:\/\/dans.knaw.nl\/nl\/bestandsformaten\/platte-tekst\/non-unicode\/","name":"Bestandsformaten: Non-Unicode | DANS","isPartOf":{"@id":"https:\/\/dans.knaw.nl\/nl\/#website"},"datePublished":"2021-09-14T14:02:57+00:00","breadcrumb":{"@id":"https:\/\/dans.knaw.nl\/nl\/bestandsformaten\/platte-tekst\/non-unicode\/#breadcrumb"},"inLanguage":"nl-NL","potentialAction":[{"@type":"ReadAction","target":["https:\/\/dans.knaw.nl\/nl\/bestandsformaten\/platte-tekst\/non-unicode\/"]}]},{"@type":"BreadcrumbList","@id":"https:\/\/dans.knaw.nl\/nl\/bestandsformaten\/platte-tekst\/non-unicode\/#breadcrumb","itemListElement":[{"@type":"ListItem","position":1,"name":"Home","item":"https:\/\/dans.knaw.nl\/nl\/"},{"@type":"ListItem","position":2,"name":"Bestandsformaten","item":"https:\/\/dans.knaw.nl\/nl\/bestandsformaten\/"},{"@type":"ListItem","position":3,"name":"Platte tekst","item":"https:\/\/dans.knaw.nl\/nl\/bestandsformaten\/platte-tekst\/"},{"@type":"ListItem","position":4,"name":"Non-Unicode"}]},{"@type":"WebSite","@id":"https:\/\/dans.knaw.nl\/nl\/#website","url":"https:\/\/dans.knaw.nl\/nl\/","name":"DANS","description":"","potentialAction":[{"@type":"SearchAction","target":{"@type":"EntryPoint","urlTemplate":"https:\/\/dans.knaw.nl\/nl\/?s={search_term_string}"},"query-input":{"@type":"PropertyValueSpecification","valueRequired":true,"valueName":"search_term_string"}}],"inLanguage":"nl-NL"}]}},"_links":{"self":[{"href":"https:\/\/dans.knaw.nl\/nl\/wp-json\/wp\/v2\/pages\/11541","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/dans.knaw.nl\/nl\/wp-json\/wp\/v2\/pages"}],"about":[{"href":"https:\/\/dans.knaw.nl\/nl\/wp-json\/wp\/v2\/types\/page"}],"author":[{"embeddable":true,"href":"https:\/\/dans.knaw.nl\/nl\/wp-json\/wp\/v2\/users\/8"}],"replies":[{"embeddable":true,"href":"https:\/\/dans.knaw.nl\/nl\/wp-json\/wp\/v2\/comments?post=11541"}],"version-history":[{"count":1,"href":"https:\/\/dans.knaw.nl\/nl\/wp-json\/wp\/v2\/pages\/11541\/revisions"}],"predecessor-version":[{"id":11549,"href":"https:\/\/dans.knaw.nl\/nl\/wp-json\/wp\/v2\/pages\/11541\/revisions\/11549"}],"up":[{"embeddable":true,"href":"https:\/\/dans.knaw.nl\/nl\/wp-json\/wp\/v2\/pages\/11081"}],"wp:attachment":[{"href":"https:\/\/dans.knaw.nl\/nl\/wp-json\/wp\/v2\/media?parent=11541"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}