Charsety w Windows

Microsoft w swoich systemach operacyjnych od czasu Windows 3.1 używa dwóch różnych stron kodowych – Windows (myląco zwanej ANSI) i DOS (równie myląco zwanej OEM). Wprowadza to niewiarygodne zamieszanie, zwłaszcza gdy używa się programów, które zawierają dawno napisany kod odwołujący się do kodowania DOS albo wykorzystują dane kodowane DOS w celu zapenienia kompatybilności z poprzednimi wersjami lub dawnymi archiwami. Dodatkowo dzięki MS użytkownicy systemów operacyjnych i programów tego producenta mają jeszcze problem z kodowaniami używanymi na internecie: MS konstruując niektóre tablice kodowań Windows nie tylko dodał znaki pisarskie w zakresie znaków sterujących (pozycje 128÷159), jak w przypadku Windows­‑1252, ale z sobie tylko znanych powodów pozmieniał pozycje znaków w górnym zakresie – np. znany problem krzaków wynikający z częściowej niezgodności Windows­‑1250 i ISO­‑8859‑2. Problem potęgują niekompetentni programiści lekceważący różnice między stronami kodowymi Windows a ISO. Poniżej zamieszczam wybiórcze zestawienie typowo stosowanych stron kodowych w zależności od grupy języków.

Grupa język­owa
(lub język)
Kodo­wanie Win­dowsKodo­wanie DOSKodo­wanie ISO (in­ternet)
do­myśl­nealter­natywne
Środko­wo­euro­pejska1250852Mazovia (polski)
Kame­nický (czeski, sło­wacki)
ISO­-8859­-2
ISO­-8859­-16
Cyry­lica1251866855KOI8­-R
ISO­-8859­-5
Zachod­nio­euro­pejska1252437 albo 850860 (portu­galski)
861 (is­landzki)
863 (wiel­kie litery fran­cuskie, głównie kana­dyjski fran­cuski)
865 (języki skandy­nawskie z wyj. islandz­kiego)
858 (850 ze znakiem €)
ISO­-8859­-1
ISO­-8859­-15
ISO­-8859­-3 (maltański)
ISO­-8859­-10 (języki skandy­nawskie)
Język grecki1253737869ISO­-8859­-7
Język turecki1254857ISO­-8859­-9
Bałtycka1257775ISO­-8859­-4
ISO­-8859­-13

Strony kodowe DOS pisane tekstem kursywą w szarym kolorze nie są standardowo dostępne w produktach Microsoftu i ich obsługa wymaga dodania plików ze źródeł zewnętrznych. Strona kodowa CP858 jest dostępna w systemie Windows 2000 i wyższych.

Domyślna strona kodowa DOS to strona kodowa instalowana przez system, gdy wybrany zostaje kraj z danego regionu. W przypadku języka angielskiego system wybiera między stroną kodową 437 (USA) a 850 (Wielka Brytania). Ustawienia te trzymane są w rejestrze w kluczu HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Control\Nls\CodePage (ciągi ACP – strona kodowa Windows – i OEMCP – strona kodowa DOS), w małych Windowsach (9x i ME) dodatkowo w pliku config.sys w linii country=048,852,c:\windows\command\country.sys. Zmiana systemowych stron kodowych jest możliwa ręcznie, ale w małych Windowsach wymaga również zmian definiujących czcionki systemowe i plik konwersji strona kodowa DOS ⇔ strona kodowa Windows. Więcej informacji na świetnej stronie Yogurta link do str. zewnętrznej (kopia archiwalna; opis dotyczy zmian z angielskiego na polski, ale analogicznie można zmienić z dowolnego języka na dowolny, pamiętając o użyciu plików dla odpowiedniej wersji językowej), analogiczna strona po rosyjsku link do str. zewnętrznej (rzecz jasna traktująca o zmianie ustawnień z angielskich na rosyjskie). Choć obie instrukcje wspominają o Windows 95, w przypadku systemów nowszych, włącznie z ME, postępuje się identycznie (jedyna różnica to lokalizacja niezbędnych plików w CAB-ach na dysku instalacyjnym).

licznik