Jeśli jesteś właścicielem tej strony, możesz wyłączyć reklamę poniżej zmieniając pakiet na PRO lub VIP w panelu naszego hostingu już od 4zł!

str. główna i mapa serwisu

Ustawienia zalecane dla osób mieszkających poza granicami Polski lub korespondujących szeroko z obcokrajowcami, członków mniejszości narodowych oraz osób należących do mniejszości etnicznych w Polsce

Dobór właściwego charsetu w przypadku wysyłania wiadomości na grupy dyskusyjne jest zasadniczo ograniczony zasadami danej grupy (ustalonymi przez właściciela lub opiekuna hierarchii, ewentualnego moderatora, zwyczajami dla danego języka oraz zwyczajami panującymi na danej grupie). Należy wykazać daleko idącą ostrożność przy stosowaniu charsetu innego niż zwyczajowo stosowany na danej grupie – w niektórych hierarchiach działają cancelboty wycinające posty pisane z użyciem niektórych, szczególnie uciążliwych dla grupowiczów kodowań (tak było do niedawna w pl.*, gdzie wycinano w pień wszystkie posty w UTF-8). W przypadku korespondencji mailowej wybór charsetu zależy od uznania i możliwości technicznych obu korespondentów, i wbrew temu, co niektórym może się wydawać, korespondenci mogą ustalić dla swojej korespondencji zupełnie dowolny, wygodny dla obu stron charset. Nie ma na przykład jakiegoś przymusu stosowania ISO-8859-2 dla maili pisanych po polsku! Jedynie zaczynając korespondencję, gdy nie ma jeszcze żadnych szczegółowych ustaleń między korespondentami, warto wybrać charset typowo stosowany w danym języku (np. ISO-8859-2 dla języka polskiego), gdyż jest najbardziej prawdopodobne, że odbiorca właśnie w tym typowym kodowaniu prawidłowo zobaczy treść. Zgodnie z RFC 2047 link do str. zewnętrznej p. 3 w sytuacji, gdy nadawca nie umówił się z odbiorcą co do charsetu stosowanego w korespondencji między nimi, zaleca się preferowanie jednego z charsetów serii ISO-8859-x w stosunku do innych możliwych charsetów.

Czytanie: Prawidłowo skonfigurowany OE potrafi prawidłowo wyświetlić litery z różnymi znakami diakrytycznymi w poprawnych technicznie listach (czytaj – zawierających deklarację charsetu. Warunku tego nie spełniają posty wysyłane z OE w domyślnej konfiguracji) – pod warunkiem, że dane kodowanie jest obsługiwane przez program! Niezależnie od tego, czy list jest po francusku, szwedzku, arabsku, grecku, hebrajsku czy polsku, u odbiorcy automatycznie pokażą się prawidłowe litery z akcentami, ogonkami, umlautami czy bliskowschodnimi zawijasami. Jedynym warunkiem jest posiadanie czcionki unikodowej zawierającej odpowiednie znaki i to, by kodowanie użyte przez nadawcę było obsługiwane przez OE. Tak niestety nie jest w przypadku kodowania ISO-8859-13 (powszechnie stosowanego dla języków krajów bałtyckich). To już by było doskonałe rozwiązanie gdyby nie to, że inni piszący na grupy dyskusyjne prawdopodobnie będą również mieli nieprawidłowo ustawione swoje OE! Stąd będzie konieczne ręczne przełączanie kodowania. W punkcie 2 poniżej zamieściłem listę popularnych języków i używanych kodowań, w punkcie 3 – wskazówki dotyczące języków (lub gwar, jak kto woli) mniejszości etnicznych żyjących w Polsce.

Pisanie: Niestety, OE nie potrafi automatycznie dobrać charsetu w zależności od tego, jakie znaki znajdują się w treści (w przeciwieństwie do niektórych innych programów, np. 40Tude Dialoga link do str. zewnętrznej czy Mozilli Thunderbirda link do str. zewnętrznej). Dlatego użytkownicy OE żyjący za granicą oraz piszący w innym niż polski języku będą musieli przełączać kodowanie w zależności od tego, w jakim języku będą pisać list. Poniżej zamieściłem dwa zestawienia: jedno to lista obsługiwanych kodowań (wraz z objaśnieniem, jakiemu kodowaniu odpowiada termin użyty przez programistów MS), zaś drugie to wspomniana powyżej lista wybranych języków i stosowanych kodowań. W przypadku systemów Windows 9x i ME może okazać się konieczne dodanie obsługi danej rodziny języków w Panelu Sterowania ⇒ Dodaj/usuń programy ⇒ Ustawienia Windows ⇒ Obsługa wielu języków (po angielsku Add/Remove Programs ⇒ Windows Setup ⇒ Multilanguage Support), w systemie Windows 2000 – Panel Sterowania ⇒ Opcje regionalne ⇒ zakładka Ogólne (po ang. Regional Options ⇒ General). Należy mieć przygotowaną płytkę instalacyjną systemu.

Jeżeli listy najczęściej pisujesz w jednym języku (np. po polsku), a w innym języku (np. języku kraju, w którym mieszkasz, lub Twoim języku ojczystym) piszesz wyłącznie okazjonalnie – albo vice versa, wystarczy Ci pamiętanie o ręcznym włączeniu odpowiedniego kodowania podczas pisania w tym drugim języku (klikając na ikonę „Kodowanie” na pasku narzędziowym – patrz strona główna, jak ją dodać do paska). Jeżeli najczęściej piszesz i czytasz w języku stosującym inne kodowanie od polskiego, możesz rozważyć zmianę domyślnego kodowania dla listów przychodzących (punkt 3. na str. głównej) i wychodzących (punkt 7. na str. głównej). W tych miejscach wybierasz właściwy skrypt i właściwe kodowanie według lokalnych wymagań. Zwróć przy tym uwagę, że OE nie obsługuje kilku kodowań używanych w różnych krajach, przed wysyłaniem listu w alternatywnym kodowaniu upewnij się, że odbiorca będzie w stanie prawidłowo odczytać tak kodowany list. W przypadku każdego języka w wielu krajach możesz próbować wysłać list kodowany w unikodzie, ale zawsze sprawdź, czy czytnik odbiorcy obsługuje unikod i czy stosowanie unikodu nie jest zabronione np. na grupach dyskusyjnych.

Zalety unikodu: Unikod jest najwygodniejszym kodowaniem do użycia w środowisku wielojęzycznym. Nie wymaga pamiętania o przełączaniu ani głowienia się, jakie kodowanie wybrać dla danego języka (albo co gorsza dla kombinacji języków). Umożliwia pisanie w dowolnej ilości języków w jednym liście (może to być przydatne dla osób mających międzynarodowe grono korespondentów lub piszących o różnych rzeczach dotyczących różnych krajów, np. wymienianie adresów w różnych krajach) W miarę rozpowszechniania się czytników obsługujących unikod będzie on zdobywał sobie coraz większą popularność. Do tego należy rozwiać pewną wątpliwość: owszem, unikod (w postaci UTF-8 i nie tylko) jest tak samo zatwierdzony międzynarodową normą, jak wszystkie kodowania ISO (w tym ISO-8859-2, które pierwszy raz zostało unormowane w 1987 roku, a aktualna norma nosi oznaczenie ISO/IEC 8859-2:1999 link do str. zewnętrznej), i nosi numer ogólny ISO-10646. Pierwsze prace nad normą na uniwersalny zestaw znaków zaczęły się w 1989 roku (jeszcze to nie był unikod), pierwsza norma ISO-10646 określająca uniwersalny zestaw znaków oparty na unikodzie została opublikowana w 1993 roku i nosiła oznaczenie ISO/IEC 10646-1:1993. Obecna wersja unikodu (4.1) to norma ISO/IEC 10646:2003 link do str. zewnętrznej wraz z suplementem Amendment 1. Kodowanie UTF-8 używane do zapisywania tekstów w unikodzie jest unormowane normą internetową RFC 3629 link do str. zewnętrznej. Ograniczenia na używanie unikodu mogą wynikać z tego, że z jakichś powodów odbiorcy nie mają dostępu do programów obsługujących unikod i nie mogą ich zmienić, albo z zarządzenia właściciela lub opiekuna hierarchii usenetowej (spowodowanego na przykład zbyt agresywnym „promowaniem” unikodu w przeszłości przez pewnego chuligana internetowego), ale nie wynikają z jakiegoś technicznego ograniczenia czy niekompatybilności unikodu z internetem. UTF-8 jest bardziej kompatybilny z internetem niż kodowania Windows, w tym Windows-1250!

O ile kodowanie ISO-8859-2 jako jedyne kodowanie zostało również przyjęte jako polska norma PN-93/T-42115, należy zauważyć, że po pierwsze norma ta nie jest obowiązująca (inaczej można by skarżyć np. Microsoft Polska i wszystkich sprzedawców sprzedających Windowsy, gdyż systemy z tej rodziny używają dla języka polskiego częściowo kodowania windows-1250, a częściowo UTF-16), a po drugie w internecie powszechnie wykorzystuje się inne kodowania, w tym US-ASCII – do pisania po polskawemu, przeciwko czemu jakoś nikt nie protestuje. Do tego unikod ma nieco inne zastosowanie od charsetów 8-bitowych, a PKN nie unormował żadnego charsetu mającego podobne możliwości, co unikod.

Choć użycie unikodu ma bardzo wiele zalet, nie w każdej sytuacji jest on optymalnym rozwiązaniem. Od wielu lat istnieją kodowania 8-bitowe, oparte na stronach kodowych, i one są powszechnie używane. Użycie unikodu może powodować konieczność zmiany pewnych ustawień u odbiorcy, co może być kłopotliwe dla odbiorców, w których miejscach pracy tylko administrator może dokonywać takich zmian konfiguracji, oraz osób będących antytalentami technicznymi i komputerowymi. Szczególnie w biedniejszych krajach mogą być w użyciu programy i systemy operacyjne, które nie mogą zostać skonfigurowane do poprawnego używania unikodu. To samo tyczy się biedniejszych użytkowników komputerów. Stąd poniższa dyskusja na temat wyboru optymalnego kodowania 8-bitowego i takiej konfiguracji czytnika, by prawidłowo je stosował w zależności od języka.

Jeżeli z jakichś powodów nie będziesz (nie możesz, nie chcesz) używać unikodu, a przełączanie kodowania jest dla Ciebie uciążliwe, możesz po prostu założyć dwa profile o różnych konfiguracjach: jeden skonfigurowany dla języka polskiego, drugi dla języka Twojego kraju, Twojego języka ojczystego lub Twoich korespondentów zagranicznych – jeżeli potrzebujesz, możesz nawet mieć większą ilość takich profili. Każdy profil pod względem kodowania konfigurujesz analogicznie do konfiguracji dla języka polskiego, jedynie wybierasz odpowiednie kodowanie domyślne dla listów wysyłanych i dla listów odbieranych z danego profilu.

Jeżeli z jakichś innych powodów nie jesteś w stanie wysyłać poprawnie kodowanych listów (np. piszesz z pracy, a administrator tak skonfigurował program, że jedyne dostępne kodowanie to np. ISO-8859-1 i nie ma możliwości przełączenia na odpowiednie kodowanie), pamiętaj zarówno o tym, by pisać bez ogonków („po polskawemu”), jak i o usuwaniu polskich liter z cytatów. Może pomoże w tym na przykład jakiś darmowy zamiennik Notatnika: Notatnik+ link do str. zewnętrznej albo Notesik link do str. zewnętrznej, oba mają w opcjach możliwość usunięcia polskich liter z tekstu i zastąpienia ich literami łacińskimi, oba mają licencję freeware. Istnieje też program specjalnie napisany do usuwania polskich liter: Anty-ogon 1.0 link do str. zewnętrznej. Pamiętaj, że odbiorca listu nie jest winny temu, że nie możesz poprawnie skonfigurować programu i dlatego to do Ciebie należy obowiązek zapewnienia tego, by w Twojej korespondencji nie było krzaków ani innych śmieci.

1. Kodowania obsługiwane przez OE:

Dane dla wersji OE 6.0 SP1 i SP2.

nazwa kodowania po polskunazwa kodowania po angielskupowszechnie przyjęte oznaczenie kodowaniauwagi
Arabskie (ISO)Arabic (ISO)ISO-8859-6
Arabskie (Windows)Arabic (Windows)Windows-1256 lub CP-1256
Bałtyckie (ISO)Baltic (ISO)ISO-8859-4 lub ISO Latin 41
Bałtyckie (Windows)Baltic (Windows)Windows-1257 lub CP-12572
Cyrylica (ISO)Cyrillic (ISO)ISO-8859-51
Cyrylica (KOI8-R)Cyrillic (KOI8-R)KOI8-R
Cyrylica (KOI8-U)Cyrillic (KOI8-U)KOI8-U
Cyrylica (Windows)Cyrillic (Windows)Windows-1251 lub CP-1251
Estońskie (ISO)Estonian (ISO)ISO-8859-13 lub ISO Latin 75
Greckie (ISO)Greek (ISO)ISO-8859-7
Greckie (Windows)Greek (Windows)Windows-1253 lub CP-12531
Hebrajskie (ISO-Logiczny)Hebrew (ISO-Logical)ISO-8859-8
Hebrajskie (Windows)Hebrew (Windows)Windows-1255 lub CP-12551
Latin-3 (ISO)Latin-3 (ISO)ISO-8859-3 lub ISO Latin 33
Latin-9 (ISO)Latin-9 (ISO)ISO-8859-15 lub ISO Latin 94
Środkowoeuropejskie (ISO)Central European (ISO)ISO-8859-2 lub ISO Latin 2
Środkowoeuropejskie (Windows)Central European (Windows)Windows-1250 lub CP-12501
TajlandzkieThaiWindows-874 lub CP-874
Tureckie (ISO)Turkish (ISO)ISO-8859-9 lub ISO Latin 5
Tureckie (Windows)Turkish (Windows)Windows-1254 lub CP-12541
Unikod (UTF-7)Unicode (UTF-7)UTF-71
Unikod (UTF-8)Unicode (UTF-8)UTF-8
US-ASCIIUS-ASCIIUS-ASCII, ASCII4
Wietnamskie (Windows)Vietnamese (Windows)Windows-1258 lub CP-1258
Zachodnioeuropejskie (ISO)Western European (ISO)ISO-8859-1 lub ISO Latin 1
Zachodnioeuropejskie (Windows)Western European (Windows)Windows-1252 lub CP-12521

1 – kodowania niezalecane, przestarzałe lub rzadko używane.
2 – kodowania ogólnie niezalecane, ale z braku obsługi właściwego kodowania możliwe do ewentualnego zastosowania (lepiej zmienić czytnik na taki, który obsługuje właściwe kodowanie).
3 – Kodowanie ISO-8859-3 stosowane jest dla Esperanto. W ustawieniach fontów dla czytania kodowanie to jest dostępne jako opcja fontów tureckich (!).
4 – Kodowania ISO-8859-15 i US-ASCII w ustawieniach fontów dla czytania są dostępne jako opcje fontów zachodnioeuropejskich. Kodowanie US-ASCII nie jest dostępne jako opcja domyślnego kodowania wysyłanych listów ani jako kodowanie aktualnie pisanego listu. Wybierając kodowanie dla listu zawierającego wyłącznie znaki z zakresu US-ASCII należy się kierować tym, jakie kodowanie jest najczęściej używane w kraju docelowym – odbiorcy ułatwi to odpowiedź.
5 – Kodowanie ISO-8859-13 w pełni dostępne jest tylko na Windows XP SP2. Istnieje możliwość dodania częściowej obsługi kodowania ISO-8859-13 do Windows 2000 i XP bez SP2, zostało to opisane na podstronie.

2. Kodowania stosowane lub zalecane do stosowania dla języków:

Na liście pominąłem kodowanie UTF-8 (które może być użyte z każdym językiem), o ile nie jest jednym z najpowszechniej używanych kodowań dla danego języka.

Afrikaans  –  ISO-8859-1, (ISO-8859-15, Windows-1252, ISO-8859-16°)
Albański  –  ISO-8859-1, (ISO-8859-15, Windows-1252, ISO-8859-2°, 8859-16°, Windows-1250°)
Angielski  –  US-ASCII, ISO-8859-1, (ISO-8859-15, Windows-1252, *)
Arabski  –  UTF-8 RTL, ISO-8859-6, (Windows-1256)
Białoruski  –  Windows-1251
Białoruski – łacinka  –  (ISO-8859-2+, ISO-8859-16+, ISO-8859-13+, Windows-1250+, Windows-1257+)
Bułgarski  –  Windows-1251, KOI8-R, (ISO-8859-5)
Chorwacki  –  ISO-8859-2, (ISO-8859-16, Windows-1250)
Czeski  –  ISO-8859-2, (ISO-8859-16, Windows-1250)
Duński  –  ISO-8859-1, (ISO-8859-15, Windows-1252)
Esperanto  –  ISO-8859-3
Estoński  –  ISO-8859-15, ISO-8859-13, (Windows-1257, ISO-8859-4, Windows-1252)
Fiński  –  ISO-8859-1, ISO-8859-15, (ISO-8859-13, 8859-16°, ISO-8859-4, Windows-1252, Windows-1257)
Francuski  –  ISO-8859-1, (ISO-8859-15, 8859-16°, Windows-1252)
Grecki  –  ISO-8859-7, (Windows-1253)
Hebrajski  –  UTF-8 RTL, ISO-8859-8, (Windows-1255)
Hiszpański  –  ISO-8859-1, (ISO-8859-15, Windows-1252)
Islandzki  –  ISO-8859-1, (ISO-8859-15, Windows-1252)
Jidysz  –  UTF-8 RTL, (ISO-8859-8+, Windows-1255)
Litewski  –  ISO-8859-13**, (Windows-1257, ISO-8859-4)
Łotewski  –  ISO-8859-13**, (Windows-1257, ISO-8859-4)
Niderlandzki (holenderski)  –  ISO-8859-1, (ISO-8859-15, Windows-1252, ISO-8859-16°)
Niemiecki  –  ISO-8859-1, (ISO-8859-15, Windows-1252, ISO-8859-2, ISO-8859-16, ISO-8859-13, Windows-1257***)
Norweski  –  ISO-8859-1, (ISO-8859-15, Windows-1252)
Polski  –  ISO-8859-2, (ISO-8859-16, ISO-8859-4°, ISO-8859-13°, Windows-1250, Windows-1257°)
Portugalski  –  ISO-8859-1, (ISO-8859-15, Windows-1252)
Rosyjski  –  KOI8-R, Windows-1251, (ISO-8859-5)
Rumuński  –  ISO-8859-16****, ISO-8859-2+, (Windows-1250+)
Serbski – cyrylica  –  Windows-1251, (ISO-8859-5)
Serbski – alfabet łaciński  –  ISO-8859-2, (Windows-1250, ISO-8859-16)
Słowacki  –  ISO-8859-2, (ISO-8859-16, Windows-1250)
Słoweński  –  ISO-8859-2, Windows-1250, (ISO-8859-16)
Szwedzki  –  ISO-8859-1, (ISO-8859-15, Windows-1252)
Turecki  –  ISO-8859-9, Windows-1254
Ukraiński  –  KOI8-U, KOI8-R+, (Windows-1251, ISO-8859-5)
Węgierski  –  ISO-8859-2, (ISO-8859-16, Windows-1250)
Wietnamski  –  UTF-8, Windows-1258+
Włoski  –  ISO-8859-1, (ISO-8859-15, Windows-1252, ISO-8859-16°)

° Kodowanie zawiera wszystkie litery danego języka, ale nie jest normalnie używane dla tego języka. Stosowanie tego kodowania może czasami wymagać wprowadzenia pewnych drobnych zmian w konfiguracji po stronie odbiorcy. Kodowanie ISO-8859-16 ani ISO-8859-13 nie jest obsługiwane przez OE.
+ Kodowanie nie zawiera wszystkich znaków używanych w danym języku, choć wydaje się być stosowane mimo tego.
RTL Wybór kodowania UTF-8 dla języka arabskiego, hebrajskiego i jidysz wymaga ustawienia kierunku pisania „Od prawej do lewej” lub po angielsku „Right-To-Left.
* W normalnym użyciu, gdy tekst zawiera jedynie znaki z zakresu US-ASCII, można stosować zupełnie dowolne kodowanie z UTF-8 włącznie. Jedynym efektem ubocznym może być sygnalizowanie błędu przez niektóre czytniki, że deklarowanego kodowania nie obsługują, ale sama treść będzie poprawnie widoczna.
** Kodowanie ISO-8859-13 nie jest obsługiwane przez OE. Dostępne kodowanie Windows-1257 może być użyte jako substytut, ale rozważ użycie innego czytnika. Patrz uwaga 3 poniżej.
*** We wszystkich podanych kodowaniach litery z umlautami i litera „ostre s” znajdują się na tych samych pozycjach i teoretycznie mogą być używane wymiennie. Jedynym efektem ubocznym może być sygnalizowanie błędu przez niektóre czytniki, że deklarowanego kodowania nie obsługują, ale sama treść (w tym umlauty) będzie poprawnie widoczna.
**** Kodowanie ISO-8859-16 nie jest obsługiwane przez OE. Inne kodowania środkowoeuropejskie nie zawierają pełnego zestawu liter rumuńskich. Rozważ użycie innego czytnika.

Uwagi:

  1. Kodowania podane jako pierwsze są obowiązujące lub powszechnie stosowane w danym języku, kodowania w nawiasach – inne możliwe kodowania.
  2. Windows-1252 (CP-1252) to jest tzw. nadzbiór (superset) ISO-8859-1: różnica to dodatkowe znaki (€, ™, † itp.) obecne w Windows-1252 w zakresie, który w ISO-8859-1 jest zarezerwowany dla znaków sterujących. Stosowanie tych znaków może powodować problemy u niektórych odbiorców.
  3. Windows-1257 (CP-1257) to jest tzw. częściowo zgodny nadzbiór (superset) ISO-8859-13: różnica to znaki cudzysłowów w zakresie wspólnym (w Windows-1257 nie ma ich na tych pozycjach) oraz dodatkowe znaki (€, ™, † itp) obecne w Windows-1257 w zakresie, który w ISO-8859-13 jest zarezerwowany dla znaków sterujących. Stosowanie tych znaków może powodować problemy u niektórych odbiorców. Patrz tabela porównawcza znaków w charsetach Windows-1257 i ISO-8859-13.
  4. List zawierający wyłącznie litery łacińskie i cyfry (pisany bez narodowych znaków diakrytycznych, odpowiednik pisania polskawego lub pisany przy użyciu systemu transliteracji na alfabet łaciński) może być kodowany jako US-ASCII niezależnie od języka. Ponieważ OE nie daje możliwości wybrania kodowania US-ASCII dla listów wysyłanych, należy dobrać kodowanie powszechnie stosowane do kodowania danego języka – ułatwi to odpowiedź odbiorcy. OE odpowiadając na list kodowany US-ASCII automatycznie wybierze kodowanie ISO-8859-1, co nie jest poprawnym zachowaniem.
  5. Język angielski zasadniczo nie zawiera żadnych liter ze znakami diakrytycznymi, ale stosowane są one w pewnych zapożyczonych słowach i zwrotach (np. „tête-à-tête”) lub w niewielkiej ilości słów w starannej angielszczyźnie (np. „encyclopædia”). Normalnie w piśmie znaki diakrytyczne można pominąć (przeważająca większość osób anglojęzycznych tak robi, np. pisząc „tete-a-tete” lub „encyclopaedia”, oczywiście z wyjątkiem Amerykanów piszących „encyclopedia”). Dla zainteresowanych podaję listę znaków z górnego zakresu ASCII uważanych za litery występujące w angielskim: æ (dwuznak ae), ç (c z cedilą, c with cedilla), ï (i umlaut) i ô (o z daszkiem, o with circumflex).
  6. Każdy z ww. języków może być kodowany w unikodzie UTF-8, o ile odbiorca (odbiorcy) jest w stanie odczytać to kodowanie. UTF-8 pozwala na zakodowanie prawie wszystkich obecnie używanych języków na Ziemi oraz sporej ilości języków archaicznych i wymarłych. Wybór kodowania UTF-8 dla języków pisanych od prawej do lewej (np. arabskiego, dari, farsi, hebrajskiego, jidysz, pasztu, urdu) wymaga ustawienia kierunku pisania „Od prawej do lewej” lub po angielsku „Right-To-Left.
  7. Czasem jeszcze można spotkać się z listami używającymi kodowania ISO-8859-1 i wymagającymi użycia hackowanej czcionki zawierającej w górnym zakresie ASCII znaki właściwe danemu językowi. Ta metoda była popularna w latach 90. ubiegłego wieku, gdy obsługa unikodu dopiero była powoli wprowadzana do systemów operacyjnych i aplikacji, powinna była już jakiś czas temu zaniknąć, ale niektórzy wciąż jej używają z przyzwyczajenia. Do odczytania listu potrzebna jest identyczna czcionka, do napisania listu w ten sposób – albo układ klawiatury, albo konwerter, albo specjalna aplikacja kodująca litery tego języka w kompatybilny sposób.
  8. Nie gwarantuje się poprawności danych na temat popularności czy powszechności użycia konkretnych kodowań w danym kraju. Użytkownik powinien się osobiście upewnić, w jakim kodowaniu powinien wysłać list do odbiorcy z danego kraju.

3. Języki używane przez mniejszości narodowe i etniczne w Polsce

3.1 Mniejszości narodowe i sprawa pisania jednocześnie w języku mniejszości i polskim

Osoby należące do mniejszości narodowych mogłyby stosować ustawienia właściwe dla swojego języka (punkt powyżej). Problem pojawia się, gdy w jednym liście trzeba napisać tekst jednocześnie po polsku i w danym języku. Optymalnym kodowaniem jest unikod, ale czasem nie ma możliwości użycia unikodu, więc zamieściłem poniżej moje spostrzeżenia na temat możliwości użycia różnych kodowań dla różnych zestawień języków. Możliwe są następujące cztery sytuacje:

  1. Twój język może być kodowany w tej samej stronie kodowej, co język polski, czyli ISO-8859-2. Dotyczy to generalnie języków Europy Środkowej, Wschodniej i Południowej używających alfabetu łacińskiego (czeski, słowacki, węgierski itd. – zasadniczo wyjątkiem jest rumuński, który w idealnym wypadku kodowany jest w ISO-8859-16 – kodowaniu zawierającym również polskie znaki, ale nieobsługiwanym przez OE). Oczywiście w takiej sytuacji nie ma problemu z kodowaniem (domyślnie stosuje się ISO-8859-2), jedynie trzeba przełączać klawiaturę, by wpisać znaki z odpowiedniego języka. Inne kodowanie teoretycznie możliwe do zastosowania i dostępne w OE (ale niezalecane) to oczywiście Windows-1250. Przypadek w sumie najprostszy i nie wymagający jakichkolwiek komentarzy.
  2. Strona kodowa Twojego języka może zawierać również litery polskie. Ma to miejsce w przypadku strony kodowej określanej jako bałtycka. Strony kodowe ISO-8859-4 i Windows-1257 (i ISO-8859-13, która nie jest obsługiwana przez OE) zawierają również pełen zestaw polskich liter. A dokładnie to jest tak, że litery ą i ę są używane w języku litewskim, więc zasadniczo są to litery litewskie, które akurat wyglądają identycznie jak polskie; pozostałe można śmiało określić, że są to polskie litery. Polskie litery (i litery litewskie identyczne z polskimi) w tych stronach kodowych są rozmieszczone w innych miejscach, niż w ISO-8859-2 czy Windows-1250, ale normalnie nie powoduje to żadnych problemów (pod warunkiem, że odbiorca nie ma ustawionego wymuszania charsetu określonego w listach przychodzących – ustawienie to nie jest zwykle potrzebne do niczego i może być śmiało wyłączone, ewentualnie odbiorca może ręcznie przestawić kodowanie):
  3. Istnieje takie kodowanie, które nie jest standardowo wykorzystywane do wysyłania listów w jednym lub obu językach, ale pozwala na poprawne przekazanie liter ze znakami diakrytycznymi należącymi do obu języków. Jedynym problemem może być to, że niektórzy odbiorcy mogą mieć na stałe ustawione kodowanie listów przychodzących. Takie ustawienie nie jest do niczego potrzebne i może zostać bezpiecznie wyłączone albo można ręcznie przestawić kodowanie na odpowiednie:
  4. Nie ma żadnych kodowań wspólnych dla obu języków lub kodowanie wspólne dla tych dwóch języków nie jest obsługiwane przez OE. Przykładem jest kodowanie ISO-8859-16. Sytuacja ta ma miejsce w kombinacji języka polskiego z prawie każdym językiem zachodnioeuropejskim (z wyjątkiem angielskiego, niemieckiego i paru innych, które i tak domyślnie używają kodowania ISO-8859-1 albo jedynym wspólnym kodowaniem jest wspomniane ISO-8859-16, nieobsługiwane przez OE) i językami używającymi alfabetu innego od łacińskiego (rosyjski, białoruski, ukraiński, hebrajski i jidysz, arabski, chiński, koreański) i innych (esperanto, wietnamski, turecki). Masz wówczas do wyboru albo zakodować list w kodowaniu właściwym dla Twojego języka, a tekst polski wpisać bez ogonków, albo zakodować list w ISO-8859-2 i wpisać tekst polski normalnie, a tekst w Twoim języku w jakiś sposób przetworzony: bez znaków diakrytycznych lub ze znakami zapisanymi symbolicznie (dla języków opartych o alfabet łaciński), albo przy użyciu systemu transliteracji. Przypominam o możliwości użycia UTF-8 – najwygodniejszego i najlepszego, o ile nie ma przeszkód natury technicznej. Wybór metody zależy od Ciebie i odbiorcy – najważniejszą sprawą przecież jest to, byście mogli się możliwie najskuteczniej porozumieć.
    Desperacko poszukując rozwiązania należy pamiętać, że wiele osób uważa wysyłanie pustych maili z załącznikiem w formacie MS Word za bardzo niestosowne, poza tym nie każdy ma możliwość otwarcia takiego dokumentu. Mimo pewnych zalet tego rozwiązania bardzo stanowczo odradzam tę metodę radzenia sobie z kodowaniem tekstów wielojęzycznych. Jeżeli nie ma innej metody, polecam użycie możliwie uniwersalnego formatu (RTF jest równie dobry w dokumentach o mało skomplikowanym formatowaniu i powszechnie obsługiwany, nie mówiąc o formacie HTML, inny popularny format to Adobe PDF) i umieszczenie takiego dokumentu na serwerze (nawet darmowym), a przesłanie odbiorcy odsyłacza do tego dokumentu. Plik RTF można dodatkowo spakować. W żadnym wypadku nie wysyłać takiej kobyły mailem!

Ciekawostka: Język Maorysów (przedeuropejskich mieszkańców Nowej Zelandii) używa liter ze znakami diakrytycznymi tzw. nadkreślnikami lub makronami (prostymi kreskami nad literą), obecnymi w stronach kodowych Windows-1257 i ISO-8859-4 (oraz ISO-8859-13, nieobsługiwanej przez OE). W języku używanym na Indonezji używa się litery é (e z akcentem, e with acute accent), również obecnej w ww. stronie kodowej. Jest więc możliwe pisanie jednocześnie po estońsku, fińsku, indonezyjsku, litewsku, łotewsku, maorysku i polsku (i po angielsku, pomijając bardzo rzadko występujące znaki, głównie w słowach zapożyczonych) używając jednej strony kodowej. Jak komuś się przyda praktycznie ta informacja, to może niech się pochwali, bo to chyba będzie ewenement, by tak różne i odległe od siebie języki miały jedną wspólną stronę kodową, a ktoś rzeczywiście miałby potrzebę pisania jednocześnie w tych językach.

3.2 Mniejszości etniczne i ich języki, sprawa pisania jednocześnie w języku mniejszości i polskim

Poniżej zamieściłem dostępne mi informacje o językach mniejszości etnicznych żyjących w Polsce. Lista ta jest niepełna i bazuje na informacjach znalezionych w wielu miejscach na internecie. Podobnie jak w przypadku języków mniejszości narodowych, uwagi dotyczą sytuacji, gdy nie ma możliwości użycia unikodu (co byłoby rozwiązaniem optymalnym).

Ostatnia deska ratunku: Wszystkie programy do obsługi poczty i grup dyskusyjnych oraz wszystkie grupy dyskusyjne akceptują i poprawnie pokazują listy w US-ASCII – czyli pisane samym alfabetem łacińskim (po angielsku lub z użyciem jakiegoś systemu reprezentacji liter spoza US-ASCII względnie systemu transliteracji). Może to być ostatnią deską ratunku w beznadziejnych przypadkach, gdy nie da rady dopasować żadnego użytecznego kodowania.

Źródła: Alfabety świata link do str. zewnętrznej, lista alfabetów Europy link do str. zewnętrznej, Kaszubska Strona Informacyjna link do str. zewnętrznej, Pů našymu – portal języka śląskiego link do str. zewnętrznej, Outlook Express for Yiddish Email link do str. zewnętrznej, techniczne zagadnienia kodowania języka litewskiego link do str. zewnętrznej, obserwacje własne.

licznik