Jeśli jesteś właścicielem tej strony, możesz wyłączyć reklamę poniżej zmieniając pakiet na PRO lub VIP w panelu naszego hostingu już od 4zł!

str. główna i mapa serwisu

Ustawienia zalecane dla osób mieszkających poza granicami Polski lub korespondujących szeroko z obcokrajowcami, członków mniejszości narodowych oraz osób należących do mniejszości etnicznych w Polsce

Dyskusja dotyczy programów, które obsługują wszystkie obecnie używane charsety i potrafią automatycznie dobierać charset w zależności od treści. Szczegółowe instrukcje i wskazówki zawarte są na stronach poświęconych opracowanym programom (patrz początek strony).

Dobór właściwego charsetu w przypadku wysyłania wiadomości na grupy dyskusyjne jest zasadniczo ograniczony zasadami danej grupy (ustalonymi przez właściciela lub opiekuna hierarchii, ewentualnego moderatora, zwyczajami dla danego języka oraz zwyczajami panującymi na danej grupie). Należy wykazać daleko idącą ostrożność przy stosowaniu charsetu innego niż zwyczajowo stosowany na danej grupie – w niektórych hierarchiach działają cancelboty wycinające posty pisane z użyciem niektórych, szczególnie uciążliwych dla grupowiczów kodowań (tak było do niedawna w pl.*, gdzie wycinano w pień wszystkie posty w UTF-8). W przypadku korespondencji mailowej wybór charsetu zależy od uznania i możliwości technicznych obu korespondentów, i wbrew temu, co niektórym może się wydawać, korespondenci mogą ustalić dla swojej korespondencji zupełnie dowolny, wygodny dla obu stron charset. Nie ma na przykład jakiegoś przymusu stosowania ISO-8859-2 dla maili pisanych po polsku! Jedynie zaczynając korespondencję, gdy nie ma jeszcze żadnych szczegółowych ustaleń między korespondentami, warto wybrać charset typowo stosowany w danym języku (np. ISO-8859-2 dla języka polskiego), gdyż jest najbardziej prawdopodobne, że odbiorca właśnie w tym typowym kodowaniu prawidłowo zobaczy treść. Zgodnie z RFC 2047 link do str. zewnętrznej p. 3 w sytuacji, gdy nadawca nie umówił się z odbiorcą co do charsetu stosowanego w korespondencji między nimi, zaleca się preferowanie jednego z charsetów serii ISO-8859-x w stosunku do innych możliwych charsetów.

Czytanie: Prawidłowo skonfigurowany program potrafi prawidłowo wyświetlić litery z różnymi znakami diakrytycznymi w poprawnych technicznie listach (czytaj – zawierających deklarację charsetu. Warunku tego nie spełniają posty wysyłane z OE w domyślnej konfiguracji). Niezależnie od tego, czy list jest po francusku, szwedzku, arabsku, grecku, hebrajsku czy polsku, u odbiorcy automatycznie pokażą się prawidłowe litery z akcentami, ogonkami, umlautami czy bliskowschodnimi zawijasami. Jedynym warunkiem jest posiadanie czcionki unikodowej zawierającej odpowiednie znaki. To już by było doskonałe rozwiązanie gdyby nie to, że inni piszący na grupy dyskusyjne z nieskonfigurowanych OE będą krzaczyć! Stąd będzie konieczne ręczne przełączanie kodowania – w punkcie 1 poniżej zamieściłem listę popularnych języków i używanych kodowań, w punkcie 2 – wskazówki dotyczące języków (lub gwar, jak kto woli) mniejszości etnicznych żyjących w Polsce.

Pisanie: Po skonfigurowaniu zgodnie z zaleceniami podanymi na odpowiednich stronach programy będą automatycznie dobierać prawidłowy charset w zależności od treści, nie wymagając interwencji użytkownika. Poniżej zamieściłem zestawienie wybranych języków i powszechnie stosowanych oraz potencjalnie możliwych kodowań. W przypadku systemów Windows 9x i ME może okazać się konieczne dodanie obsługi danej rodziny języków w Panelu Sterowania ⇒ Dodaj/usuń programy ⇒ Ustawienia Windows ⇒ Obsługa wielu języków (po angielsku Add/Remove Programs ⇒ Windows Setup ⇒ Multilanguage Support), w systemie Windows 2000 – Panel Sterowania ⇒ Opcje regionalne ⇒ zakładka Ogólne (po ang. Regional Options ⇒ General). Należy mieć przygotowaną płytkę instalacyjną systemu.

W przypadku Thunderbirda, Opery i Forté Agenta: Jeżeli listy najczęściej pisujesz w jednym języku (np. po polsku), a w innym języku (np. języku kraju, w którym mieszkasz, języku Twoich zagranicznych korespondentów lub Twoim języku ojczystym) piszesz wyłącznie okazjonalnie – albo vice versa, wystarczy Ci pamiętanie o ręcznym włączeniu odpowiedniego kodowania podczas pisania w tym drugim języku. Jeżeli najczęściej piszesz i czytasz w języku stosującym inne kodowanie od polskiego, możesz rozważyć zmianę domyślnego kodowania dla listów przychodzących i wychodzących. W przypadku każdego języka w wielu krajach możesz próbować wysłać list kodowany w unikodzie, ale zawsze sprawdź, czy czytnik odbiorcy obsługuje unikod i czy stosowanie unikodu nie jest zabronione np. na grupach dyskusyjnych. W przypadku Dialoga oraz programów współpracujacych z MIME-Proxy nie ma takiej możliwości ręcznej zmiany kodowania i by wysłać list w danym kodowaniu, trzeba to kodowanie odpowiednio umieścić w konfiguracji Dialoga lub zmienić konfigurację MIME-Proxy.

Zalety unikodu: Unikod jest najwygodniejszym kodowaniem do użycia w środowisku wielojęzycznym. Nie wymaga pamiętania o przełączaniu ani głowienia się, jakie kodowanie wybrać dla danego języka (albo co gorsza dla kombinacji języków). Umożliwia pisanie w dowolnej ilości języków w jednym liście (może to być przydatne dla osób mających międzynarodowe grono korespondentów lub piszących o różnych rzeczach dotyczących różnych krajów, np. wymienianie adresów w różnych krajach) W miarę rozpowszechniania się czytników obsługujących unikod będzie on zdobywał sobie coraz większą popularność. Do tego należy rozwiać pewną wątpliwość: owszem, unikod (w postaci UTF-8 i nie tylko) jest tak samo zatwierdzony międzynarodową normą, jak wszystkie kodowania ISO (w tym ISO-8859-2, które pierwszy raz zostało unormowane w 1987 roku, a aktualna norma nosi oznaczenie ISO/IEC 8859-2:1999 link do str. zewnętrznej), i nosi numer ogólny ISO-10646. Pierwsze prace nad normą na uniwersalny zestaw znaków zaczęły się w 1989 roku (jeszcze to nie był unikod), pierwsza norma ISO-10646 określająca uniwersalny zestaw znaków oparty na unikodzie została opublikowana w 1993 roku i nosiła oznaczenie ISO/IEC 10646-1:1993. Obecna wersja unikodu (4.1) to norma ISO/IEC 10646:2003 link do str. zewnętrznej wraz z suplementem Amendment 1. Kodowanie UTF-8 używane do zapisywania tekstów w unikodzie jest unormowane normą internetową RFC 3629 link do str. zewnętrznej. Ograniczenia na używanie unikodu mogą wynikać z tego, że z jakichś powodów odbiorcy nie mają dostępu do programów obsługujących unikod i nie mogą ich zmienić, albo z zarządzenia właściciela lub opiekuna hierarchii usenetowej (spowodowanego na przykład zbyt agresywnym „promowaniem” unikodu w przeszłości przez pewnego chuligana internetowego), ale nie wynikają z jakiegoś technicznego ograniczenia czy niekompatybilności unikodu z internetem. UTF-8 jest bardziej kompatybilny z internetem niż kodowania Windows, w tym Windows-1250!

Choć użycie unikodu ma bardzo wiele zalet, nie w każdej sytuacji jest on optymalnym rozwiązaniem. Od wielu lat istnieją kodowania 8-bitowe, oparte na stronach kodowych, i one są powszechnie używane. Użycie unikodu może powodować konieczność zmiany pewnych ustawień u odbiorcy, co może być kłopotliwe dla odbiorców, w których miejscach pracy tylko administrator może dokonywać takich zmian konfiguracji, oraz osób będących antytalentami technicznymi i komputerowymi. Szczególnie w biedniejszych krajach mogą być w użyciu programy i systemy operacyjne, które nie mogą zostać skonfigurowane do poprawnego używania unikodu. To samo tyczy się biedniejszych użytkowników komputerów. Stąd poniższa dyskusja na temat wyboru optymalnego kodowania 8-bitowego i takiej konfiguracji czytnika, by prawidłowo je stosował w zależności od języka.

Jeżeli z jakichś powodów nie jesteś w stanie wysyłać poprawnie kodowanych listów (np. piszesz z pracy, a administrator tak skonfigurował program, że jedyne dostępne kodowanie to np. ISO-8859-1 i nie ma możliwości przełączenia na odpowiednie kodowanie), pamiętaj zarówno o tym, by pisać bez ogonków („po polskawemu”), jak i o usuwaniu polskich liter z cytatów. Może pomoże w tym na przykład jakiś darmowy zamiennik Notatnika: Notatnik+ link do str. zewnętrznej albo Notesik link do str. zewnętrznej, oba mają w opcjach możliwość usunięcia polskich liter z tekstu i zastąpienia ich literami łacińskimi, oba mają licencję freeware. Istnieje też program specjalnie napisany do usuwania polskich liter: Anty-ogon link do str. zewnętrznej (wersja nie wymagająca .NET Framework jest na stronie „Wszystkie programy”). Pamiętaj, że odbiorca listu nie jest winny temu, że nie możesz poprawnie skonfigurować programu i dlatego to do Ciebie należy obowiązek zapewnienia tego, by w Twojej korespondencji nie było krzaków ani innych śmieci.

1. Kodowania stosowane lub zalecane do stosowania dla języków:

Na liście pominąłem kodowanie UTF-8 (które może być użyte z każdym językiem), o ile nie jest jednym z najpowszechniej używanych kodowań dla danego języka.

Afrikaans  –  ISO-8859-1, (ISO-8859-15, Windows-1252, ISO-8859-16°)
Albański  –  ISO-8859-1, (ISO-8859-15, Windows-1252, ISO-8859-2°, 8859-16°, Windows-1250°)
Angielski  –  US-ASCII, ISO-8859-1, (ISO-8859-15, Windows-1252, *)
Arabski  –  UTF-8, ISO-8859-6, (Windows-1256)
Białoruski  –  Windows-1251, (ISO-8859-5)
Białoruski – łacinka  –  (ISO-8859-2+, ISO-8859-16+, ISO-8859-13+, Windows-1250+, Windows-1257+)
Bułgarski  –  Windows-1251, KOI8-R, (ISO-8859-5)
Chorwacki  –  ISO-8859-2, (ISO-8859-16, Windows-1250)
Czeski  –  ISO-8859-2, (ISO-8859-16, Windows-1250)
Duński  –  ISO-8859-1, (ISO-8859-15, Windows-1252)
Esperanto  –  ISO-8859-3
Estoński  –  ISO-8859-15, ISO-8859-13, (Windows-1257, ISO-8859-4, Windows-1252)
Fiński  –  ISO-8859-1, ISO-8859-15, (ISO-8859-13, ISO-8859-16°, ISO-8859-4, Windows-1252, Windows-1257)
Francuski  –  ISO-8859-1, (ISO-8859-15, ISO-8859-16°, Windows-1252)
Grecki  –  ISO-8859-7, (Windows-1253)
Hebrajski  –  UTF-8, ISO-8859-8, (Windows-1255)
Hiszpański  –  ISO-8859-1, (ISO-8859-15, Windows-1252)
Islandzki  –  ISO-8859-1, (ISO-8859-15, Windows-1252)
Jidysz  –  UTF-8, (ISO-8859-8+, Windows-1255)
Litewski  –  ISO-8859-13, (Windows-1257, ISO-8859-4)
Łotewski  –  ISO-8859-13, (Windows-1257, ISO-8859-4)
Niderlandzki (holenderski)  –  ISO-8859-1, (ISO-8859-15, Windows-1252, ISO-8859-16°)
Niemiecki  –  ISO-8859-1, (ISO-8859-15, Windows-1252, ISO-8859-2, ISO-8859-16, ISO-8859-13, Windows-1257**)
Norweski  –  ISO-8859-1, (ISO-8859-15, Windows-1252)
Polski  –  ISO-8859-2, (ISO-8859-16, ISO-8859-4°, ISO-8859-13°, Windows-1250, Windows-1257°)
Portugalski  –  ISO-8859-1, (ISO-8859-15, Windows-1252)
Rosyjski  –  KOI8-R, Windows-1251, (ISO-8859-5)
Rumuński  –  ISO-8859-16, ISO-8859-2+, (Windows-1250+)
Serbski – cyrylica  –  Windows-1251, (ISO-8859-5)
Serbski – alfabet łaciński  –  ISO-8859-2, (Windows-1250, ISO-8859-16)
Słowacki  –  ISO-8859-2, (ISO-8859-16, Windows-1250)
Słoweński  –  ISO-8859-2, Windows-1250, (ISO-8859-16)
Szwedzki  –  ISO-8859-1, (ISO-8859-15, Windows-1252)
Turecki  –  ISO-8859-9, Windows-1254
Ukraiński  –  KOI8-U, KOI8-R+, (Windows-1251, ISO-8859-5)
Węgierski  –  ISO-8859-2, (ISO-8859-16, Windows-1250)
Wietnamski  –  UTF-8, Windows-1258+
Włoski  –  ISO-8859-1, (ISO-8859-15, Windows-1252, ISO-8859-16°)

° Kodowanie zawiera wszystkie litery danego języka, ale nie jest normalnie używane dla tego języka. Stosowanie tego kodowania może czasami wymagać wprowadzenia pewnych drobnych zmian w konfiguracji po stronie odbiorcy.
+ Kodowanie nie zawiera wszystkich znaków używanych w danym języku, choć wydaje się być stosowane mimo tego.
* W normalnym użyciu, gdy tekst zawiera jedynie znaki z zakresu US-ASCII, można stosować zupełnie dowolne kodowanie z UTF-8 włącznie. Jedynym efektem ubocznym może być sygnalizowanie błędu przez niektóre czytniki, że deklarowanego kodowania nie obsługują, ale sama treść będzie poprawnie widoczna.
** We wszystkich podanych kodowaniach litery z umlautami i litera „ostre s” znajdują się na tych samych pozycjach i teoretycznie mogą być używane wymiennie. Jedynym efektem ubocznym może być sygnalizowanie błędu przez niektóre czytniki, że deklarowanego kodowania nie obsługują, ale sama treść (w tym umlauty) będzie poprawnie widoczna.

Uwagi:

  1. Kodowania podane jako pierwsze są obowiązujące lub powszechnie stosowane w danym języku, kodowania w nawiasach – inne możliwe kodowania.
  2. Windows-1252 (CP-1252) to jest tzw. nadzbiór (superset) ISO-8859-1: różnica to dodatkowe znaki (€, ™, † itp.) obecne w Windows-1252 w zakresie, który w ISO-8859-1 jest zarezerwowany dla znaków sterujących. Stosowanie tych znaków może powodować problemy u niektórych odbiorców.
  3. Popularny czytnik Outlook Express pracujący na systemach wcześniejszych niż Windows XP SP2 nie obsługuje kodowania ISO-8859-13. Kodowanie Windows-1257 (CP-1257) obsługiwane przez OE to jest tzw. częściowo zgodny nadzbiór (superset) ISO-8859-13: różnica to znaki cudzysłowów w zakresie wspólnym (w Windows-1257 nie ma ich na tych pozycjach) oraz dodatkowe znaki (€, ™, † itp) obecne w Windows-1257 w zakresie, który w ISO-8859-13 jest zarezerwowany dla znaków sterujących. Stosowanie tych znaków może powodować problemy u niektórych odbiorców. Patrz tablica porównawcza, na której pokazane zostały znaki z Windows-1257, których z uwagi na kompatybilność zaleca się nie stosować.
  4. List zawierający wyłącznie litery łacińskie i cyfry (pisany bez narodowych znaków diakrytycznych, odpowiednik pisania polskawego lub pisany przy użyciu systemu transliteracji na alfabet łaciński) może być kodowany jako US-ASCII niezależnie od języka.
  5. Język angielski zasadniczo nie zawiera żadnych liter ze znakami diakrytycznymi, ale stosowane są one w pewnych zapożyczonych słowach i zwrotach (np. „tête-à-tête”) lub w niewielkiej ilości słów w starannej angielszczyźnie (np. „encyclopædia”). Normalnie w piśmie znaki diakrytyczne można pominąć (przeważająca większość osób anglojęzycznych tak robi, np. pisząc „tete-a-tete” lub „encyclopaedia”, oczywiście z wyjątkiem Amerykanów piszących „encyclopedia”). Dla zainteresowanych podaję listę znaków z górnego zakresu ASCII uważanych za litery występujące w angielskim: æ (dwuznak ae), ç (c z cedilą, c with cedilla), ï (i umlaut) i ô (o z daszkiem, o with circumflex).
  6. Każdy z ww. języków może być kodowany w unikodzie UTF-8, o ile odbiorca (odbiorcy) jest w stanie odczytać to kodowanie. UTF-8 pozwala na zakodowanie prawie wszystkich obecnie używanych języków na Ziemi oraz sporej ilości języków archaicznych i wymarłych.
  7. Czasem jeszcze można spotkać się z listami używającymi kodowania ISO-8859-1 i wymagającymi użycia hackowanej czcionki zawierającej w górnym zakresie ASCII znaki właściwe danemu językowi. Ta metoda była popularna w latach 90. ubiegłego wieku, gdy obsługa unikodu dopiero była powoli wprowadzana do systemów operacyjnych i aplikacji, powinna była już jakiś czas temu zaniknąć, ale niektórzy wciąż jej używają z przyzwyczajenia. Do odczytania listu potrzebna jest identyczna czcionka, do napisania listu w ten sposób – albo układ klawiatury, albo konwerter, albo specjalna aplikacja kodująca litery tego języka w kompatybilny sposób.
  8. Nie gwarantuje się poprawności danych na temat popularności czy powszechności użycia konkretnych kodowań w danym kraju. Użytkownik powinien się osobiście upewnić, w jakim kodowaniu powinien wysłać list do odbiorcy z danego kraju.
  9. Bardzo powszechnie stosowany, choć nienajlepszy, czytnik Outlook Express nie obsługuje kodowań ISO-8859-16 ani ISO-8859-13. Wysyłanie użytkownikom tego programu listów w kodowaniu ISO-8859-16 w zasadzie mija się z celem, a w ISO-8859-13 może sprawić trudności osobom mającym słaby poziom wiedzy o obsłudze tego programu.

2. Języki używane przez mniejszości narodowe i etniczne w Polsce

2.1 Mniejszości narodowe i sprawa pisania jednocześnie w języku mniejszości i polskim

Osoby należące do mniejszości narodowych mogłyby stosować ustawienia właściwe dla swojego języka (punkt powyżej). Problem pojawia się, gdy w jednym liście trzeba napisać tekst jednocześnie po polsku i w danym języku. Optymalnym kodowaniem jest unikod, ale czasem nie ma możliwości użycia unikodu, więc zamieściłem poniżej moje spostrzeżenia na temat możliwości użycia różnych kodowań dla różnych zestawień języków. Możliwe są następujące cztery sytuacje:

  1. Twój język może być kodowany w tej samej stronie kodowej, co język polski, czyli ISO-8859-2. Dotyczy to generalnie języków Europy Środkowej, Wschodniej i Południowej używających alfabetu łacińskiego (czeski, słowacki, węgierski itd. – zasadniczo wyjątkiem jest rumuński, który w idealnym wypadku kodowany jest w ISO-8859-16 – kodowaniu zawierającym również polskie znaki). Oczywiście w takiej sytuacji nie ma problemu z kodowaniem (domyślnie stosuje się ISO-8859-2), jedynie trzeba przełączać klawiaturę, by wpisać znaki z odpowiedniego języka. Inne kodowanie teoretycznie możliwe do zastosowania, ale niezalecane, to oczywiście Windows-1250. Przypadek w sumie najprostszy i nie wymagający jakichkolwiek komentarzy.
  2. Strona kodowa Twojego języka może zawierać również litery polskie. Ma to miejsce w przypadku strony kodowej określanej jako bałtycka. Strony kodowe ISO-8859-13 i Windows-1257 (niezalecana) zawierają również pełen zestaw polskich liter. A dokładnie to jest tak, że litery ą i ę są używane w języku litewskim, więc zasadniczo są to litery litewskie, które akurat wyglądają identycznie jak polskie; pozostałe można śmiało określić, że są to polskie litery. Polskie litery (i litery litewskie identyczne z polskimi) w tych stronach kodowych są rozmieszczone w innych miejscach, niż w ISO-8859-2, ISO-8859-16 czy Windows-1250, ale normalnie nie powoduje to żadnych problemów (pod warunkiem, że odbiorca nie ma ustawionego wymuszania charsetu określonego w listach przychodzących – ustawienie to nie jest zwykle potrzebne do niczego i może być śmiało wyłączone, ewentualnie odbiorca może ręcznie przestawić kodowanie):
  3. Istnieje takie kodowanie, które nie jest standardowo wykorzystywane do wysyłania listów w jednym z języków (albow żadnym z nich), ale pozwala na poprawne przekazanie liter ze znakami diakrytycznymi należącymi do obu języków. Jedynym problemem może być to, że niektórzy odbiorcy mogą mieć na stałe ustawione kodowanie listów przychodzących. Takie ustawienie nie jest do niczego potrzebne i może zostać bezpiecznie wyłączone albo można ręcznie przestawić kodowanie na odpowiednie:
  4. Nie ma żadnych kodowań wspólnych dla obu języków. Sytuacja ta ma miejsce w kombinacji języka polskiego z prawie każdym językiem zachodnioeuropejskim (z wyjątkiem angielskiego, niemieckiego i paru innych, które i tak domyślnie używają kodowania ISO-8859-1) i językami używającymi alfabetu innego od łacińskiego (rosyjski, białoruski, ukraiński, hebrajski i jidysz, arabski, chiński, koreański) i innych (esperanto, wietnamski, turecki). Masz wówczas do wyboru albo zakodować list w kodowaniu właściwym dla Twojego języka, a tekst polski wpisać bez ogonków, albo zakodować list w ISO-8859-2 i wpisać tekst polski normalnie, a tekst w Twoim języku w jakiś sposób przetworzony: bez znaków diakrytycznych lub ze znakami zapisanymi symbolicznie (dla języków opartych o alfabet łaciński), albo przy użyciu systemu transliteracji. Wybór metody zależy od Ciebie i odbiorcy – najważniejszą sprawą przecież jest to, byście mogli się możliwie najskuteczniej porozumieć.
    Desperacko poszukując rozwiązania należy pamiętać, że wiele osób uważa wysyłanie pustych maili z załącznikiem w formacie MS Word za bardzo niestosowne, poza tym nie każdy ma możliwość otwarcia takiego dokumentu. Mimo pewnych zalet tego rozwiązania bardzo stanowczo odradzam tę metodę radzenia sobie z kodowaniem tekstów wielojęzycznych. Jeżeli nie ma innej metody, polecam użycie możliwie uniwersalnego formatu (RTF jest równie dobry w dokumentach o mało skomplikowanym formatowaniu i powszechnie obsługiwany, nie mówiąc o formacie HTML, inny popularny format to Adobe PDF) i umieszczenie takiego dokumentu na serwerze (nawet darmowym), a przesłanie odbiorcy odsyłacza do tego dokumentu. Plik RTF można dodatkowo spakować. W żadnym wypadku nie wysyłać takiej kobyły mailem!

Ciekawostka: Język Maorysów (przedeuropejskich mieszkańców Nowej Zelandii) używa liter ze znakami diakrytycznymi tzw. nadkreślnikami lub makronami (prostymi kreskami nad literą), obecnymi w stronach kodowych ISO-8859-13, ISO-8859-4 i Windows-1257 (niezalecanym). W języku używanym na Indonezji używa się litery é (e z akcentem, e with acute accent), również obecnej w ww. stronie kodowej. Jest więc możliwe pisanie jednocześnie po estońsku, fińsku, indonezyjsku, litewsku, łotewsku, maorysku i polsku (i po angielsku, pomijając bardzo rzadko występujące znaki, głównie w słowach zapożyczonych) używając jednej strony kodowej. Jak komuś się przyda praktycznie ta informacja, to może niech się pochwali, bo to chyba będzie ewenement, by tak różne i odległe od siebie języki miały jedną wspólną stronę kodową, a ktoś rzeczywiście miałby potrzebę pisania jednocześnie w tych językach.

2.2 Mniejszości etniczne i ich języki, sprawa pisania jednocześnie w języku mniejszości i polskim

Poniżej zamieściłem dostępne mi informacje o językach mniejszości etnicznych żyjących w Polsce. Lista ta jest niepełna i bazuje na informacjach znalezionych w wielu miejscach na internecie. Podobnie jak w przypadku języków mniejszości narodowych, uwagi dotyczą sytuacji, gdy nie ma możliwości użycia unikodu (co byłoby rozwiązaniem optymalnym).

Ostatnia deska ratunku: Wszystkie programy do obsługi poczty i grup dyskusyjnych oraz wszystkie grupy dyskusyjne akceptują i poprawnie pokazują listy w US-ASCII – czyli pisane samym alfabetem łacińskim (po angielsku lub z użyciem jakiegoś systemu reprezentacji liter spoza US-ASCII względnie systemu transliteracji). Może to być ostatnią deską ratunku w beznadziejnych przypadkach, gdy nie da rady dopasować żadnego użytecznego kodowania.

Źródła: Alfabety świata link do str. zewnętrznej, lista alfabetów Europy link do str. zewnętrznej, Kaszubska Strona Informacyjna link do str. zewnętrznej, Pů našymu – portal języka śląskiego link do str. zewnętrznej, techniczne zagadnienia kodowania języka litewskiego link do str. zewnętrznej, obserwacje własne.

licznik