Jeśli jesteś właścicielem tej strony, możesz wyłączyć reklamę poniżej zmieniając pakiet na PRO lub VIP w panelu naszego hostingu już od 4zł!

Ogonki (nie tylko polskie) na stronach www – ustawienia przeglądarek www, używanie polskich (i innych) liter i znaków specjalnych na forach, w formularzach, bramkach www⇒mail i www⇒news

Na tej stronie omówione są dwie pokrewne sprawy: 1) prawidłowe wyświetlanie polskich liter (i innych liter ze znakami diakrytycznymi oraz z alfabetów niełacińskich) na stronach www przez przeglądarkę, 2) używanie polskich (i innych) liter w serwisach www: na forach dyskusyjnych, w komentarzach do artykułów prasowych i wpisów do blogów, w mailach i postach wysyłanych przez interfejs www.

Spis treści:

  1. Ustawienia przeglądarki www
    1. Konfiguracja przeglądarek graficznych
      1. Internet Explorer
      2. Konqueror
      3. Mozilla Firefox (ustawienia powinny tyczyć się też pakietu Seamonkey, następcy Mozilla Suite)
      4. Opera
    2. Konfiguracja przeglądarki tekstowej Lynx
    3. Problemy ze stronami www zawierającymi typowe błędy techniczne
      1. Brak deklaracji charsetu
      2. Użycie do tworzenia strony oprogramowania nie dostosowanego do tworzenia stron www w innych językach lub kodowaniach
      3. Deklarowanie czcionek nieunikodowych
      4. Użycie osadzonych czcionek
    4. Polskie litery i inne znaki narodowe w appletach Javy
  2. Używanie ogonków na forach, w wyszukiwarkach, w webmailach
    1. Szczególne problemy i ograniczenia przy korzystaniu z webmaili
      1. Szczególne wady webmaila Onetu
      2. Szczególne wady webmaila Interii
      3. Możliwe szczególne wady innych bramek www⇒news i webmaili (zagranicznych)
    2. Sprawdzanie pisowni na www
      1. Mozilla Firefox (informacje powinny tyczyć się też pakietu Seamonkey, następcy Mozilla Suite)
      2. Opera
      3. Dodatki dla Internet Explorera
    3. Dodatek: ROT13
    4. Polskie litery (i inne znaki narodowe i specjalne) w chatach opartych o applet Javy

Taki znaczek: link do str. zewnętrznej przy odsyłaczu oznacza, że odsyłacz prowadzi do strony zewnętrznej.
A taki znaczek: link prowadzi do podstrony – że odsyłacz prowadzi do innej strony w tym serwisie.

1. Ustawienia przeglądarki www

Oglądanie stron www (prawidłowo napisanych i umieszczonych na poprawnie skonfigurowanych serwerach) zawierających polskie litery na w miarę współczesnych komputerach nie wymaga żadnych dodatkowych zabiegów. Przeglądarki od około 10 lat rozumieją deklarację charsetu i odpowiednio wyświetlają litery ze znakami diakrytycznymi, zaś prawidłowo połatane Windowsy, w miarę nowe dystrybucje Linuksa i Mac OS X mają zainstalowane odpowiednie, wielojęzyczne czcionki unikodowe. Może się jedynie zdarzyć, że w przeglądarce będzie ustawiony na sztywno jakiś charset (np. w jakimś kraju zachodnim będzie to ISO‑8859‑1 – to częsty powód problemów), wówczas należy przejrzeć opcje i zmienić ustawienie na wybór automatyczny. Inny możliwy problem to ustawienie w opcjach przeglądarki starych czcionek nieunikodowych – należy je zmienić. W bardzo, ale to bardzo rzadkich przypadkach, może być konieczna instalacja czcionek unikodowych i obsługi języków innych niż zachodnioeuropejskie (np. języków środkowoeuropejskich). Aby sprawdzić, czy Twoja przeglądarka jest przystosowana do obsługi różnych języków, wejdź na strony Test obsługi unikodu w przeglądarkach link prowadzi do podstrony, a następnie Test obsługi kodowania 8‑bitowego w przeglądarkach link prowadzi do podstrony i sprawdź, czy u Ciebie obie strony wyświetlają się prawidłowo. Na stronach są też proste porady, jak poprawić ustawienia przeglądarki.

1.1. Konfiguracja przeglądarek graficznych

Konfiguracja sprowadza się do kilku podstawowych opcji:

  1. Sprawdzenie, czy w systemie zainstalowane są czcionki unikodowe zawierające znaki z interesujących nas języków i czy czcionki te są poprawnie wybrane w opcjach przeglądarki,
  2. Ustawienie w przeglądarce opcji automatycznego wyboru charsetu wyświetlanych stron,
  3. Ustawienie domyślnego charsetu dla stron www, które nie mają deklaracji charsetu,
  4. Ustawienie preferencji, w jakich językach najchętniej byśmy widzieli wyświetlaną stronę.

Niektóre z ww. opcji mogą być poprawnie ustawione od razu po zainstalowaniu programu, zależy to od wersji językowej programu i ustawień językowych systemu operacyjnego.

Uwaga do ostatniego punktu: istnieją serwery, na których istnieją strony dostępne w różnych tłumaczeniach. Serwer taki może być tak skonfigurowany, że na podstawie informacji z przeglądarki wyśle daną stronę w odpowiednim języku, zgodnie z preferencją użytkownika. Czyli np. Anglik klikając na link www.serwer.com/strona.html otrzyma tę stronę po angielsku, Polak klikając ten sam link – po polsku, zaś Rosjanin – po rosyjsku (link jest fałszywy i służy tylko do demonstracji, w rzeczywistości nie jest klikalny!).

1.1.1. Internet Explorer

Uwaga: opis dotyczy wersji 8, opis konfiguracji wersji 6.0 SP1 jest dostępny na podstronie Konfiguracja starszych wersji przeglądarek.

Internet Explorer może wymagać sprawdzenia i poprawienia następujących ustawień: należy w oknie opcji (Narzędzia ⇒ Opcje internetowe… ⇒ zakładka Ogólne):

wejść w opcje czcionek (przycisk Fonty… – czerwona strzałka nr 1) i sprawdzić, czy dla języków opartych na danym alfabecie (np. dla języka polskiego – łacińskim) wybrane są czcionki unikodowe:

Preferencje dotyczące języków, w jakich najchętniej użytkownik czyta strony www, ustawia się w opcjach języków, w które wchodzi się również z zakładki Ogólne okna opcji internetowych klikając na przycisk Języki… (czerwona strzałka nr 2). Język umieszczony najwyżej na liście to język najchętniej widziany:

IE nie ma opcji wyboru domyślnego kodowania stron bez deklaracji charsetu, ale ma dość dobrze działającą funkcję wykrywania charsetu strony www: należy przy Widok ⇒ Kodowanie ⇒ Automatyczny wybór umieścić ptaszka:

Gdyby na jakiejś stronie ten mechanizm zawiódł, należy go, rzecz jasna, wyłączyć i spróbować znaleźć właściwe kodowanie wybierając ręcznie możliwy charset z listy rozwijanej. Po wyłączeniu funkcji automatycznego rozpoznawania charsetu wybór z menu Widok ⇒ Kodowanie (ang. View ⇒ Encoding) czasem jest zapamiętywany, zwłaszcza w jednej sesji.

Istnieje możliwość umieszczenia na pasku narzędziowym IE przycisku szybkiej zmiany charsetu w sposób analogiczny, jak to się robi w OE – patrz instrukcja dodania przycisku zmiany kodowania w OE link prowadzi do podstrony. Gdy natrafi się na stronę używającą kodowania odmiennego od ustawionego domyślnego, lecz niezadeklarowanego, można zmienić używane kodowanie przy użyciu tego przycisku (lub z menu Widok ⇒ Kodowanie). Uwaga: należy unikać przełączania na UTF-7 (jeżeli to kodowanie jest dostępne w menu), gdyż na specjalnie skonstruowanych stronach www może to wywołać wykonanie złośliwego skryptu, np. ujawniającego dane personalne (np. login i hasło do serwisu niezwiązanego z wyświetlaną stroną).

Polecam instalację dodatku IE7Pro link do str. zewnętrznej, który dodaje wiele użytecznych funkcji (np. blokowanie reklam) i opcji konfiguracyjnych. Dodatek jest dostępny za darmo i wbrew nazwie świetnie działa również z IE8.

1.1.2. Konqueror

Należy upewnić się, że w opcjach czcionek używanych do wyświetlania stron wybrane zostały czcionki unikodowe lub chociaż zawierające znaki używane w językach wyświetlanych stron. W opcje czcionek wchodzi się z menu Ustawienia ⇒ Konfiguracja: Konqueror… (ang. Settings ⇒ Configure Konqueror…) i wybierając pozycję Czcionki:

Warto pamiętać, że np. czcionki rodziny Bitstream Vera, choć teoretycznie unikodowe, zawierają komplet znaków jedynie z ISO‑8859‑1, z pozostałych teoretycznie obsługiwanych zakresów unikodu zawierają jedynie po kilka przykładowych znaków (na przykład brak większości polskich liter – obecne są tylko Ć, ć, Ł, ł, no i oczywiście Ó, ó obecne również w ISO‑8859‑1). W tym samym oknie ustawia się też kodowanie domyślne dla stron www niezawierających deklaracji użytego charsetu. Producent przeglądarki zaleca wybór automatyczny oparty na języku, ale możliwy też jest wybór jednego konkretnego charsetu z listy rozwijanej.

Należy również zwrócić uwagę, by w opcjach kodowania był zaznaczony wybór automatyczny: Widok ⇒ Ustaw kodowanie ⇒ Rozpoznawanie automatyczne ⇒ Półautomatyczne:

Gdy natrafi się na stronę bez deklaracji charsetu, na której widać krzaki, można z tego samego menu wybrać właściwe kodowanie (z podmenu Widok ⇒ Ustaw kodowanie ⇒ Ręczne; ang. View ⇒ Set Encoding ⇒ Manual).

Preferencje dotyczące języków, w jakich najchętniej użytkownik czyta strony www, ustawia się przez edycję wpisu w pliku $KDEHOME/share/config/kioslaverc lub $KDEHOME/share/config/kio_httprc:
Languages=pl,en-GB,en,de,ru
Jako pierwszy umieszcza się język najchętniej widziany na stronach www.

1.1.3. Mozilla Firefox

Uwaga: opis dotyczy wersji 3.6, 3.5 i 3.0, opis konfiguracji wersji 2.0.x, 1.5.x i 1.0.x jest dostępny na podstronie Konfiguracja starszych wersji przeglądarek.

Nazwa poprawnie pisana jest Firefox. Inny zapis, taki jak Fire Fox, Fire-Fox, czy FireFox, jest niepoprawny. Stąd „FF” jako skrót nazwy nie jest zgodny z zasadami tworzenia skrótów w polskim języku (za czasów PRL-u był sprzedawany bodajże płyn do prania o nazwie FF). Producent zaleca stosowanie skrótu Fx, inna możliwość, zgodna z zasadami tworzenia skrótów w języku polskim, to Ff. Odmiana: Firefoksa lub Firefoxa, Firefoxem lub Firefoksem, Firefoksie. Forma „Firefoxie” jest niepoprawna. Ponieważ nazwa nie jest skrótowcem ani nie kończy się na głoskę niemą, końcówki fleksyjnej nie oddziela się dywizem ani apostrofem.

Pokazane tu zrzuty ekranu pochodzą z wersji 3.0. W wersji 3.5 dokonano minimalnych zmian kosmetycznych, ale wszystkie opisywane opcje konfiguracyjne są w opisywanych miejscach i zachowały swoje funkcje.

Nie wszystkie opcje konfiguracyjne są dostępne z poziomu interfejsu graficznego, niektóre zmiany trzeba wprowadzać bezpośrednio w pliku konfiguracyjnym prefs.js znajdującym się w katalogu profilu. Zmiany te można wprowadzać na dwa sposoby:

  1. Wpisując w pasku adresu
    about:config
    i naciskając Enter. Otworzy się edytor ustawień. W edytorze ustawień należy szukać tylko tej części wpisu, która jest na żółtym tle. W przypadku dodawania nieistniejących jeszcze wpisów należy dodawać jedynie samą treść wpisu, bez poprzedzającego user_pref(", przecinka między nazwą wpisu i wartością, cudzysłowów ani kończącego );. Przyjrzyj się już istniejącym wpisom w tym oknie i na pewno zobaczysz, co wpisywać, a czego nie. Kliknięcie drugim przyciskiem myszy na danej linii konfiguracyjnej wywołuje menu kontekstowe, w którym znajduje się m.in. pozycja „Modyfikuj” (dla wpisów typu Ciąg /ang. String/ i Liczba naturalna /ang. Integer/) lub Przełącz (dla wpisów typu Logiczne /ang. Boolean/). Linię modyfikuje się wprowadzając tekst na zielonym tle w danym wpisie (dla linii typu Ciąg) czy też liczbę (dla linii typu Liczba naturalna), względnie przełączając wartość logiczną z True na False lub vice versa. Zmiany wprowadzone tą metodą mają efekt natychmiastowy (nie ma konieczności restartu).
  2. Bezpośrednia edycja pliku konfiguracyjnego prefs.js – należy pamiętać, by edytować właściwy plik (gdy posiada się więcej niż jeden profil), i by edytować ten plik po zamknięciu wszystkich okien programu, w przeciwnym razie zmiany mogą zostać usunięte po restarcie. Zalecane jest zrobienie kopii zapasowej pliku przed wprowadzaniem zmian. Plik ten można edytować dowolnym edytorem tekstowym. W przypadku bezpośredniej edycji pliku może się zdarzyć, że danej linii w nim nie będzie – tak się zdarza, gdy dana linia ma wartość domyślną. W takiej sytuacji należy dodać kompletną linię, jak zamieszczone w poniższym tekście (można kopiować z tej strony i wstawiać bezpośrednio w plik). Należy pamiętać, że plik ten jest ładowany do pamięci w momencie uruchomienia programu i zapisywany na nowo po każdym zamknięciu programu, wtedy wszystkie linie są zapisywane alfabetycznie – więc nie należy się dziwić, że wpis, który został dodany na samym końcu, nagle z końca zniknął. Inną metodą jest utworzenie w katalogu profilu pliku tekstowego i zmiana jego nazwy na user.js, a następnie dodanie w nim wymaganych wpisów, jak w przypadku dodawania do prefs.js. Plik user.js można edytować w dowolnym momencie (również gdy program jest uruchomiony), wpisy w nim zawarte zostaną wprowadzone do prefs.js w momencie kolejnego uruchomienia programu. Z tego wynika, że zmiany ustawień metodą edycji prefs.js lub user.js są stosowane od startu (lub restartu) programu. Należy też koniecznie pamiętać, że aby usunąć wpis dokonany tą metodą (przywrócić wartość domyślną wpisu), nie wystarczy go usunąć z user.js – należy go również usunąć z prefs.js (po zamknięciu wszystkich okien programu).

Zmiana języka interfejsu: w miarę potrzeby można zmienić język interfejsu na polski w następujący sposób:

  1. Połącz się z następującym adresem: ftp.mozilla.org/pub/mozilla.org/firefox/releases/ link do str. zewnętrznej
  2. Wybierz wersję programu – koniecznie taką samą, do jakiej chcesz doinstalować polski interfejs, następnie platformę, a następnie wejdź do katalogu xpi.
  3. Pobierz plik pl.xpi i zainstaluj jak każde inne rozszerzenie
  4. Otwórz edytor konfiguracji
  5. Znajdź wpis general.useragent.locale
  6. Zapamiętaj (najlepiej zapisz gdzieś) istniejącą wartość, a następnie zmień ją na pl
  7. Zrestartuj program
  8. Oryginalny język interfejsu przywraca się analogicznie, choć nie trzeba już instalować pliku językowego dla oryginalnego języka

Wspomniany wpis można też wprowadzić bezpośrednio w pliku konfiguracyjnym:

user_pref("general.useragent.locale", "pl");

Mozilla Firefox może wymagać sprawdzenia i poprawienia następujących ustawień: często przyczyną problemów jest autodetekcja charsetu. Autodetekcja ma priorytet nad deklaracją charsetu w nagłówku wyświetlanej strony. W Widok ⇒ Kodowanie ⇒ Autodetekcja należy zaznaczyć opcję „Wyłączona”:

W przypadku włączenia autodetekcji w prefs.js będzie obecna następująca linia:

user_pref("intl.charset.detector", "XXX");

Wykasowanie linii (lub usunięcie jej wartości) odpowiada wyłączeniu autodetekcji.

Warto ustawić domyślny charset dla stron nie zawierających deklaracji użytego kodowania: należy wejść otworzyć Opcje (Windows: Narzędzia ⇒ Opcje…; ang. Tools ⇒ Options…, Linux: Edycja ⇒ Opcje…; ang. Edit ⇒ Options…):

kliknąć na Zaawansowane… (strzałka nr 1, ang. Advanced…) i w nowo otwartym oknie ustawić domyślny charset dla stron www nie zawierających deklaracji charsetu. W polskich warunkach i w przypadku innych języków zachodniosłowiańskich będzie to iso‑8859‑2, jeżeli większość źle wyświetlających się stron używa innego kodowania, to należy tam wybrać kodowanie odpowiednie dla tych problematycznych stron:

Odpowiada to wpisowi w prefs.js:

user_pref("intl.charset.default", "ISO-8859-2");

Warto też w tym samym oknie sprawdzić, czy dla wszystkich skryptów są wybrane czcionki unikodowe zawierające znaki z danego skryptu. W przypadku unikodu (nazwanego z niewiadomych powodów „Inne języki”, lub po angielsku „Other languages”) dobrze jest wybrać czcionkę zawierającą możliwie pełen zestaw znaków unikodu. Należy tu wspomnieć, że Firefox posiada bardzo dobrze działający system substytucji fontów: jeżeli czcionka używana do wyświetlania treści nie zawiera jakiegoś znaku, program postara się znaleźć czcionkę zawierającą ten znak, i w przypadku powodzenia wyświetli ten znak z użyciem tej znalezionej czcionki. Ustawienia czcionek odpowiadają wpisom w prefs.js:

W powyższych liniach XXX oznacza wariant regionalny. Przykładowe nazwy:
x-western – języki krajów Europy Zachodniej
x-baltic – Języki krajów bałtyckich
x-central-euro – języki krajów Europy Środkowej
x-cyrillic – cyrylica
x-unicode – unikod (w menu występuje jako Inne języki)
• ar – arabski
• el – grecki
• he – hebrajski
• tr – turecki

Aby ustalić preferencje dotyczące języków, w jakich najchętniej użytkownik czyta strony www, należy otworzyć okno opcji (Windows: Narzędzia ⇒ Opcje…; ang. Tools ⇒ Options…, Linux: Edycja ⇒ Opcje…; ang. Edit ⇒ Options…), na zakładce Zawartość (ang. Content) kliknąć na Wybierz… (czerwona strzałka nr 2):

i w nowo otwartym oknie wybrać preferowane języki. Język umieszczony najwyżej na liście to język najchętniej widziany:

ustawienie to odpowiada wpisowi w prefs.js:

user_pref("intl.accept_languages", "pl,en-GB,en");

Gdy natrafi się na stronę używającą kodowania odmiennego od ustawionego domyślnego, lecz niezadeklarowanego, można zmienić używane kodowanie z menu Widok⇒ Kodowanie (ang. View ⇒ Character Encoding). Uwaga: należy unikać przełączania na UTF-7 (jeżeli to kodowanie jest dostępne w menu), gdyż na specjalnie skonstruowanych stronach www może to wywołać wykonanie złośliwego skryptu, np. ujawniającego dane personalne (np. login i hasło do serwisu niezwiązanego z wyświetlaną stroną).

Należy przypuszczać, że w podobny sposób konfiguruje się przeglądarkę z pakietu Mozilla Seamonkey, ale nie mam możliwości sprawdzenia.

Warto rozważyć dokonanie jeszcze jednej zmiany. Choć Firefox (i inne programy oparte o silnik Gecko) doskonale sobie radzi ze standardem XHTML, podczas kontaktowania się z serwerem wysyła informację, że mu wszystko jedno, czy dostanie dokument w formacie HTML, czy XHTML (zachowanie to jest odmienne od zachowania wersji 2.0.0.x). Niektóre serwery w takiej sytuacji wysyłają HTML. Zachowanie to można zmienić edytując jedną linię konfiguracyjną jak pokazano poniżej:

user_pref("network.http.accept.default", "application/xhtml+xml,application/xml;q=0.9,text/html;q=0.8,*/*;q=0.7");

1.1.4. Opera

Uwaga: opis dotyczy wersji 10.x, 9.x i 8.x, opis wersji wcześniejszych jest dostępny na podstronie Konfiguracja starszych wersji przeglądarek. Niektóre zrzuty ekranu pochodzą z wersji 8, w wersjach 9 i 10 dokonano niewielkich zmian kosmetycznych, ale wszystkie opisywane opcje konfiguracyjne są w opisywanych miejscach i zachowały swoje funkcje. Niektóre uwagi mogą nie dotyczyć najnowszej wersji.

Wsparcie producenta dla wersji 8.x i 9.x zakończyło się. Najwyższe wypuszczone wersje tych generacji to 8.54 i 9.64. Bardzo zalecana jest aktualizacja do aktualnej wersji.

Nie wszystkie opcje konfiguracyjne są dostępne z poziomu interfejsu graficznego, niektóre zmiany trzeba wprowadzać bezpośrednio w pliku konfiguracyjnym opera6.ini znajdującym się w katalogu profilu. Zmiany te można wprowadzać na dwa sposoby:

  1. Można wpisać w pasku adresu
    opera:config
    i nacisnąć Enter. Otworzy się edytor ustawień. Zmiany wprowadzone tą metodą mają w większości efekt natychmiastowy, ale niektóre ustawienia wymagają restartu. Edytor ustawień został wprowadzony w wersji 9.0.
    (ciekawostka: identycznie działa też wpisanie adresu about:config znanego z Mozilli)
  2. Bezpośrednia edycja pliku konfiguracyjnego opera6.ini – należy pamiętać, by edytować właściwy plik (gdy posiada się więcej niż jeden profil) i by edytować ten plik po zamknięciu wszystkich okien programu, w przeciwnym razie zmiany mogą zostać usunięte po restarcie. Zalecane jest zrobienie kopii zapasowej pliku przed wprowadzaniem zmian. Plik ten można edytować dowolnym edytorem tekstowym, choć lepszy jest edytor tekstowy obsługujący unikod (UTF‑8), gdyż tego kodowania używają pliki konfiguracyjne Opery. Jest to jedyna metoda edycji dostępna w przeglądarkach w wersjach wcześniejszych od 9.0.

Wcześniejsze wersje Opery (do 9.5) dla Windows domyślnie miały ustawione używanie czcionki nieunikodowej Terminal do wyświetlania tekstu, który został zadeklarowany jako do wyświetlenia czcionką fantazyjną (fantasy); w wersji 9.6 domyślną czcionką jest już Arial (unikodowy). Opera w wersji 8.x miała też ustawione używanie czcionki Courier do wyświetlania tekstu, który został zadeklarowany jako o stałej szerokości (monospace), w wersji 9.x domyślną czcionką jest już Courier New (unikodowy). Bardzo zalecam zmianę tych czcionek we wcześniejszych wersjach, odpowiednio na np. Impact i (w przypadku wersji 8.x) Courier New (albo inną o stałej szerokości). Warto przy okazji sprawdzić, czy dla wszystkich innych deklaracji css są ustawione czcionki unikodowe. Czcionkę zmienia się zaznaczając daną klasę css, a następnie klikając na przycisk „Wybierz” (czerwona strzałka nr 1):

Podobnie w Operze 8 w dwóch arkuszach stylów, mianowicie „nostalgia.css” i „textonly.css” definiowane są nieunikodowe czcionki FixedsysCourier (w linii font-family: Fixedsys, "Courier New", Courier, monospace !important;). Wystarczy je usunąć (font-family: "Courier New", monospace !important;), by strony ładnie i bez problemu się wyświetlały. Należy przy tym pamiętać, że każda instalacja Opery (nowej wersji lub reinstalacja) nadpisuje pliki css standardowymi.

Warto też sprawdzić, czy dla każdego zakresu unikodu (np. dla języka polskiego – Latin extended A) wybrane są czcionki unikodowe zawierające co najmniej komplet znaków z tego zakresu. Dokonuje się tego w oknie otwieranym przez kliknięcie przycisku „Fonty międzynarodowe…” (ang. „International fonts…”) – czerwona strzałka nr 2. Dla każdego zakresu unikodu, wybieranego z listy rozwijanej, można wybrać albo domyślną czcionkę (zdefiniowaną w poprzednim kroku), albo specyficzną, zawierającą znaki z tego zakresu:

Należy tu wspomnieć, że Opera posiada stosunkowo dobrze działający system substytucji fontów: jeżeli czcionka używana do wyświetlania treści nie zawiera jakiegoś znaku, program postara się znaleźć czcionkę zawierającą ten znak, i w przypadku powodzenia wyświetli ten znak z użyciem tej znalezionej czcionki. Niestety czasem substytucja daje przykry efekt tzw. przesunięć (bo znak z innej czcionki nie jest dopasowywany do reszty tekstu).

Należy również zwrócić uwagę na to, by w menu Widok ⇒ Kodowanie (ang. View ⇒ Encoding) był zaznaczony Automatyczny wybór:

Aby ustalić domyślny charset dla stron bez jego deklaracji i preferencje dotyczące języków, w jakich najchętniej użytkownik czyta strony www, należy otworzyć okno ustawień i na zakładce Ogólne (ang. General) kliknąć na Szczegóły… (ang. Details…):

i w nowo otwartym oknie wybrać preferowane języki (pole oznaczone jedynką). Język umieszczony najwyżej na liście to język najchętniej widziany. W tym samym oknie, z listy rozwijanej na dole, wybiera się charset najczęściej czytanych stron, które nie mają deklaracji (strzałka z numerem 2):

Odpowiada to wpisowi w pliku Opera6.ini, w sekcji [Network] ([Adv User Prefs] w Operze 8):

HTTP Accept Language=pl,en;q=0.9

Gdy natrafi się na stronę używającą kodowania odmiennego od ustawionego domyślnego, lecz niezadeklarowanego, można zmienić używane kodowanie z menu Widok ⇒ Kodowanie. Uwaga: należy unikać przełączania na UTF-7 (jeżeli to kodowanie jest dostępne w menu), gdyż na specjalnie skonstruowanych stronach www może to wywołać wykonanie złośliwego skryptu, np. ujawniającego dane personalne (np. login i hasło do serwisu niezwiązanego z wyświetlaną stroną).

Zmiana języka interfejsu została opisana na stronie poświęconej klientowi M2 link prowadzi do podstrony.

Warto rozważyć dokonanie jeszcze jednej zmiany. Choć Opera doskonale sobie radzi ze standardem XHTML, podczas kontaktowania się z serwerem wysyła informację, że woli dokumenty w formacie HTML. Zachowanie to można zmienić wstawiając w pliku Opera6.ini w sekcji [Network] (w Operze 8 jest to sekcja [Adv User Prefs]) następującą linię:

HTTP Accept=application/xml, application/xhtml+xml, text/html;q=0.9, image/png, image/jpeg, image/gif, image/x-xbitmap, */*;q=0.1

Jest to prosta modyfikacja domyślnego zestawu typów plików przesyłanego przez Operę 8.x i 9.x, w której zamienione zostały priorytety typu text/htmlapplication/xml, application/xhtml+xml.

Uwaga: w Operze 8.x można również otworzyć okno opcji znane z wersji 6.x i 7.x. Wskazówki na temat wykorzystania jego można znaleźć na stronie poświęconej starszym wersjom przeglądarek.

W Operze 9 w związku z niesławnym patentem firmy eolas celowo zepsuto obsługę osadzonych elementów, które teraz wymagają uprzedniego kliknięcia na nie, by można było je obsługiwać (uruchomić, ale i np. zamknąć reklamę). W poprzednich wersjach można to było porawić skryptem użytkownika link do str. zewnętrznej, ale skrypt ten nie działa u mnie z wersjami 9.5x i 9.6x (sprawiał też problemy z wersjami 9.2x). Można natomiast poprawić plik opera.dll według instrukcji link do str. zewnętrznej (po angielsku). Dostępna też jest inna instrukcja link do str. zewnętrznej dla wersji 10alpha dla Linuksa.

1.2. Konfiguracja przeglądarki tekstowej Lynx

Lynx jest przeglądarką tekstową – nie wyświetla obrazków i ma bardzo ograniczoną obsługę stylów. Jest za to niezwykle szybki (wynika to zarówno z szybkości działania samego programu, jak i tego, że ściąga on sam tekst, bez grafiki, tła, animacji Flash, bannerów reklamowych, appletów Javy i innych tego typu obiektów, których sumaryczna wielkość potrafi przekroczyć wielkość samego kodu HTML nawet dziesięciokrotnie i więcej), ma bardzo niewielkie wymagania sprzętowe i można go uruchomić nawet z dyskietki lub pendrive’a USB. Z informacji dostępnych w sieci można wywnioskować, że Lynx bardzo dobrze współpracuje z programami czytającymi na głos treść stron www i z tego powodu jest chętnie wykorzystywany przez niewidomych i niedowidzących. Oprócz wersji dla Linuksa istnieją wersje dla 32‑bitowych Windowsów, a nawet dla DOS (do działania niezbędny jest dodatkowo packet driver). Wersję dla DOS można również uruchomić w oknie DOS Windowsów 3.x.

1.2.1. Konfiguracja przeglądarki tekstowej Lynx pod Windows

Lynx na systemach Windows uruchamiany jest w oknie DOS lub oknie konsoli (w zależności od rodziny Windowsów). Sam z siebie z uwagi na swoją budowę nie jest w stanie obsłużyć unikodu spoza tego zbioru znaków, jaki jest zawarty w nieunikodowej czcionce ekranowej używanej w oknie DOS (lub w przypadku konsoli – w wybranej stronie kodowej). Jak dotąd nie udało mi się uruchomić Lynksa w oknie konsoli ustawionej na charset UTF‑8.

Na systemach Windows 95, 98 i ME możliwe jest prawidłowe wyświetlenie polskich liter tylko na komputerach, na których skonfigurowany został locale polski lub inny z grupy środkowoeuropejskich (np. czeski, słowacki, węgierski, rumuński, chorwacki) – używający w oknie DOS strony kodowej CP852, względnie z grupy języków bałtyckich (litewski, łotewski, estoński) – używający w oknie DOS strony kodowej CP775 (są to jedyne strony kodowe obsługiwane przez MS‑DOS, zawierające polskie litery). W pliku LYNX.RC należy znaleźć linię character_set= i w niej wpisać po znaku równości odpowiednio albo Eastern European (cp852), albo Baltic (cp775), gdyż takiego kodowania używa okno DOS. Ustawienie to można również wprowadzić przez wybór z listy rozwijanej po otwarciu okna opcji (klawisz O): zaznaczyć opcję zapisania konfiguracji na dysk podświetlając opcję Save options to disk: i naciskając Enter tak, by między nawiasami pojawił się X, następnie przejść na pozycję Display character set i nacisnąć Enter, wybrać Eastern European (cp852) względnie Baltic Rim (cp775) (odpowiednio do locale systemowego) i nacisnąć Enter, po zmianie kodowania podświetlić pozycję Accept changes i nacisnąć Enter. Prawidłowo pokazane zostaną tylko te znaki, które istnieją w stronie kodowej DOS CP852 względnie CP775, pozostałe albo będą przedstawione w postaci opisowej, albo zostaną pozbawione diakrytyków, albo wystąpią jako znaki zapytania, albo jako puste miejsca (jeżeli są to rzadko używane znaki). W systemach mających odmienne ustawienia międzynarodowe locale i w związku z tym używających innej strony kodowej, nie ma możliwości wyświetlenia polskich liter. Informację o ustawieniach regionalnych dla DOS można uzyskać oglądając np. wpis w pliku autoexec.bat: mode con codepage prepare. Brak tej linii oznacza, że system używa domyślnej w DOS strony kodowej CP437. Doraźna zmiana kodowania jest możliwa, ale jest bardzo uciążliwa i ma skutki uboczne: jeżeli jakikolwiek plik lub katalog na danym komputerze jest nazwany z użyciem znaków spoza US‑ASCII, po zmianie strony kodowej systemu plik ten (i wszystkie pliki w takim katalogu i jego podkatalogach) stanie się niedostępny, zaś użycie programów narzędziowych do dysku twardego (np. scandisk) zwykle pociągnie za sobą wykrycie nieprawidłowej nazwy i jej zmianę. Lynx ma dobrze działającą logikę reprezentacji znaków narodowych, gdy nie można ich pokazać poprawnie, i większość polskich liter zostanie pozbawiona ogonków (z wyjątkiem ł, która to litera zostanie pokazana jako l/). Patrz też niżej.

Na systemach linii NT – Windows NT4, 2000, XP i 2003 Server – sesje pełnoekranowe konsoli zawsze używają kodowania DOS właściwego dla locale systemu, z czego wynikają ograniczenia identyczne, jak w przypadku systemów Windows9x i ME. Zmiana locale systemu w tych systemach nie grozi kłopotami z dostępem do plików, w nazwach których są znaki spoza US‑ASCII, ale wymaga uprawnień administratora. Natomiast konsola uruchomiona w trybie okna w systemach Windows 2000, XP i 2003 Server (i prawdopodobnie również Windows NT 4.0, ale nie mam możliwości sprawdzenia) jest w stanie obsłużyć dowolne kodowanie stronicowane, dla którego w systemie istnieje tablica przekodowań. Kodowanie przełącza się poleceniem CHCP xxx, gdzie xxx to kod kodowania. Kodowanie DOS CP852 ma kod 852, kodowanie Windows‑1250 – 1250, zaś kodowanie ISO‑8859‑2 – 28592. Aby móc korzystać z kodowania innego niż DOS i nie być uzależnionym od locale używanego komputera, należy w opcjach konsoli (lub we właściwościach skrótu uruchamiającego program) wybrać używanie czcionki Lucida Console (lub innej czcionki unikodowej, o ile istnieje taka możliwość – patrz artykuł Q247815 link do str. zewnętrznej – dostępny tylko w języku angielskim), w przeciwnym wypadku niektóre litery ze znakami diakrytycznymi i znaki specjalne zostaną popsute. Użytkownikom tych systemów operacyjnych w przypadku czytania tekstów w języku polskim zalecam używanie kodowania Windows‑1250, gdyż zawiera najwięcej znaków częściej lub rzadziej spotykanych w polskich tekstach na internecie (np. „prawidłowe cudzysłowy”, znak ©opyrightu, znak €uro, myślniki itd.) – w tym celu należy otworzyć okno konfiguracji klawiszem O, zaznaczyć opcję zapisania konfiguracji na dysk podświetlając opcję Save options to disk: i naciskając Enter tak, by między nawiasami pojawił się X, następnie przejść na pozycję Display character set i nacisnąć Enter, wybrać Eastern European (windows‑1250) i nacisnąć Enter, po zmianie kodowania podświetlić pozycję Accept changes i nacisnąć Enter. Można też tę zmianę wprowadzić drogą bezpośredniej edycji pliku konfiguracyjnego: w pliku LYNX.RC należy znaleźć linię character_set= i w niej wpisać po znaku równości Eastern European (windows-1250). Dodatkowo w pliku LYNX.BAT jako pierwszą linię wpisać CHCP 1250, zaś we właściwościach skrótu do pliku LYNX.BAT na zakładce „Czcionka” (ang. „Font”) należy zaznaczyć używanie czcionki True Type – w Windows 2000 jedyną taką czcionką, którą można wybrać, jest Lucida Console (o ile nie wprowadzono zmian opisanych we wspomnianym powyżej artykule Bazy Wiedzy MS). Wybór kodowań możliwy jest wyłącznie w oknie, w trybie pełnoekranowym dostępne jest wyłącznie odpowiednie kodowanie DOS, właściwe dla locale systemu. Próby uruchomienia Lynxa w oknie konsoli ustawionej na charset UTF‑8 (poleceniem chcp 65001) nie dały pozytywnych rezultatów. Zgodnie z opiniami umieszczonymi na kilku forach dyskusyjnych 4NT link do str. zewnętrznej jest konsolą unikodową dla systemów Windows 2000 i wyższych (produkt komercyjny).

Lynx w swoich opcjach konfiguracyjnych posiada opcje konfiguracji domyślnego charsetu dla stron bez deklaracji (zwaną Assumed document character set) i preferowanych języków (zwaną Preferred document language). Obie opcje konfiguruje się na ekranie opcji, który otwiera się skrótem klawiaturowym O, wpisując bezpośrednio z klawiatury wpisy w danych pozycjach. Lynx nie posiada opcji ręcznej zmiany charsetu wyświetlanej strony, możliwa jest jedynie zmiana charsetu wyświetlanej strony nie zawierającej deklaracji charsetu przez zmianę opcji Assumed document character set.

1.2.2. Konfiguracja przeglądarki tekstowej Lynx pod Linuksa

Lynx uruchomiony w XTerm (unicode) w pełni obsługuje unikod (choć trzeba pamiętać, że zestaw wyświetlanych znaków jest ograniczony do tego, co zawiera używana czcionka – problem analogiczny do problemu z przeglądarkami graficznymi nie obsługującymi substytucji czcionek), jedynie w opcjach należy ustawić Display character set na UNICODE (UTF‑8): po otwarciu okna konfiguracji klawiszem O zaznaczyć opcję zapisania konfiguracji na dysk przez podświetlenie opcji Save options to disk: i naciskając Enter tak, by między nawiasami pojawił się X, następnie przejść na pozycję Display character set i nacisnąć Enter, wybrać UNICODE (UTF‑8) i nacisnąć Enter, po zmianie kodowania podświetlić pozycję Accept changes i nacisnąć Enter. Można też tę zmianę wprowadzić drogą bezpośredniej edycji pliku konfiguracyjnego: w pliku LYNX.RC należy znaleźć linię character_set= i w niej wpisać po znaku równości UNICODE (UTF-8). Istnieje możliwość konfiguracji domyślnego charsetu (zwaną Assumed document character set) i preferowanych języków (zwaną Preferred document language). Wszystkie opcje konfiguruje się na ekranie opcji, który otwiera się skrótem klawiaturowym O. Lynx nie posiada opcji ręcznej zmiany charsetu wyświetlanej strony, możliwa jest jedynie zmiana charsetu wyświetlanej strony nie zawierającej deklaracji charsetu przez zmianę opcji Assumed document character set.

1.3. Problemy ze stronami www zawierającymi typowe błędy techniczne

Inne problemy związane z niewłaściwym wyświetlaniem polskich (i innych) liter na stronach www mimo poprawnej konfiguracji przeglądarki to brak deklaracji charsetu dla tej strony, użycie do tworzenia strony programu nie dostosowanego do tworzenia stron www w innych językach i deklarowanie przez autora strony czcionek nieunikodowych.

1.3.1. Brak deklaracji charsetu lub nieprawidłowa deklaracja

Niektórzy Polacy tworzą strony www używając (zazwyczaj nieświadomie) kodowania Windows‑1250, z rzadka zdarzają się strony, na których polskie litery zakodowane są w starym kodowaniu MacCE. Analogicznie np. Rosjanie tworzą strony używające kodowania Windows‑1251. Problem występuje, gdy dana strona nie zawiera deklaracji charsetu w postaci linii w nagłówku wyglądającej tak:
<meta http-equiv="content-type" content="text/html; charset=[jakiś_legalny_charset]">
W przypadku dokumentów XHTML na samym początku powinna wystąpić inna linia, również deklarująca kodowanie, w postaci
<?xml version="1.0" encoding="iso-8859-2"?>
Doraźnym rozwiązaniem jest przełączenie kodowania oglądanej strony na Windows‑1250 (zwanej w IE Środkowoeuropejski Windows lub po angielsku Central European Windows) lub MacCE (obsługiwane jest tylko przez Mozillę i Firefoksa), względnie na inne kodowanie, jedno z właściwych dla danego języka, i metodą prób i błędów wybranie tego jednego, w którym treść strony wyświetla się prawidłowo. Zdarza się też, że przez nieuwagę lub niewiedzę w jedną z wyżej wspomnianych linii zostanie wstawiona niewłaściwa deklaracja charsetu, np. ISO‑8859‑1 dla strony zawierające polskie znaki w ISO‑8859‑2, lub ISO‑8859‑2, gdy w rzeczywistości strona kodowana jest w Windows‑1250. Ostatnie możliwe źródło problemu to konfiguracja serwera, by wysyłał wraz ze stroną jakąś deklarację charsetu ustawioną w konfiguracji tegoż serwera. Deklaracja ta nie ma związku z deklaracją charsetu w nagłówku strony i ma priorytet nad tą deklaracją z nagłówka. Najczęstszym przypadkiem jest wysyłanie przez serwer deklaracji, że strona jest kodowana w ISO‑8859‑1 (domyślne ustawienie chyba wszystkich serwerów http, w krajach zachodnich używających normalnie ISO‑8859‑1 często pozostawiane). W obu ostatnich wypadkach również doraźne rozwiązanie to przełączenie kodowania oglądanej strony na ISO‑8859‑2 (zwanej w IE Środkowoeuropejski ISO lub po angielsku Central European ISO), w obu wypadkach pełne rozwiązanie to kontakt z twórcą lub webmasterem strony i poinformowanie go o problemie (w przypadku konfiguracji serwera – można również zwrócić się do administratora serwera, by wyłączył dla katalogu domowego danego użytkownika wysyłanie deklaracji charsetu). Można przy tym wspomnieć, że planuje się zgłoszenie problematycznej strony do serwisu Osiołki polskiego internetu link do str. zewnętrznej. Pokrewny problem to sytuacja, w której strona oglądana z sieci wygląda prawidłowo, ale po zapisaniu jej na dysk i otwarciu zawiera krzaki. Powodem jest poleganie przez autora strony na deklaracji charsetu wysyłanej przez serwer i w związku z tym brakowi linii deklarującej charset w nagłówku. Więcej o problemie z serwerami, w tym rozwiązania dla twórców stron www umieszczonych na takich serwerach, można znaleźć na stronie Tworzenie stron www z polskimi literami (i wszelkimi innymi znakami)link prowadzi do podstrony.

Spotykana jeszcze gdzieniegdzie nieudana próba obejścia problemu kodowania przez zadeklarowanie czcionki nieunikodowej w jakimś formacie narodowym (np. znacznikiem <FONT FACE=Times New Roman CE> w przypadku polskich liter) nie działa w nowoczesnych przeglądarkach. Zostało to szerzej omówione w rozdziale 1.3.3 Deklarowanie przez autora strony czcionek nieunikodowych.

Uwaga: należy unikać przełączania na UTF-7 (jeżeli to kodowanie jest dostępne w menu), gdyż na specjalnie skonstruowanych stronach www może to wywołać wykonanie złośliwego skryptu, np. ujawniającego dane personalne (np. login i hasło do serwisu niezwiązanego z wyświetlaną stroną).

1.3.2. Użycie do tworzenia strony oprogramowania nie dostosowanego do tworzenia stron www w innych językach lub kodowaniach

Inny problem, polegający na zastąpienu polskich liter różnymi literami alfabetów zachodnioeuropejskich i znakami specjalnymi, bierze się z utworzenia strony www w programie, który obsługuje wyłącznie kodowanie ISO‑8859‑1 – polskie litery mogą zostać w nim zastąpione encjami oznaczającymi znaki zachodnioeuropejskie (np. ą zostanie zakodowane jako &#185; lub &sup1; i u oglądającego zostanie pokazane jako ¹). Efekt ten jest niezależny od ustawienia przeglądarki (czyli nie można ręcznie przełączyć kodowania tak, by uzyskać polskie znaki na ekranie), i pozostaje jedynie kontakt z twórcą strony. Stronę napisaną w języku polskim z użyciem niewłaściwego oprogramowania można spróbować automatycznie naprawić konwerterem kodowań Ogonki 97 link do str. zewnętrznej (tylko dla Windows, freeware). W tym celu konieczna jest konfiguracja programu: po wejściu w opcje (Konwersja ⇒ Opcje… ⇒ zakładka Zaawansowane) należy sprawdzić, czy zaznaczone są cztery środkowe klatki:

W przypadku stron pisanych w jakimś języku z rodziny języków zachodnioeuropejskich, a w szczególności w języku angielskim, dość powszechnie spotykane jest stosowanie kodowania Windows‑1252 w połączeniu albo z całkowitym pomijaniem deklaracji kodowania, albo nieprawdziwą deklaracją ISO‑8859‑1. Przeglądarki Polaków mają najczęściej ustawione domyślne kodowanie ISO‑8859‑2, przez co różne znaki specjalne, takie jak poprawne cudzysłowy (“ ”), apostrofy (’), półpauzy (–) i symbole znaku towarowego ™, które w Windows‑1252 umieszczone są na pozycjach 128–159 (nieużywanych w kodowaniach ISO), pokazują się jako puste kwadraty, zaś znaki ©opyrightu będą pokazane jako Ž. O ile istnieje stara norma internetowa RFC 2616 link do str. zewnętrznej mówiąca o tym, że domyślny charset to ISO‑8859‑1, o tyle po pierwsze Windows‑1252 to nie to samo, co ISO‑8859‑1 (zdarzają się strony używające nawet nigdzie nieunormowanych i nielegalnych encji numerycznych do reprezentacji znaków Windows‑1252, na przykład &#150; zamiast &#ndash; lub &#8211; na oznaczenie półpauzy, przeglądarki mogą nie rozpoznawać tych pseudoencji), a po drugie Konsorcjum W3C wyraźnie stwierdza w swojej normie języka HTML 4.01, że nie wolno zakładać żadnego domyślnego kodowania, zaś w swojej normie języka XHTML 1.0 definiuje jako domyślne jedno z kodowań UTF‑8 lub UTF‑16. Ponownie jako doraźne rozwiązanie pozostaje ręczna zmiana charsetu w przeglądarce na Windows‑1252 (zwanego w IE Zachodnioeuropejski Windows lub po angielsku Western European Windows), a jako pełne rozwiązanie – kontakt z autorem lub webmasterem. Na poparcie można załączyć linki do odpowiednich miejsc w dokumencie: http://www.w3.org/TR/html401/charset.html#idx-HTTP link do str. zewnętrznej (o braku specyfikacji domyślnego charsetu) i http://www.w3.org/TR/html401/charset.html#h-5.3.1 link do str. zewnętrznej (o stosowaniu encji numerycznych w oparciu o numery znaków w unikodzie, nie w jakimkolwiek kodowaniu 8‑bitowym).

Inny problem, najczęściej występujący na starych stronach www, to używanie przez autora znaków specjalnych ze specjalnych czcionek (System, Wingdings, Webdings) kodowanych w sposób niezgodny z unikodem. Nie można zakładać, że każdy będzie miał zainstalowane te czcionki, a ponadto nowoczesne przeglądarki www z obsługą unikodu nie obsługują starych konwencji umożliwiających użycie znaków z tych czcionek. Szczegółowe omówienie w następnym punkcie (poniżej).

1.3.3. Deklarowanie czcionek nieunikodowych

Niektórym może się podobać czcionka Courier, inni mogą być zdania, że ich strona będzie najfajniej wyglądać, gdy będzie wyświetlona z użyciem czcionki MS Sans Serif lub MS Serif. Użytkownicy Linuksa i MacOS nie muszą się tym przejmować, ale każdy Windows ma zainstalowane te czcionki – wszystkie trzy w wersji nieunikodowej. W szczególności czcionka Courier w innych systemach może być czcionką unikodową (np. w Linuksie jest to czcionka unikodowa zawierająca stosunkowo szeroki zbiór znaków), w Windowsach zawsze jest nieunikodowa. W zależności od locale systemu, czyli ustawień językowych (to tak w skrócie), czcionki te mogą mieć polskie znaki lub mogą ich nie mieć, a w ich miejscu mogą mieć znaki zachodnioeuropejskie, cyrylicę czy też jeszcze inne znaki. Przeglądarki obsługujące tzw. substytucję fontów, a są to przykładowo Opera i Firefox (generalnie: prawie każda współczesna, licząca się przeglądarka, z wyjątkiem starszych wersji IE), nie powinny mieć dużych problemów z wyświetleniem treści takiej strony (a gdyby miały, to wystarczy wyłączyć obsługę arkuszy stylów – w Operze skrótem klawiaturowym Shift+G lub z menu Widok ⇒ Styl, w Firefoksie oraz w IE z menu Widok ⇒ Styl strony), choć efekt optyczny czasem bywa marny (zwłaszcza w Operze, tzw. problem przesunięć link do str. zewnętrznej), ale w przypadku starszych wersji IE nie ma na to prostej rady. Rozwiązaniem byłoby stosowanie definicji stylu w postaci np.
p {font-family: 'Courier New', Courier, monospace}
co już zależy od świadomości lub dobrej woli twórcy strony. Nieunikodowe czcionki bitmapowe (systemowe) w Windows mają ikonę z czerwoną literą A.

W dawniejszych czasach popularne były nieunikodowe czcionki zawierające znaki z jednej strony kodowej. Czcionka z polskimi literami miała w nazwie końcówkę CE, z literami cyrylicy – Cyr itp. Niektórzy twórcy stron www nie znający standardów próbowali osiągnąć prawidłowe wyświetlanie znaków narodowych przez definiowanie takich nieunikodowych czcionek. Z tych samych względów co opisano powyżej, ta metoda nie działa w nowoczesnych przeglądarkach, do tego obecnie większość internautów nie używa już takich czcionek i nie ma ich zainstalowanych na swoich komputerach. Niestety, wciąż na świecie produkowane są czcionki zawierające albo tylko znaki z zakresu US‑ASCII, albo jedynie znaki z zakresu 128–255, używanego dla znaków zachodnioeuropejskich. Niektóre nawet są reklamowane jako „wielojęzyczne”.

Analogicznym problemem jest używanie niestandardowego znacznika <FONT FACE="jakas_udziwniona_czcionka">, choć najczęściej jest on używany do wybierania obrazków z czcionek Symbol, WingdingsWebdings. Znacznika tego znaczna ilość przeglądarek www nie obsługuje wcale (Opera), a inne obsługują pod warunkiem, że dla danego dokumentu nie jest deklarowana zgodność z nowszymi wersjami HTML (Firefox tylko w QuirksMode i w przypadku znaczków spoza zakresu US‑ASCII pod warunkiem, że strona kodowana jest w jakimś kodowaniu zachodnioeuropejskim lub znaczki te są wstawione jako encje unikodu). Wspomniane przeglądarki do wyświetlenia tekstu wewnątrz tego znacznika używają jakiejś czcionki domyślnej. Nie istnieje metoda na wykorzystanie znaków z takich czcionek we wszystkich przeglądarkach. Sam Microsoft na swojej stronie o czcionce Webdings link do str. zewnętrznej zaleca nieużywanie tej czcionki w internecie.

Pojawienie się samotnej, wielkiej litery J w miejscu, w którym nie ma ona żadnego uzasadnienia, jest typowym objawem użycia uśmiechniętej buźki z czcionki Wingdings. Prawidłowa metoda to użycie encji unikodu &#9786;: . Niestety, niektóre czcionki nie zawierają tego symbolu, przez co niektórzy mogą zobaczyć znak zapytania albo pusty prostokąt (w szczególności dotyczy to użytkowników gorszych przeglądarek, nie obsługujących lub słabo obsługujących substytucję fontów, np. starsze wersje IE). Obecnie najbezpieczniejszy sposób, działający w każdej przeglądarce (w tym w tekstowej), to albo użycie graficznego śmieszka jako obrazka, albo kompozycja ASCII, czyli metoda znana z poczty i newsów: :-). W przypadku użycia grafiki jako tekst alternatywny dobrze jest umieścić śmieszka ASCII (zatrzymaj kursor nad buźką, a zobaczysz dymek).

Autorzy stron www chcący użyć znaków z tych czcionek mogą skorzystać z tabel odpowiedników czcionka‑­unikod: Wingdings link do str. zewnętrznej, Symbol link do str. zewnętrznej.

1.3.4. Użycie osadzonych (linkowanych) czcionek

W drugiej połowie lat 90. XX w., na fali wprowadzania rozwiązań mających na celu umożliwienie tworzenia coraz atrakcyjniejszych wizualnie stron www, opracowano dwie niekompatybilne technologie osadzania czcionek na stronach www. W zamierzeniu miało to umożliwić stosowanie dowolnych krojów czcionek na stronie i wyświetlanie ich niezależnie od tego, czy oglądający mieli daną czcionkę zainstalowaną u siebie w systemie. Microsoft wraz z wersją 4 swojej przeglądarki dla Windows wprowadził własną, zamkniętą technologię używającą programu WEFT (wykorzystującą czcionki w formacie .EOT, technologia ta przez długi czas była tajemnicą MS i była niedostępna dla innych producentów przeglądarek), podczas gdy NetscapeBitstream opracowali technologię TrueDoc znaną też jako Dynamic Fonts, użytą w wersjach 4.x Navigatora i Communicatora począwszy od wersji 4.03 (wykorzystującą czcionki w formacie .PFR). Ta druga technologia była dostępna dla wszystkich producentów przeglądarek i w zamyśle miała być powszechna, ale nie rozpowszechniła się (m.in. przez to, że narzędzie do tworzenia czcionek w tym formacie było drogie). Technologia ta nie jest już obsługiwana przez przeglądarki Netscape począwszy od wersji 6, nie jest też obsługiwana przez żadne inne przeglądarki, w tym oparte na silniku Gecko. Bitstream wciąż udostępnia dla IE kontrolkę ActiveX o nazwie tdserver.ocx (spakowana: tdserver.cab) dodającą mu obsługę czcionek osadzonych technologią TrueDoc, dodatkowo wymagane jest dodanie kilku linii w kodzie strony dla IE. Kontrolka ta nie działa w IE dla Macintosha (który też już od dawna jest zarzucony i niewspierany). Tymczasem niektóre strony www pisane m.in. w językach używanych na subkontynencie indyjskim, z różnych powodów (m.in. brak dobrych czcionek unikodowych zawierających znaki używane w tych językach lub wręcz brak danych znaków w obecnej wersji unikodu), używają wciąż jednej lub nawet obu tych technologii do udostępnienia użytkownikowi specjalnie spreparowanej czcionki zawierającej znaki danego języka w górnym obszarze znaków normalnie używanych dla górnego zakresu ISO‑8859‑1 lub Windows‑1252 (pozycje 0xA0–0xFF lub 0x80–0xFF). Strony takie nie działają w nowoczesnych przeglądarkach, w miejsce znaków danego języka wyświetlają się krzaki. Dla tego problemu nie istnieje obecnie żadne skuteczne rozwiązanie, na szczęście nie jest on spotykany na stronach w języku polskim.

Ciekawostki: W przypadku języków subkontynentu indyjskiego istnieje częściowe rozwiązanie: instalacja rozszerzenia Padma link do str. zewnętrznej dla Firefoksa. Z opisu wynika, że działanie rozszerzenia opiera się na rozpoznaniu użytej czcionki (na podstawie jej nazwy) i przemapowaniu znaków 8‑bitowych na unikod lub inne kodowanie wybrane przez użytkownika. Format EOT został zgłoszony przez MS konsorcjum W3C jako propozycja standardu, co może zaowocować w przyszłości wprowadzeniem obsługi formatu w innych przeglądarkach.

Obecne wersje przeglądarek Firefox, Safari, Opera, Chrome i IE (a także najprawdopodobniej wszystkie inne przeglądarki oparte o najnowsze wersje silników GeckoWebkit) obsługują osadzanie czcionek w formatach .ttf.otf oraz .woff.

1.4. Polskie litery i inne znaki narodowe w appletach Javy

Java autorstwa firmy Sun (w styczniu 2010 Sun został przejęty przez Oracle) wewnętrznie jest środowiskiem w pełni zgodnym z unikodem i ma możliwość wyświetlenia dowolnego znaku. Starsze wersje dla Windows były rozprowadzane w dwóch wersjach: angielskiej (US‑English – mniejsza, ale obsługiwała wyłącznie znaki z charsetów ISO‑8859‑1 i ISO‑8859‑15) i wielojęzykowej (all languages – nieco większa, ale bez tak wąskich ograniczeń co do zestawu znaków). Od wersji 1.4.2, w tym obecnie rozprowadzane wersje 5 (wewnętrzne oznaczenie: 1.5.0_x) i 6 (wewnętrzne oznaczenie: 1.6.0_x; w obu wypadkach x oznacza nr aktualizacji), są udostępniane tylko w wersji wielojęzykowej. W przypadku starych instalacji może zdarzyć się, że została zainstalowana wersja angielska, wówczas wystarczy ręcznie ściagnąć i zainstalować najnowszą wersję. Nowsze wersje Javy nie są testowane na starszych systemach. Starsze systemy mogą wymagać instalacji starszej wersji. Należy wówczas pamiętać o instalacji wersji wielojęzykowej (np. najwyższą wersją testowaną w systemie Windows 95 jest 1.4.0_04, która występuje w wersji angielskojęzycznej i wielojęzykowej).

Ponieważ Java jako program musi mieć możliwość komunikowania się z systemem operacyjnym, w pewnych wypadkach następuje konwersja znaków w unikodzie do kodowania właściwego dla ustawień regionalnych (locale) systemu ustawionych w trakcie instalacji Javy. Z nieznanych powodów ignorowana jest systemowa strona kodowa. Im mniej zaawansowana obsługa unikodu przez system operacyjny, tym więcej problemów: w jednym z appletów testowych w jednym z pól umieszczone tam znaki narodowe wyświetlają się jako krzaki, gdy strona oglądana jest pod Windows 98, ale są poprawnie wyświetlane, gdy strona oglądana jest pod Windows 2000 i Linuksem na jądrze 2.6.12 z KDE 3.41. Podobne problemy występują przy wpisywaniu znaków spoza US‑ASCII – w zależności od ustawień regionalnych efekt w zależności od systemu i ustawień jest między pełną obsługą unikodu a szczątkową obsługą znaków z kodowania odpowiadającego ustawieniom regionalnym systemu, z dziwnymi efektami pośrodku. Generalnie na problem z wyświetlaniem krzaków lub pustych klatek w miejscu znaków narodowych jedyne rozwiązanie to dezinstalacja Javy, zmiana ustawień regionalnych i ponowna instalacja Javy (choć użytkownikom Linuksa udało się doprowadzić do poprawnego wyświetlania polskich liter przez edycję jednego pliku konfiguracyjnego Javy). Oczywiście reinstalacja w taki sposób spowoduje, że z kolei psute będą znaki narodowe z innej grupy językowej, na przykład u kogoś mieszkającego we Francji i chcącego widzieć jednocześnie polskie i francuskie litery w appletach Javy nie ma obecnie rozwiązania. Więcej informacji: wątek na forum Mozilli poświęcony krzakom w appletach Javy link do str. zewnętrznej.

Prawdopodobnie instalacja Javy na Linuksie, którego locale używa UTF‑8, pozwala na obsługę wszystkich znaków, ale chwilowo jest to informacja niepotwierdzona.

Starsze wersje Windows mają zainstalowaną tzw. MS­-Javę (czasem określaną skrótem MSJVM). Działa ona wyłącznie z IE, więc użytkownicy innych przeglądarek mogą zignorować poniższe informacje. Używanie tego klonu Javy wiąże się z kilkoma problemami, najważniejszy to obecność kilku błędów mających wpływ na bezpieczeństwo, narażających system podczas surfowania, inny to wiek i brak nowych wersji, a także celowo wprowadzona pewna niezgodność ze standardem (przez co niektóre aplety nie działają z MS­-Javą, niestety zdarzają się też aplety pisane przez niekompetentne osoby, działające tylko z MS­-Javą, na szczęście takich przypadków jest coraz mniej). MS­-Javą od połowy 2003 r. nie jest już rozwijana przez MS wskutek przegranego procesu sądowego, MS mógł jedynie udostępniać łaty poprawiające błędy mające wpływ na bezpieczeństwo do końca 2007 (co nie znaczy, że musiał… kilka dziur do końca nie zostało poprawionych, mimo że znane były od kilku lat). MS­-Java ma nawet dostępne ustawienia poziomu bezpieczeństwa pozwalające na stworzenie sobie zagrożenia, podczas gdy Java firmy Sun ma jeden poziom zabezpieczeń (wysoki, dający najwyższy poziom bezpieczeństwa, a mimo to udostępniający pełną funkcjonalność bezpiecznym appletom). MS­-Java to mniej więcej wersja 1.1.4, podczas gdy wersja Javy firmy Sun na grudzień 2006 to 1.5.0_10, przez co MS­-Java coraz częściej ma problem z niekompatybilnymi (zbyt nowymi) appletami, które z nią nie zadziałają, za to działają doskonale z Javą firmy Sun. MS­-Java działa wyłącznie z IE, użytkownicy innych przeglądarek (a także użytkownicy IE, którzy zdecydują się na przejście na nowoczesną, bezpieczniejszą i zgodną ze standardami Javę firmy Sun), mogą usunąć MS­-Javę z systemu. Oficjalnie MS nie jest przeciwny usuwaniu MS­-Javy, ale stara się jak może to utrudnić, m.in. przez brak skrótu czy wpisu w Panelu Sterowania (Dodaj/usuń programy) uruchamiającego dezinstalację. Ale okazuje się, że dezinstalacja MS­-Javy jest prosta i nie pociąga za sobą żadnych skutków ubocznych.

MS-Javę można usunąć na dwa sposoby: ręcznie i dedykowanym programem wypuszczonym swego czasu przez MS. Program o nazwie unmsjvm.exe nie jest dostępny z serwera MS, ale można go ściągnąć np. ze strony Major Geeks link do str. zewnętrznej. Można też go znaleźć w internecie: szukaj „unmsjvm.exe” w Google link do str. zewnętrznej. Inna metoda to ręczna dezinstalacja: instrukcja ręcznego usunięcia MS­-Javy z Windowsów link prowadzi do podstrony. Metoda ręcznej dezinstalacji została przeze mnie przetestowana z pozytywnym skutkiem (w tym sprawdzeniem, że IE zachowuje pełną funkcjonalność, a po zainstalowaniu Javy firmy Sun normalnie obsługuje też prawidłowo napisane aplety Javy).

Przed usunięciem MS-Javy należy przeanalizować wymagania istotnych odwiedzanych stron, gdyż wciąż istnieją strony używające pełnych błędów appletów napisanych pod MS­-Javę. Po starannej dezinstalacji MS­-Javy istnieje możliwość jej powtórnej instalacji. Istnieje też możliwość instalacji Javy firmy Sun obok MS­-Javy i przełączania w opcjach Javy używanej przez IE (zmiana wymaga restartu IE).

UWAGA: nie należy mylić wersji MS­-Javy z wewnętrzną wersją plików według systemu MS. Na przykład najnowsza wersja zainstalowana na Windows 2000 zgłosi się jako 5.0.0.3810. Absolutnie nie oznacza to, że jest to wersja dużo, dużo nowsza od Javy firmy Sun, której numer wersji (wypuszczonej w grudniu 2006) to 1.5.0_10!

2. Używanie ogonków na forach, w wyszukiwarkach, w webmailach

Możliwość wpisywania polskich liter (i w ogóle wszelkich liter ze znakami diakrytycznymi) w oknach formularzy na www (fora internetowe, webmail, wyszukiwarki) nie jest w żaden sposób uzależniona od kraju zamieszkania ani języka systemu operacyjnego czy przeglądarki. Użytkownik Windowsa nie ma absolutnie żadnego powodu, by nie instalować obsługi wielu języków (zajmuje nieliczący się ułamek procenta powierzchni przeciętnego dziś dysku twardego). Znaki spoza US‑ASCII są w dzisiejszych czasach przesyłane jako kody unikodu lub, jeżeli aplikacja na serwerze nie rozumie unikodu, a serwer potrafi o tym zawiadomić przeglądarkę, w kodowaniu danej strony www. Jeżeli używasz w miarę współczesnej wersji przeglądarki i masz prawidłowo skonfigurowany system, to jedyne ograniczenia na stosowanie polskich liter to ograniczenia po tamtej stronie. Stąd jak najbardziej można na przykład używać polskich liter wypowiadając się na polskich forach czy korzystając z polskich wyszukiwarek. Google również w pełni obsługuje unikod w swoich wyszukiwarkach (www i grup dyskusyjnych). Osobiście potwierdzam – z komputera, na którym mam system operacyjny w wersji angielskiej, mogę bez najmniejszych przeszkód szukać przez Google terminów w języku polskim, niemieckim i rosyjskim (wpisując je w oryginalnym brzmieniu, nie w żadnej transliteracji).

Należy jednak zdać sobie sprawę z tego, że sama możliwość wpisania i wysłania jakichś znaków nie oznacza, że aplikacja pośrednicząca zainstalowana na serwerze, która na podstawie wysłanego tekstu tworzy stronę www, jest w stanie prawidłowo przetworzyć wszystkie znaki na postać zrozumiałą dla przeglądarek. Na przykład niektóre aplikacje mogą pracować wyłącznie z wykorzystaniem stron kodowych i repertuar wyświetlanych prawidłowo znaków będzie ograniczony do znaków z charsetu właściwego dla języka serwisu, w innych wypadkach administrator z nieświadomości lub złośliwości celowo zablokuje przetwarzanie znaków poza np. tylko polskimi literami. W efekcie niektóre znaki prawidłowo wpisane i prawidłowo wysłane do serwera nie zostaną wyświetlone prawidłowo. Powód jest po stronie serwera, nie użytkownika, i nie ma jednak żadnego związku z tym, że znaki te próbowało się wpisać będąc poza Polską!

2.1. Szczególne problemy i ograniczenia przy korzystaniu z webmaili

2.1.1. Szczególne wady webmaila Onetu

2.1.2. Szczególne wady webmaila Interii

2.1.3. Możliwe szczególne wady innych bramek www⇒news i webmaili (zagranicznych)

Jeszcze większe problemy istnieją przy korzystaniu z zagranicznych bramek www do usenetu i webmaili (z wyjątkiem Google Groups, który prawidłowo wyświetla prawidłowe technicznie posty używające zadeklarowanych charsetów ISO‑8859 i UTF‑8, a także prawidłowo wyświetla posty kodowane Quoted‑Printable) – zwykle są ustawione na inny charset (np. bramki nastawione na obsługę użytkowników anglo-, niemiecko- i francuskojęzycznych – ISO‑8859‑1), przez co nie nadają się one do regularnego używania do wysyłania postów w języku polskim. Pokazany powyżej przykładowy tekst:

Założenie budowy linii kolejowej dużych prędkości (300km/h+) z Wrocławia i Poznania przez Łódź do Warszawy znalazło się w „Narodowym Planie Rozwoju na lata 2007 – 2013”.

Wdrożenie tego projektu nie opóźni realizacji innych zadań inwestycyjnych, w tym planowanej na lata 2006 – 2008 modernizacji istniejącej linii Warszawa – Łódź.

może być wysłany i wyświetlony u odbiorcy na jeden z trzech sposobów:

Za?o?enie budowy linii kolejowej du?ych pr?dko?ci (300km/h+) z Wroc?awia i Poznania przez ?ód? do Warszawy znalaz?o si? w �Narodowym Planie Rozwoju na lata 2007 � 2013�.

Wdro?enie tego projektu nie opó?ni realizacji innych zada? inwestycyjnych, w  tym planowanej na lata 2006 � 2008 modernizacji istniej?ącej linii Warszawa � ?ód?.

Za³o¿enie budowy linii kolejowej du¿ych prêdkoœci (300km/h+) z Wroc³awia i Poznania przez £ódŸ do Warszawy znalaz³o siê w „Narodowym Planie Rozwoju na lata 2007 – 2013”.

Wdro¿enie tego projektu nie opóŸni realizacji innych zadañ inwestycyjnych, w  tym planowanej na lata 2006 – 2008 modernizacji istniej¹cej linii Warszawa – £ódŸ.

Za&#322;o&#380;enie budowy linii kolejowej du&#380;ych pr&#281;dko&#182;ci (300km/h+) z Wroc&#322;awia i Poznania przez &#321;ód&#317; do Warszawy znalaz&#322;o si&#281; w &#8222;Narodowym Planie Rozwoju na lata 2007 &#8211; 2013&#8221;.

Wdro&#380;enie tego projektu nie opó&#317;ni realizacji innych zada&#324; inwestycyjnych, w tym planowanej na lata 2006 &#8211; 2008 modernizacji istniej&#177;cej linii Warszawa &#8211; &#321;ód&#317;.

Ponieważ zapewnienie poprawności technicznej wysyłanych materiałów jest wyłącznym obowiązkiem wysyłającego, w skrajnym przypadku korzystający z takiego interfejsu musi zastępować zepsute polskie litery w cytatach łacińskimi formami bazowymi (czyli zamieniać temat i treść polską na polskawą).

2.2. Sprawdzanie pisowni na www

Korzystając z jakiegoś interfejsu do pisania, na przykład wypowiadając się na forach, pisząc listy z użyciem webmaila czy pisząc na grupy dyskusyjne przez interfejs www, nie ma się dostępu do funkcji sprawdzania pisowni. Łatwo przez to zrobić nawet elementarne błędy, nie mówiąc o zwykłych literówkach. Na szczęście istnieje parę możliwych rozwiązań tego problemu:

2.2.1. Mozilla Firefox

Przeglądarki Firefox link do str. zewnętrznej od wersji 2 i Seamonkey link do str. zewnętrznej od wersji 1.1 mają zintegrowany moduł sprawdzania w locie pisowni w polach edycyjnych. Automatyczne sprawdzanie pisowni w locie uaktywnia się w zaawansowanych opcjach na zakładce Ogólne:

Po zainstalowaniu słownika w momencie zaczęcia wpisywania tekstu w pole edycyjne formularza www program automatycznie wychwyci i podkreśli czerwoną linią kropkową każde słowo, którego nie ma w słowniku. Przełączać języki (gdy zainstalowano więcej słowników) i czasowo wyłączać sprawdzanie można w menu kontekstowym pod drugim klawiszem myszy:

Druga od dołu pozycja w lewym menu włącza i wyłącza sprawdzanie pisowni w locie dla danego pola edycyjnego, podmenu z ostatniej pozycji (zaznaczonej) pozwala na zmianę języka (i nawet instalację nowego słownika). Język sprawdzania pisowni zapisany jest w prefs.js np. jako
user_pref("spellchecker.dictionary", "pl");

FirefoxSeamonkey korzystają z plików słownikowych w formatach Hunspell i MySpell (używanych również w Open Office link do str. zewnętrznej). Z serwera Mozilli można ściągnąć pliki słowników jako rozszerzenia link do str. zewnętrznej (od wersji 2 Firefox i Thunderbird instaluje słownik jako rozszerzenie) pozwalające na sprawdzanie ortografii w licznych językach. Rozszerzenia te można automatycznie zainstalować klikając na odsyłacze do nich. Instalacja słowników jako rozszerzeń jest jednak uciążliwa, gdy korzysta się z kilku profili i chce się mieć polski słownik (czy może też inne słowniki) dostępny w każdym profilu. Można to jednak obejść ręcznie:

  1. Okazuje się, że można też ręcznie umieścić pliki słowników w podkatalogu dictionaries katalogu instalacyjnego Firefoksa, słowniki w tym katalogu będą dostępne w każdym profilu.
  2. Istnieje też pewna sztuczka: należy wszystkie pliki słowników umieścić w dowolnym miejscu na dysku w katalogu o nazwie dictionaries, program musi mieć dostęp do tego katalogu (wystarczy dostęp do odczytu). W katalogu profilu należy znaleźć plik extensions.ini i w nim w sekcji [ExtensionDirs] dopisać linię
    ExtensionX=Dysk:\ścieżka_do_katalogu_ze_słownikiem\nazwa_katalogu_z katalogiem_dictionaries_z_plikami_słownika
    Jeżeli np. pliki języka polskiego (pl.dic i pl.aff) znajdują się w katalogu c:\program files\open office\dictionaries i jest to ósmy wpis dotyczący rozszerzeń, powyższa linia będzie wyglądać tak:
    Extension8=c:\program files\open office
    Oczywiście należy podać odpowiednie ścieżki i nazwy katalogów, zamiast X wstawić kolejną liczbę (zaczynając od 0, gdy nie ma zainstalowanych żadnych rozszerzeń). Dzięki temu można też współdzielić słowniki między profilami i różnymi aplikacjami Mozilli (np. FirefoxThunderbird). Niestety, po każdej aktualizacji (prawdopodobnie również po niektórych zmianach ustawień rozszerzeń) trzeba tę linię ponownie dodawać, gdyż w procesie sprawdzania zainstalowanych rozszerzeń program usuwa wpisy prowadzące do rozszerzeń zainstalowanych w miejscu innym niż podkatalog extensions katalogu z profilem użytkownika.
  3. W Linuksie możliwe jest rzecz jasna utworzenie symlinków (dowiązań symbolicznych) lub hardlinków (dowiązań twardych), zaawansowani użytkownicy Windowsa mogą zainstalować sobie rozszerzenie systemu operacyjnego Link Shell Extension link do str. zewnętrznej, dzięki któremu również będą mogli w prosty sposób utworzyć hardlinki i symlinki (w systemach wcześniejszych niż Vista możliwe jest tworzenie symlinków tylko do katalogów, zwanych junction point). Usunie to niedogodność związaną ze znikaniem słowników po aktualizacji i umożliwi współdzielenie wszystkich słowników między wszystkimi aplikacjami korzystającymi z tego formatu słowników (np. Firefox, Thunderbird, Nvu i OpenOffice.org). UWAGA: tworzenie hard- i symlinków w Windowsie możliwe jest wyłącznie na partycjach NTFS.

Symlinki pozwalają również na korzystanie z jednego słownika użytkownika (persdict.dat) w Thunderbirdzie i Firefoksie. Słownik użytkownika znajduje się w katalogu profilu użytkownika.

Pliki słownika do ręcznej instalacji można ściągnąć z serwera OpenOffice.org albo rozpakować rozszerzenie .xpi (jest to .zip o rozszerzeniu zmienionym na .xpi). Zawsze są po dwa pliki na język: .dic i .aff.

Użytkownicy piszący w więcej niż jednym języku mogą zainstalować dodatek Dafizilla Spell Check by Site link do str. zewnętrznej, który pozwala na automatyczny wybór słownika w zależności od URL-a (lub jego części) strony www. W najprostszym wypadku przykładowej konfiguracji na stronach w domenie .uk użyty będzie słownik brytyjskiego angielskiego, na stronach w domenie .ru – rosyjskiego, zaś w każdej innej – polskiego, będą to reguły:

FilterDictionary
\.uk/en-GB
\.ru/ru
.*pl

Ważna jest kolejność – dopasowanie reguł sprawdzanie jest w kolejności od góry i pierwsza pasująca reguła jest użyta do wybrania języka, więc szczegółowe reguły muszą być umieszczone przed bardziej ogólnymi. Możliwe jest stworzenie bardzo precyzyjnych reguł dla domen, poddomen i stron.

Reguły przechowywane są w pliku spellbysite.json w katalogu dafizilla w katalogu profilu. Zawartość pliku z powyższymi regułami będzie następująca:

Uwaga: rozszerzenie należy skompatybilizować z nowymi wersjami Firefoksa.

Ciekawostki:

(jak wprowadzać zmiany w liniach konfiguracyjnych: patrz rozdział poświęcony konfiguracji Firefoksa link prowadzi do podstrony)

2.2.2. Opera

Opera od wersji 10 posiada zintegrowaney moduł sprawdzania w locie pisowni w polach edycyjnych. Automatyczne sprawdzanie pisowni uaktywnia się w menu Edytuj (ang. „Edit”), w menu kontekstowym rozwijanym po kliknięciu drugim klawiszem myszy wewnątrz pola edycyjnego lub w preferencjach na zakładce Zaawansowane (ang. „Advanced”), na pozycji Przeglądanie (ang. „Browsing”):

Języki przełącza się w menu kontekstowym wywoływanym drugim klawiszem myszy, gdy kursor znajduje się nad polem edycyjnym:

Od wersji 10 Opera korzysta ze słowników w formatach Hunspell i MySpell (używanych również w Open Office link do str. zewnętrznej). Pliki słowników mogą być trzymane w  katalogu programu w podkatalogu locale/[kod języka] lub w katalogu profilu w podkatalogu dictionaries. Pliki słowników mogą być spakowane w formacie .zip.

2.2.3. Dodatki dla Internet Explorera

Opisane poniżej dodatki działają również z nakładkami na IE, np. Avant Browser.

  1. IE7Pro link do str. zewnętrznej – dodatek do IE, wzbogaca o wiele przydatnych funkcji, w tym sprawdzanie pisowni w locie. Korzysta ze słowników MySpell i HunSpell (używanych także przez OpenOffice.org i produkty Mozilli). Działa z wersjami 6, 7 i 8 (z pewnymi niewielkimi ograniczeniami). Każdy komplet plików słownika dla danego języka (*.dic i *.aff) musi zostać umieszczony w osobnym podkatalogu o nazwie jak nazwa pliku (bez rozszerzenia), np. pliki języka polskiego o nazwie pl_PL.dic i pl_PL.aff muszą być umieszczone w katalogu o nazwie pl_PL.
  2. Spell Check VBS script link do str. zewnętrznej – bardzo prosty skrypt, działa z wersją 5.x i wyższymi, wymaga zainstalowanego MS Worda, z którego mechanizmów ten skrypt korzysta, i słownika sprawdzania pisowni w żądanym języku (językach). Dodaje do menu kontekstowego odpowiednią pozycję. Wybór języka innego niż domyślny systemowy jest utrudniony i nie zawsze działa poprawnie. Skrypt całkowicie darmowy. Nie sprawdza w locie, a poprawiony tekst trzeba wkleić ze schowka z powrotem w pole edycyjne.
  3. Toolbar Google wersja 6link do str. zewnętrznej – działa z IE 6 i nowszymi pod Windows XP i nowszymi, dla użytkowników Windows 2000 dostępny jest też starszy Toolbar Google wersja 4link do str. zewnętrznej (działa z IE 6).

Istnieją też inne narzędzia, ale albo nie pozwalają na użycie polskiego słownika (m.in. IESpell), albo są płatne.

banner strony „Bykom stop!”
autor niniejszej strony popiera akcję „Bykom stop!” propagującą poprawne pisanie po polsku: z polskimi literami i bez błędów link do str. zewnętrznej

2.3. Dodatek: ROT13

ROT13 to prosty sposób kodowania treści przez podmianę liter. Jest to wersja podstawieniowego szyfru Cezara, w którym każda litera łacińska zastępowana jest literą oddaloną o 13 znaków w alfabecie (stąd nazwa kodowania). Inne znaki: cyfry, litery z ogonkami, inne znaki narodowe, znaki przestankowe i wszystkie inne znaki spoza US‑ASCII pozostają niezmienione. Wielkość liter zostaje zachowana. Dwukrotne (czterokrotne, w ogóle dowolna parzysta liczba razy) zastosowanie kodowania ROT13 do wybranego tekstu daje tekst oryginalny, czyli kod pozwala na stosowanie tego samego algorytmu do kodowania jawnego tekstu i odkodowania tekstu zaszyfrowanego. Oto prosta tabela pozwalająca na ręczne zakodowanie lub odkodowanie ROT13:

abcdefghijklm
nopqrstuvwxyz

Kodowanie i dekodowanie polega na znalezieniu zakodowanego znaku (lub znaku do zakodowania) i zastąpieniu go znakiem bezpośrednio nad lub pod nim.

Dobre czytniki news mają funkcję pozwalającą na zakodowanie i odkodowanie zaznaczonego tekstu. Przeglądarki www nie mają takiej funkcji wbudowanej, ale do odkodowania tekstu zakodowanego ROT13 można posłużyć się skryptozakładkami:

  1. ROT13 Bookmarklet link do str. zewnętrznej działa prawdopodobnie w każdej przeglądarce (autor pisze o działaniu w IE i Firefoksie, ja sprawdziłem działanie w Operze). Zaznaczenie tekstu i kliknięcie na skryptozakładkę powoduje wyświetlenie okna z komunikatem Javascript zawierającym za/odkodowaną treść.
  2. ROT13 selection bookmarklet link do str. zewnętrznej działa tylko w Firefoksie i innych przeglądarkach opartych o Gecko (Mozilla, Seamonkey). Zaznaczenie tekstu i kliknięcie na skryptozakładkę powoduje zmianę zaznaczonego tekstu na odkodowany. Ta skryptozakładka od dawna leży też na stronie skryptozakładek dla Opery link do str. zewnętrznej z adnotacją „Wymaga poprawienia, aby działało w Operze”.

Inne rozwiązanie dla Firefoksa to rozszerzenie Mnenhy link do str. zewnętrznej.

Mnenhy ani skryptozakładki nie potrafią kodować ROT13 tekstu w polach edycyjnych, czyli podczas pisania postów na grupy dyskusyjne przez bramkę www.

Dla Opery 9 dostępny jest widget ROT13 EBG13 link do str. zewnętrznej pozwalający na kodowanie/dekodowanie tekstu w trakcie pisania.

Pod adresem www.rot13.com link do str. zewnętrznej dostępny jest koder/dekoder ROT13, który może być wykorzystany do kodowania tekstu przed wysłaniem go na grupy dyskusyjne. Jeszcze wygodniejszy, bo nie wymagający połączenia z internetem, jest dekoder ROT13 na stronie www.pflock.de/rot13.htm link do str. zewnętrznej (stronę można zapisać lokalnie). Istnieje też prosty program pod Windows: COMBOY’s ROT13 (De)Coder link do str. zewnętrznej.

2.4. Polskie litery (i inne znaki narodowe i specjalne) w chatach opartych o applet Javy

Wirtualna Maszyna Javy firmy Sun dawniej była dostępna w dwóch wersjach: angielskiej i międzynarodowej. Wersja angielska miała nieco mniejsze rozmiary, ale nie obsługiwała żadnych znaków narodowych poza tymi zawartymi w kodowaniach ISO‑8859‑1 i ISO‑8859‑15. Do obsługi polskich liter wymagana jest wersja międzynarodowa. Od wersji 1.4.2 Wirtualna Maszyna Javy dostępna jest wyłącznie w wersji międzynarodowej. Stare systemy operacyjne i stare aplikacje mogą wymagać starszej wersji Javy, osoby instalujące taką starą wersję muszą pamiętać o wyborze wersji międzynarodowej, nie angielskiej.

Sama Java cechuje się pełną obsługą unikodu (a więc i polskich liter), ale niektóre moduły używane przez programistów piszących applety Javy z różnych powodów do prawidłowego wyświetlenia znaków z ogonkami wymagają, by Java zainstalowana była na systemie z ustawionym właściwym locale (albo jak kto woli ustawieniami regionalnymi), na przykład wyświetlenie polskich liter w tak napisanych appletach możliwe jest pod warunkiem, że w momencie instalacji Javy (w wersji międzynarodowej) ustawiony był polski locale (lub inny z rejonu Europy Środkowej, który używa kodowania Windows‑1250 czy ISO‑8859‑2; prawdopodobnie możliwe też jest poprawne wyświetlanie polskich liter na systemach, na których ustawiony był locale krajów nadbałtyckich, używających kodowania Windows‑1257 czy ISO‑8859‑13, gdyż te kodowania również zawierają komplet polskich liter). Brak jest informacji o możliwości zmiany ustawień Javy odpowiedzialnych za ten efekt po instalacji.