Obsah lekce:
Poznбmkovэ blok nabнzн pouze zбkladnн moћnosti nastavenн znakovй sady. Mбme na vэbмr z ANSI, nмkolika sad Unicode a UTF-8. V pшнpadм volby UTF-8 je volba znakovй sady jasnб. Sloћitмjљн to vљak bude u znakovй sady ANSI. V tomto pшнpadм zvolenб znakovб sada zбvisн na jazykovйm nastavenн operaиnнho systйmu. Napшнklad v pшнpadм nastavenн иeskйho jazyka bude pouћita znakovб sada Windows-1250.
O nмco pokroиilejљн nastavenн znakovй sady nabнzejн pokroиilejљн editory, mezi kterй mщћeme zaшadit napшнklad populбrnн PSPad (http://www.pspad.com/cz/). Tento textovэ editor lze pouћнvat (kromм psanн bмћnйho neformбtovanйho textu) i pro editaci zdrojovэch kуdщ v rщznэch programovacнch jazycнch nebo vytvбшenн HTML strбnek.
Vэhodou pouћitн tohoto editoru je fakt, ћe narozdнl od Poznбmkovйho bloku umoћтuje uklбdat dokumenty i ve znakovй sadм ISO 8859-2 a dalљнch sadбch.
Kromм populбrnнho PSPadu existuje i mnoho dalљнch textovэch editorщ, kterй umoћтujн nastavit kуdovбnн textu. Za zmнnku stojн napшнklad Notepad2 (http://notepad-plus.sourceforge.net/uk/site.htm) nebo Notepad++ (http://notepad-plus.sourceforge.net/uk/site.htm), kterэ je na nнћe uvedenйm obrбzku.
Pokud potшebujeme provйst konverzi souboru do jinйho kуdovбnн, mщћeme pouћнt nмkterou z шady aplikacн, kterй jsou vмtљinou dostupnй zdarma ke staћenн na internetu. Pшнkladem takovй aplikace mщћe bэt napшнklad aplikace „Konverze иeљtiny“ (http://www.pokluda.com/FreewareCz.aspx). Ovlбdбnн tйto aplikace je velmi jednoduchй. Pouze vybereme zdrojovэ a cнlovэ soubor (popшнpadм mщћeme naинst data ze schrбnky nebo do schrбnky vэslednй data uloћit) a nastavнme kуdovбnн zdrojovйho a cнlovйho souboru a klikneme na tlaинtko „Proveп konverzi“. Tato aplikace podporuje vмtљinu иeskэch znakovэch sad (Windows-1250, Kуd kamenickэch, CP852, ISO 8859-2 a dalљн). Nevэhodou je, ћe nepodporuje Unicode kуdovбnн, tj. znakovй sady UTF-8 nebo UTF-16.
Dalљн moћnostн, kterб jiћ je z kategorie shareware, je program Prekodйr (http://zmsoft.cz/prekoder/index.html). Tento program lze zdarma mмsнc pouћнvat a na rozdнl od pшedchozнho programu nabнzн i moћnost pшevodu kуdovбnн UTF-8.
Vэљe uvedenн nбstroje jsou zamмшeny na иeskй znakovй sady. Nмkdy je vљak potшeba pшevйst dokument do jinй znakovй sady. Pro takovэ pшevod je moћno pouћнt napшнklad aplikaci Character Set Converter (http://www.kalytta.com/tools.php), kterб nabнzн velkэ vэbмr rщznэch znakovэch sad, avљak opмt se jednб pouze o shareware.
Kromм шady aplikacн, kterй slouћн pro pшevod diakritiky a z nichћ nмkterй byly popsбny v pшedchozн kapitole, lze vyuћнt i online nбstroje pro pшevod textu do jinэch znakovэch sad. Pшнkladem takovйto online aplikace mщћe bэt napшнklad aplikace na webu motobit.com (http://www.motobit.com/util/charset-codepage-conversion.asp), kterб umoћтuje uloћenн vloћenйho textu do rщznэch znakovэch sad a jeho nбslednй uloћenн do souboru.
Z mnoha dalљнch konvertorщ lze zmнnit napшнklad jeљtм web http://kanjidict.stc.cx/recode.php, kterэ na rozdнl od pшedchozнho pшнkladu nabнzн pouze zбkladnн moћnosti konverze.
Problematiku znakovэch sad je nutnй шeљit i v oblasti tvorby WWW strбnek. Dokument, kterэ vytvбшнme, uklбdбme v nмkterй z vэљe popsanэch znakovэch sad.
Kromм uloћenн dokumentu ve vhodnй znakovй sadм, je nutnй informaci o tйto znakovй sadм pшedat i internetovйmu prohlнћeиi. Pokud tak neuиinнme, pшichбzн v ъvahu jedna ze dvou moћnostн:
V prvnнm pшнpadм zde je riziko, ћe je dokument vytvoшen v jinй znakovй sadм, neћ je nastavena. V tom druhйm mщћe v nмkterэch pшнpadech dojнt k chybnй detekci a vэsledkem mщћe bэt neиitelnэ, tak jak zobrazuje nнћe uvedenэ obrбzek.
Pro zajiљtмnн sprбvnй detekce je tedy nutnй pouћнt nбsledujнcн META tag:
<meta http-equiv="content-type" content="text/html;charset=znakova_sada" />
Za text znakova_sada dosadнme vybranou znakovou sadu. Pro kуdovбnн иeљtiny to mщћe bэt napшнklad jedno z nбsledujнcнch jmen: iso-8859-2, windows-1250, UTF-8, …