| Překlady
Strukturovaná data
- to jsou tabulky, adresáře, konfigurace, obchodní transakce, technické výkresy... XML je
soubor pravidel tvorby textových formátů, které umožní vaše data uspořádat ve
strukturách. XML není programovací jazyk, a k jeho zvládnutí není třeba znalostí o
programování. XML usnadňuje počítači tvořit, číst a zapisovat data, a zajistit jednoznačnost
struktury dat. XML se vyhlo běžným nevýhodám popisných jazyků: je rozšiřitelné,
nezávislé na platformě, a podporuje lokalizaci. XML plně vyhovuje standardu Unicode.
Stejně jako HTML, i XML
používá tzv. tagy (jména uzavřená mezi špičatými závorkami, např.
<zamestnanec>) a atributy (ve tvaru jméno="hodnota"). Zatímco však HTML přesně
specifikuje, co který tag či atribut znamená a jak bude v prohlížeči zobrazen text uvnitř,
XML používá tagy pouze k ohraničení částí dat, a jejich interpretace je přenechána
aplikaci, která data čte. Jinými slovy, pokud je v XML tag <b>, nepředpokládá se, že
bude obsahovat tučné písmo. Podle situace to může znamenat např. bydliště, body,
barva, nebo cokoliv jiného.
Programy tvořící data
je většinou zapisují na disk, a to buď v textovém nebo binárním formátu. Výhoda
textového je, že umožňuje lidem nahlédnout do dat s obyčejným textovým editorem, a
přesto budou aspoň trochu datům rozumět. Také vývojářům usnadňuje ladění programů. Jako HTML, i
XML jsou textové soubory, které lidé nemusí číst, ale pokud je třeba, mohou. XML je však
oproti HTML o něco přísnější, co se týká formátu. Zapomenutý tag nebo atribut bez
uvozovek zneplatňuje XML soubor, zatímco HTML to někde dokonce výslovně povoluje. Oficiální XML
specifikace zakazuje aplikacím "domýšlet si", co tvůrce poškozeného XML souboru
zamýšlel, a pokud objeví chybu, musí načítání zastavit a ohlásit chybu.
Jelikož XML je
textový formát a používá tagy k oddělení dat, je soubor s daty skoro vždy
větší než srovnatelná data v binárním formátu. S tím se pří návrhu XML počítalo.
Výhody textového formátu jsou evidentní (viz bod 3), a nevýhody mohou být odstraněny různými
cestami. Místo na disku je stále levnější, a kompresní programy zvládají zmenšit
objem dat na úroveň binárních formátů. Navíc HTTP/1.1, hlavní protokol na webu, umí
kompresovat data za běhu a šetří tak kapacitu linek skoro jako binární formáty.
XML 1.0 je specifikace, která říká, co jsou tagy a atributy. Na
základě XML 1.0, "XML rodina" vytváří několik modulů, které nabízejí různé služby, které
plní časté a důležité potřeby. Xlink popisuje
standartní cestu, jak přidat do XML souboru hypertextové odkazy. XPointer a XFragments se ještě vyvíjejí, a budou
sloužit k odkazování na části dokumentů. XPointer je něco jako URL, akorát místo odkazů na
dokumenty na webu odkazuje dovnitř XML dokumentů. CSS,
se dá aplikovat na XML podobně jako na HTML. XSL je vylepšený jazyk pro zapisování stylů. Je založen na XSLT, transformačním jazyce používaném pro přidávání,
odebírání i úpravu tagů a atributů. The DOM je
standardizace funkcí pro manipulaci s XML (a HTML) soubory v programovacích jazycích. XML Schema 1 a XML
Schema 2 pomáhají vývojářům přesně definovat strukturu jejich vlastních formátů
založených na XML. K dispozici je několik dalších modulů, další se vyvíjejí.
Viz W3C's technical reports page.
Vývoj XML začal v roce
1996 a stal se doporučením W3C od ledna 1998, což může budit dojem, že jde o
nevyspělou technologii. Ve skutečnosti tato technologie není zcela nová. Před XML existovalo
SGML, vyvíjené v osmdesátých letech, standard ISO od roku 1986, široce používaný
pro rozsáhlé dokumentace. Vývoj HTML začal v roce 1990. Tvůrci XML převzali to nejlepší
ze SGML podle zkušenosti s HTML, a vytvořili něco stejně mocného jako SGML, ale
jednoduššího na používání. Ačkoliv, některé evoluce jsou nerozeznatelné od
revolucí... A je třeba říci, že zatímco SGML je určeno spíše pro technickou
dokumentaci než data jiného druhu, u XML je tomu naopak.
Důležté
použití XML, formát dokumentů XHTML, je nástupce HTML. XTML má mnoho elementů stejných
jako HTML. Syntaxe byla pozměněna, aby vyhovovala XML. Dokument, který je založen na XML,
dědí syntaxi XML a různě ji omezuje (např. XHTML povoluje <p>, ale ne např. <r>);
také dává syntaxi význam (XHTML určuje, že <p> je odstavec, a ne třeba pitomý,
policista, pokuta nebo pendrek.
XML dovoluje
definovat nový formát kombinací jiných formátů. Jelikož by dva formáty vyvíjené nezávisle
na sobě mohly definované mít stejná jména elementů, je třeba dát na takovou situaci pozor. Aby
se předešlo záměně, XML obsahuje mechanismus jmenných prostorů (namespaces). XSL a RDF jsou dobré příklady XML formátů používajících jmenné
prostory. XML Schema je navrženo tak, aby
umožňovalo použití jmenných prostorů při návrhu struktury dat. Pak je snadné vytvořit
nové schéma kombinací dvou jiných a spojit tak strukturu dokumentu.
Systém popisu zdrojů
od W3C (Resource Description Framework, RDF) je XML
formát podporující popis zdrojů a uplatnění metadat, jako jsou hudební "playlisty", katalogy
fotografií, knihovny atd. RDF vám umožní například identifikovat lidi na webovém fotoalbu
podle informací ve vašem adresáři; pak třeba může váš emailový program pro
tyto lidi připravit zprávu. Tak jako HTML spojovalo dokumenty, menu a formuláře do webové
aplikace, RDF spojuje aplikace a agenty do jednoho sémantického webu. Tak jako se musí lidé
dohodnout na významu slov používaných v komunikaci, i počítače musí mít význam termínů definovaný, aby mohly pracovat efektivně.
Formální popisy termínů z určité oblasti (nakupování, výroba, ...) se nazývají "ontologie" a
jsou nezbytnou součástí sémantického webu. RDF, ontologie a reprezentace významů tak, aby mohly
počítače lidem pomoci v práci, to jsou témata Aktivity
sématnického webu.
Volbou XML za základ
projektu získáte přístup k obsáhlé a rostoucí skupině nástrojů (z nichž jeden dokonce
může být to, co potřebujete!) a odborníků se zkušenostmi z oblasti XML. Volba XML
je něco jako když zvolíte SQL pro databázi: pořád musíte vytvořit vlastní databázi a
programy na její obsluhu, ale existuje mnoho nástrojů a lidí, kteří vám mohou pomoci. A
jelikož XML je k dispozici bez licence, můžete vytvořit vlastní software pracující s
XML, aniž byste něco platili. Rostoucí podpora a velký počet vývojářů vám navíc dají
jistotu, že se nemusíte vázat k jedinému výrobci softwaru. XML není vždy
nejlepší volbou, ale vždy se vyplatí ho uvážit jako možnost.
Přeložil Ondra Žižka
W3C Communications Team, w3t-comm@w3.orgCopyright © 1999-2000 W3C® ( MIT, INRIA, Keio), All Rights Reserved.