W3C | Překlady

XML v deseti bodech

XML, XLink, Namespace, DTD, Schema, CSS, XHTML... Pro začátečníka může být těžké zjistit, kde s XML začít. Těchto deset bodů se pokouší shrnout jeho základy a umožnit tak nováčkovi, aby je pochopil. A jestli vedete kurs o XML, proč nezačít tímto souhrnem?

1. XML slouží k strukturalizaci dat

Strukturovaná data - to jsou tabulky, adresáře, konfigurace, obchodní transakce, technické výkresy... XML je soubor pravidel tvorby textových formátů, které umožní vaše data uspořádat ve strukturách. XML není programovací jazyk, a k jeho zvládnutí není třeba znalostí o programování. XML usnadňuje počítači tvořit, číst a zapisovat data, a zajistit jednoznačnost struktury dat. XML se vyhlo běžným nevýhodám popisných jazyků: je rozšiřitelné, nezávislé na platformě, a podporuje lokalizaci. XML plně vyhovuje standardu Unicode.

2. XML se podobá HTML

Stejně jako HTML, i XML používá tzv. tagy (jména uzavřená mezi špičatými závorkami, např. <zamestnanec>) a atributy (ve tvaru jméno="hodnota"). Zatímco však HTML přesně specifikuje, co který tag či atribut znamená a jak bude v prohlížeči zobrazen text uvnitř, XML používá tagy pouze k ohraničení částí dat, a jejich interpretace je přenechána aplikaci, která data čte. Jinými slovy, pokud je v XML tag <b>, nepředpokládá se, že bude obsahovat tučné písmo. Podle situace to může znamenat např. bydliště, body, barva, nebo cokoliv jiného.

3. XML je text, ale není určen ke čtení

Programy tvořící data je většinou zapisují na disk, a to buď v textovém nebo binárním formátu. Výhoda textového je, že umožňuje lidem nahlédnout do dat s obyčejným textovým editorem, a přesto budou aspoň trochu datům rozumět. Také vývojářům usnadňuje ladění programů. Jako HTML, i XML jsou textové soubory, které lidé nemusí číst, ale pokud je třeba, mohou. XML je však oproti HTML o něco přísnější, co se týká formátu. Zapomenutý tag nebo atribut bez uvozovek zneplatňuje XML soubor, zatímco HTML to někde dokonce výslovně povoluje. Oficiální XML specifikace zakazuje aplikacím "domýšlet si", co tvůrce poškozeného XML souboru zamýšlel, a pokud objeví chybu, musí načítání zastavit a ohlásit chybu.

4. XML nešetří místem

Jelikož XML je textový formát a používá tagy k oddělení dat, je soubor s daty skoro vždy větší než srovnatelná data v binárním formátu. S tím se pří návrhu XML počítalo. Výhody textového formátu jsou evidentní (viz bod 3), a nevýhody mohou být odstraněny různými cestami. Místo na disku je stále levnější, a kompresní programy zvládají zmenšit objem dat na úroveň binárních formátů. Navíc HTTP/1.1, hlavní protokol na webu, umí kompresovat data za běhu a šetří tak kapacitu linek skoro jako binární formáty.

5. XML je celá skupina technologií

XML 1.0 je specifikace, která říká, co jsou tagy a atributy. Na základě XML 1.0, "XML rodina" vytváří několik modulů, které nabízejí různé služby, které plní časté a důležité potřeby. Xlink popisuje standartní cestu, jak přidat do XML souboru hypertextové odkazy. XPointer a XFragments se ještě vyvíjejí, a budou sloužit k odkazování na části dokumentů. XPointer je něco jako URL, akorát místo odkazů na dokumenty na webu odkazuje dovnitř XML dokumentů. CSS, se dá aplikovat na XML podobně jako na HTML. XSL je vylepšený jazyk pro zapisování stylů. Je založen na XSLT, transformačním jazyce používaném pro přidávání, odebírání i úpravu tagů a atributů. The DOM je standardizace funkcí pro manipulaci s XML (a HTML) soubory v programovacích jazycích. XML Schema 1 a XML Schema 2 pomáhají vývojářům přesně definovat strukturu jejich vlastních formátů založených na XML. K dispozici je několik dalších modulů, další se vyvíjejí. Viz W3C's technical reports page.

6. XML je staronové

Vývoj XML začal v roce 1996 a stal se doporučením W3C od ledna 1998, což může budit dojem, že jde o nevyspělou technologii. Ve skutečnosti tato technologie není zcela nová. Před XML existovalo SGML, vyvíjené v osmdesátých letech, standard ISO od roku 1986, široce používaný pro rozsáhlé dokumentace. Vývoj HTML začal v roce 1990. Tvůrci XML převzali to nejlepší ze SGML podle zkušenosti s HTML, a vytvořili něco stejně mocného jako SGML, ale jednoduššího na používání. Ačkoliv, některé evoluce jsou nerozeznatelné od revolucí... A je třeba říci, že zatímco SGML je určeno spíše pro technickou dokumentaci než data jiného druhu, u XML je tomu naopak.

7. XML vede HTML k XHTML

Důležté použití XML, formát dokumentů XHTML, je nástupce HTML. XTML má mnoho elementů stejných jako HTML. Syntaxe byla pozměněna, aby vyhovovala XML. Dokument, který je založen na XML, dědí syntaxi XML a různě ji omezuje (např. XHTML povoluje <p>, ale ne např. <r>); také dává syntaxi význam (XHTML určuje, že <p> je odstavec, a ne třeba pitomý, policista, pokuta nebo pendrek.

8. XML je modulární

XML dovoluje definovat nový formát kombinací jiných formátů. Jelikož by dva formáty vyvíjené nezávisle na sobě mohly definované mít stejná jména elementů, je třeba dát na takovou situaci pozor. Aby se předešlo záměně, XML obsahuje mechanismus jmenných prostorů (namespaces). XSL a RDF jsou dobré příklady XML formátů používajících jmenné prostory. XML Schema je navrženo tak, aby umožňovalo použití jmenných prostorů při návrhu struktury dat. Pak je snadné vytvořit nové schéma kombinací dvou jiných a spojit tak strukturu dokumentu.

9. XML je základem RDF a Sémantického webu

Systém popisu zdrojů od W3C (Resource Description Framework, RDF) je XML formát podporující popis zdrojů a uplatnění metadat, jako jsou hudební "playlisty", katalogy fotografií, knihovny atd. RDF vám umožní například identifikovat lidi na webovém fotoalbu podle informací ve vašem adresáři; pak třeba může váš emailový program pro tyto lidi připravit zprávu. Tak jako HTML spojovalo dokumenty, menu a formuláře do webové aplikace, RDF spojuje aplikace a agenty do jednoho sémantického webu. Tak jako se musí lidé dohodnout na významu slov používaných v komunikaci, i počítače musí mít význam termínů definovaný, aby mohly pracovat efektivně. Formální popisy termínů z určité oblasti (nakupování, výroba, ...) se nazývají "ontologie" a jsou nezbytnou součástí sémantického webu. RDF, ontologie a reprezentace významů tak, aby mohly počítače lidem pomoci v práci, to jsou témata Aktivity sématnického webu.

10. XML je nelicencované, platformově nezávislé a široce podporované

Volbou XML za základ projektu získáte přístup k obsáhlé a rostoucí skupině nástrojů (z nichž jeden dokonce může být to, co potřebujete!) a odborníků se zkušenostmi z oblasti XML. Volba XML je něco jako když zvolíte SQL pro databázi: pořád musíte vytvořit vlastní databázi a programy na její obsluhu, ale existuje mnoho nástrojů a lidí, kteří vám mohou pomoci. A jelikož XML je k dispozici bez licence, můžete vytvořit vlastní software pracující s XML, aniž byste něco platili. Rostoucí podpora a velký počet vývojářů vám navíc dají jistotu, že se nemusíte vázat k jedinému výrobci softwaru. XML není vždy nejlepší volbou, ale vždy se vyplatí ho uvážit jako možnost.


Přeložil Ondra Žižka

W3C Communications Team, w3t-comm@w3.org
Revised 13 Nov. 2001 (last update: $Date: 2002/08/21 07:24:11 $)
Created 27 Mar 1999 by Bert Bos
(Předchozí verze)

Copyright © 1999-2000 W3C® ( MIT, INRIA, Keio), All Rights Reserved.