Arkusz stylów (stylesheet)

- dokument definiujący sposób formatowania dokumentu XML w zależności od struktury elementów oraz atrybutów tego dokumentu. Do bardziej znanych języków definiowania arkuszy stylów należą: DSSSL, FOSI, CSS oraz XSL:FO. Arkuszami stylów nazywa się także transformacje XSLT przekształcające dokument do formatu HTML.

Atrybut (attribute)

- sposób przypisania właściwości elementom w dokumencie. Atrybut posiada nazwę oraz wartość. Definiując strukturę dokumentu przy pomocy DTD lub XML Schema, określa się nazwy, typy oraz domyślne wartości atrybutów niezależnie dla poszczególnych elementów.

Atrybut encyjny (entity attribute)

- atrybut zadeklarowany przy pomocy słowa kluczowego ENTITY, służący do umieszczania odwołań do encji nieprzetwarzanych. Deklaracja atrybutu encyjnego określa notację, z którą zawartość encji nieprzetwarzanej powinna być zgodna. Zgodność ta nie jest oczywiście weryfikowana przez procesor XML. Notacja określona w deklaracji jest jedynie wskazówką dla aplikacji przetwarzającej, jakiego formatu zawartości encji nieprzetwarzanej może oczekiwać.

Atrybut FIXED (FIXED attribute)

- atrybut, którego deklaracja zawiera wartość domyślną, która nie może być zmieniona w dokumentach. Z reguły wartości atrybutów FIXED nie podaje się w ogóle w dokumentach (jeżeli wartość jest podana, to musi być identyczna z wartością podaną w deklaracji). Atrybutów takich używa się zwykle do parametryzowania aplikacji przetwarzającej dokument, która może wykorzystywać ich wartości np. do przeprowadzenia dodatkowej weryfikacji poprawności zawartości elementu.

Atrybut notacyjny (notation attribute)

- atrybut deklarujący, że zawartość elementu posiadającego ten atrybut jest zgodna z notacją, której nazwa jest wartością atrybutu. Zgodność ta nie jest oczywiście weryfikowana przez procesor XML. Deklaracja takiego atrybutu zawiera listę dopuszczalnych wartości, które muszą być nazwami zadeklarowanych notacji.

Atrybut wyliczeniowy (enumerated attribute)

- atrybut, którego wartości mogą pochodzić jedynie ze zbioru dopuszczalnych wartości określonego jawnie w deklaracji atrybutu.

Atrybuty ID i IDREF (ID and IDREF attributes)

- atrybuty pozwalające na kodowanie prostych powiązań między elementami dokumentu XML. W dokumencie poprawnym strukturalnie, wartości wszystkich atrybutów zadeklarowanych jako ID muszą być unikatowe. Ponadto, dla każdego atrybutu zadeklarowanego jako IDREF, musi istnieć w dokumencie atrybut ID o tej samej wartości.

Deklaracja notacji (notation declaration)

- konstrukcja składniowa służąca do nadawania lokalnej, wewnętrznej nazwy istniejącej notacji. Częścią deklaracji jest identyfikator zewnętrzny, wskazujący np. na specyfikację notacji lub aplikację przetwarzającą dokumenty zgodne z notacją.

Deklaracja samodzielności dokumentu (standalone document declaration)

- część deklaracji XML, określająca, czy procesor musi zinterpretować zewnętrzny podzbiór DTD, aby poprawnie przetworzyć dokument (np. przypisać domyślne wartości atrybutom nie podanym jawnie w dokumencie).

Deklaracja typu dokumentu (document type declaration)

- umieszczane opcjonalnie po deklaracji XML określenie typu dokumentu. Ma ona postać odwołania do encji zewnętrznej zawierającej zewnętrzny podzbiór DTD i/lub zbioru deklaracji umieszczonych bezpośrednio w deklaracji typu dokumentu, tworzących wewnętrzny podzbiór DTD.

Deklaracja XML (XML declaration)

- opcjonalna instrukcja przetwarzania rozpoczynająca dokument XML, określająca wersję składni XML-a stosowaną w dokumencie, użyty standard kodowania znaków oraz zawierający deklarację samodzielności dokumentu.

DOM (Document Object Model)

- obiektowy model dostępu do zawartości dokumentów XML, realizowany przez procesory XML. Procesor DOM tworzy w pamięci drzewo obiektów odpowiadających strukturze dokumentu, reprezentujących elementy, atrybuty, instrukcje przetwarzania, itp. Aplikacja korzystająca z procesora "wędruje" po drzewie, odczytując z niego odpowiednie wartości. Ma także możliwość modyfikacji dokumentu poprzez dokonywanie zmian w drzewie obiektów.

DTD (definicja typu dokumentu (Document Type Definition)

- 1. Formalna definicja dopuszczalnej struktury dokumentu, pozwalająca na kontrolowanie przez aplikacje poprawności strukturalnej dokumentów. W skład DTD wchodzą m. in.: deklaracje elementów oraz ich zawartości, deklaracje atrybutów oraz encji. 2. (potocznie) Język deklaracji, służący do definiowania typów dokumentów.

Element (element)

- podstawowa jednostka logicznej struktury dokumentu XML. Cały dokument XML ma postać jednego elementu głównego (root element). Zawartością elementów są: tekst oraz inne elementy. Struktura elementów jest kodowana w dokumencie przy pomocy znaczników.

Encja (entity)

- 1. Jednostka fizycznej budowy dokumentu, pozwalająca na jego elastyczną organizację, np.: wielokrotne wykorzystywanie tych samych fragmentów tekstu, dołączanie fragmentów dokumentu z zewnętrznych plików, itp. Encja posiada swoją nazwę oraz zawartość. 2. Fizyczna reprezentacja obiektu informacyjnego przechowywanego w systemie (np. jako plik lub pole w bazie danych), lub tworzonego w locie przez program. Uogólnienie pojęcia plik.

Encja nieprzetwarzana (unparsed entity)

- encja zewnętrzna, która nie jest przetwarzana przez procesor XML. Encje nieprzetwarzane są zwykle używane do formułowania odwołań do grafiki, dźwięku i innych obiektów binarnych, które nie mogą być bezpośrednio umieszczone w dokumencie XML. Odwołania do encji nieprzetwarzanych koduje się przy pomocy atrybutów encyjnych.

Encja ogólna (general entity)

- każda encja, która nie jest encją parametryczną. Encje ogólne są używane w treści dokumentów.

Encja parametryczna (parameter entity)

- encja, zadeklarowana przy pomocy specjalnej składni, która może być używana wyłącznie w DTD, najczęściej w celu wielokrotnego wykorzystania tych samych fragmentów definicji w wielu miejscach.

Encja predefiniowana (predefined entity)

- encja, do której można się odwoływać bez jej wcześniejszego zadeklarowania. Pięć encji predefiniowanych pozwala używać w dokumentach XML znaków zastrzeżonych dla składni XML, np. encja < reprezentuje znak <.

Encja przetwarzana (parsed entity)

- encja (wewnętrzna lub zewnętrzna), której zawartość jest przetwarzana przez procesor XML w miejscu wystąpienia odwołania do encji na równi z pozostałą zawartością dokumentu. Interpretacja odwołania do encji przetwarzanej polega na zastąpieniu odwołania przez zawartość encji.

Encja wewnętrzna (internal entity)

- encja (ogólna lub parametryczna), której zawartość jest podana w miejscu jej deklaracji.

Encja zewnętrzna (external entity)

- encja (ogólna lub parametryczna, przetwarzana lub nie), której wartość pobierana jest z systemu (np. z pliku, z Internetu), z miejsca określonego identyfikatorem zewnętrznym.

Identyfikator publiczny (public identifier)

- identyfikator zewnętrzny poprzedzony słowem kluczowym PUBLIC, definiujący położenie obiektu przy pomocy ustalonego, unikatowego ciągu znaków, który nie zależy od miejsca przechowywania obiektu w konkretnym systemie. Aplikacje wspierające wykorzystanie identyfikatorów publicznych znajdują położenie obiektu dzięki konfiguracji określającej położenie obiektów o danych identyfikatorach publicznych.

Identyfikator systemowy (system identifier)

- identyfikator zewnętrzny poprzedzony słowem kluczowym SYSTEM, definiujący położenie obiektu przy pomocy URI.

Identyfikator zewnętrzny (external identifier)

- ciąg znaków definiujący odwołanie do obiektu znajdującego się poza encją, w której występuje. Wyróżniamy identyfikatory systemowe oraz publiczne.

Instrukcja przetwarzania (processing instruction)

- konstrukcja składniowa nie wchodząca w skład struktury hierarchicznej dokumentu XML, nie wymagająca deklarowania w DTD ani w dokumencie, interpretowana w całości przez aplikację przetwarzającą dokument. Instrukcje przetwarzania służą do kodowania - poza strukturą elementów - poleceń lub informacji przeznaczonych dla konkretnej aplikacji. Składnia informacji zawartych w instrukcji przetwarzania jest dowolna. Ich interpretacja zależy od aplikacji, dla której instrukcja jest przeznaczona (identyfikowanej przy pomocy podmiotu instrukcji przetwarzania).

Metainformacje (metadata)

- informacje o dokumencie (np. tytuł, data publikacji, autor), z określonych powodów (np. łatwość wyszukiwania) wyodrębnione z dokumentu lub w specjalny sposób wyróżnione w dokumencie. Granica między informacją (zawartością dokumentu) a metainformacją jest płynna i zależy od konkretnego zastosowania.

Metajęzyk (metalanguage)

- język przeznaczony do definiowania innych języków. Metajęzykami są m. in. SGML i XML, ponieważ każde z ich zastosowań - definiowanych np. przy pomocy DTD - można uważać za osobny język, wykorzystujący składnię SGML-a lub XML-a.

Normalizacja wartości atrybutu (attribute value normalization)

- proces wykonywany przez procesor XML na wartościach atrybutów w dokumencie, polegający m. in. na rozwinięciu encji, zastąpieniu znaków końca linii spacjami oraz zastąpieniu ciągów spacji pojedynczymi spacjami. Dzięki normalizacji, w wartościach atrybutów można np. umieszczać dodatkowe białe znaki formatujące dokument.

Notacja (notation)

- abstrakcyjna definicja formatu danych. Reguły notacji określają sposób przetwarzania dokumentu zgodnego z tą notacją. Notacjami są np.: XML, SGML, GIF, PDF. W dokumentach XML notacje są wykorzystywane m. in. do określania formatu danych zawartych w encjach nieprzetwarzanych. Notacje deklaruje się przy pomocy deklaracji notacji.

Odwołanie do encji (entity reference)

- miejsce w dokumencie, w którym następuje interpretacja zawartości encji.

Parser XML (XML parser)

- patrz: procesor XML.

Podmiot instrukcji przetwarzania (processing instruction target)

- nazwa umieszczana na początku instrukcji przetwarzania, określająca aplikację, dla której instrukcja jest przeznaczona i która powinna ją zinterpretować. Użycie podmiotów w treści instrukcji przetwarzania pozwala aplikacjom interpretować tylko własne instrukcje, zaś ignorować instrukcje przeznaczone dla innych aplikacji.

Poprawność składniowa (well-formedness)

- własność każdego dokumentu XML. Dokumenty XML są budowane według ściśle określonych reguł (reguł poprawności składniowej), np. dla każdego znacznika początkowego musi istnieć odpowiadający mu znacznik końcowy, elementy nie mogą "zachodzić na siebie", wartości atrybutów podaje się w cudzysłowach lub apostrofach, itp.

Poprawność strukturalna (validity)

- własność, którą mogą (lecz nie muszą) posiadać dokumenty XML, dla których zdefiniowano strukturę dokumentu (np. przy pomocy DTD lub XML Schema). Dokument poprawny strukturalnie to taki, który jest zgodny z określoną dla niego definicją struktury.

Procesor XML (XML processor)

- moduł programistyczny, najczęściej dołączany do aplikacji w postaci biblioteki, wykonujący analizę leksykalną i składniową dokumentów XML. Dzięki procesorom, programiści aplikacji operują abstrakcyjnymi strukturami danych bez potrzeby skupiania się na składni XML-a. Procesory realizują zwykle jeden z dwóch modeli programistycznych dostępu do dokumentów: DOM lub SAX (czasami oba). Wyróżniamy procesory niewalidujące (sprawdzające jedynie poprawność składniową dokumentów) oraz walidujące (sprawdzające także poprawność strukturalną).

Przestrzeń nazw (namespace)

- konwencja nazewnicza elementów i atrybutów, pozwalająca na odróżnienie - przy pomocy prefiksów przestrzeni nazw - elementów lub atrybutów o takiej samej nazwie, lecz o różnym znaczeniu. Sytuacja taka występuje często np. podczas "zanurzania" jednego dokumentu XML wewnątrz innego. Unikatowość samych przestrzeni nazw uzyskuje się, definiując je przy pomocy unikatowych identyfikatorów URI.

SAX (Simple API for XML)

- zdarzeniowy model dostępu do zawartości dokumentów XML, realizowany przez procesory XML. Działanie procesora SAX polega na generowaniu zdarzeń odpowiadających elementom struktury dokumentu. Zdarzenia te są obsługiwane przez aplikację korzystająca z procesora.

Schemat (schema)

- zob. typ dokumentu. Pojęcie używane zwłaszcza w tych kontekstach, gdzie typy dokumentów definiuje się przy pomocy XML Schema.

Sekcja CDATA (CDATA section)

- specjalnie oznaczony fragment zawartości dokumentu, w której znaki i konstrukcje składniowe zastrzeżone dla składni XML-a nie są interpretowane przez procesor XML, lecz traktowane jako literalny tekst.

Sekcja warunkowa (conditional section)

- specjalnie oznaczony fragment zewnętrznego podzbioru DTD (lub encji zewnętrznej, do której odwołuje się wewnętrzny podzbiór DTD), którego zawartość - w zależności od użytego słowa kluczowego (INCLUDE lub IGNORE) - jest normalnie przetwarzana lub ignorowana przez procesor. Sekcje warunkowe najczęściej używane są wraz z encjami parametrycznymi i służą z reguły do wersjonowania DTD: ten sam dokument może definiować kilka wersji DTD, pomiędzy którymi przełączania dokonuje się włączając pewne sekcje warunkowe, zaś ignorując inne.

SGML (Standard Generalized Markup Language)

- 1. Standard ISO 8859:1986, język oparty na oznakowaniu (markup), służący do kodowania dokumentów strukturalnych. W porównaniu z XML-em jest bardziej elastyczny i trudniejszy w automatycznym przetwarzaniu. Najczęściej stosowany w dużych, zaawansowanych systemach zarządzania treścią. 2. Metajęzyk służący do definiowania - przy pomocy DTD - języków wykorzystujących wspólną składnię.

Typ dokumentu (document type)

- klasa dokumentów o podobnym przeznaczeniu, zbudowanych według takich samych reguł. Typy dokumentów XML definiuje się np. przy pomocy DTD lub XML Schema.

Unicode

- międzynarodowy standard kodowania znaków narodowych. Każdy znak spoza podstawowego zbioru ASCII jest kodowany przy pomocy dwóch bajtów.

Wartość domyślna atrybutu (attribute's default value)

- wartość określona w deklaracji atrybutu, przyjmowana przez procesor XML jako wartość atrybutu wówczas, gdy wartość ta nie została określona jawnie w dokumencie.

Wewnętrzny podzbiór DTD (internal DTD subset)

- część DTD zdefiniowana bezpośrednio w dokumencie, wewnątrz deklaracji typu dokumentu. Z reguły zawiera deklaracje specyficzne dla danego dokumentu, np. deklaracje encji zewnętrznych.

XHTML

- zastosowanie XML-a, w którym struktura dokumentu oraz deklaracje elementów odpowiadają strukturze oraz deklaracjom elementów języka HTML. Stosowany przede wszystkim jako format pośredni w transformacjach XSLT do formatu HTML.

XLink

- język definiowania dowiązań (linków) między dokumentami XML, oferujący dużo większą elastyczność w porównaniu z dowiązaniami np. w HTML-u. XLink pozwala m. in. tworzyć dowiązania dwukierunkowe, o więcej niż dwóch końcach, przechowywane w całości poza dokumentami, których dotyczą (np. w bazie danych).

XML Schema

- alternatywny w stosunku do DTD język definiowania typów dokumentów XML. Oferuje większą - w stosunku do DTD - kontrolę nad zawartością elementów, pozwalając m. in. określać typy zawartości elementów, minimalną i maksymalną liczbę powtórzeń elementów, definiować typy złożone, itp.

XPath

- język, w którym zapisuje się odwołania do części składowych struktury dokumentu XML (elementów, atrybutów, tekstu, itp.). Wykorzystywany m. in. w arkuszach stylów XSL:FO, transformacjach XSLT oraz w zapytaniach języka XQL.

XQL (XML Query Language)

- język służący do formułowania zapytań o zawartość dokumentów XML.

XSL:FO (Extensible Stylesheet Language - Formatting Objects)

- język (zastosowanie XML-a) definiowania arkuszy stylów dla dokumentów XML. Narzędzia interpretujące XSL:FO najczęściej wykonują transformację dokumentu źródłowego do formatu PDF.

XSLT (Extensible Stylesheet Language Transformations)

- język (zastosowanie XML-a) definiowania transformacji dokumentów XML do innych dokumentów XML lub do dokumentów tekstowych. Możliwe są również transformacje do HTML-a - poprzez format pośredni XHTML. Takie transformacje nazywa się arkuszami stylów.

Zastosowanie XML-a (XML application)

- język używający składni XML-a, najczęściej zdefiniowany przy pomocy DTD lub XML Schema (patrz także: typ dokumentu).

Zawartość mieszana (mixed content)

- jeden z często stosowanych modeli zawartości elementu, w którym tekst może być w dowolny sposób przeplatany elementami.

Zewnętrzny podzbiór DTD (external DTD subset)

- część DTD umieszczona w osobnej encji zewnętrznej, do której deklaracja typu dokumentu odwołuje się przy pomocy identyfikatora zewnętrznego. Z reguły zawiera deklaracje wspólne dla wszystkich dokumentów danego typu, tj. deklaracje elementów oraz atrybutów.

Znacznik (tag)

- konstrukcja składniowa, pozwalająca na kodowanie w dokumencie XML struktury elementów. Zawartość elementu umieszcza się w dokumencie pomiędzy znacznikiem początkowym (np. <znacznik>) a końcowym (np. </znacznik>). Elementy puste (bez zawartości) mogą być także symbolizowane przez znaczniki pustych elementów (np. <znacznik/>).