Start
Komme igang
XML-Regler
DTD
XSL
Eksempel

XML regler

  • XML dokumenter må ha en rot tag
  • Alle tagger må ha en avsluttende tag
  • XML tagger er case sensitive
  • XML elementer må nestes korrekt
  • Åpne tagger må inneholde en avsluttende slash, slik <br/>

Tagger kan inneholde attributter.
Disse kommer i navn - verdi par, (name-value pair), slik:

<songlist sendedato= "03.04.06"> (hele eksempelet her)

Kommentarer kan settes inn alle steder i teksten utenom tagger. De har samme form som i html:
<!-- Kommentar, gyldig både i XML og html -->

Tagger kan ikke begynne på tall, &, xml.
Dersom teksten skal inneholde data som XML parseren tolker som noe annet enn tekst, kan den pakkes inn i en CDATA, slik:
<![CDATA[ Text to be ignored ]]>

Tekst som ikke skal tolkes, f.eks < > & / kan også omskrives med entity reference

Entity Character
&alt;
&gt;
&amp;
&apos;
&quot;
<
>
&
'
"

XML preserves white spaces

Namespaces
Siden mange kan bruke de samme taggene kan man bruke en URI (Universal Resource Identifier. Kombinasjon av lokale navn, kolon : og URI skaper universelle navn (universal names).
Slik:
<wrox:name> Kevin Williams </wrox:name>

DTD
external:
Man deklarerer hvor et XML dokuments Data Type Definition befinner seg i en Data Type Declaration, slik:
<!DOCTYPE MyXMLDoc SYSTEM "http://www.sundet.no/MyXMLDoc.dtd">

internal:
Nøkkelordet SYSTEM forteller at denne DTDen er en ekstern fil. DTDen kan heter hva som helst.
Hvis DTDen skrives inne i XML dokumentet deklareres den slik:
<!DOCTYPE MyXMLDoc [ <!ELEMENT MyXMLDoc (#PCDATA)> ]>

Viktigst i DTDen er element deklarasjon

Innhold i en element deklarasjon i en DTD:
<!ELEMENT elementName (contentModel)>
hvor elementName er navnet på elementet og contentModel hva elementet kan inneholde.

Operator Betyr:
?
*
(ingenting)
+
0 eller 1 gang
0 eller flere
Akkurat 1
1 eller flere

Det er mulig å sette | melleom elementene, betyr enten, eller, men bare en av dem.

 

 

se W3C definisjoner

1. Introduction
1.1 Origin and Goals
1.2 Terminology
2. Documents
2.1 Well-Formed XML Documents
2.2 Characters
2.3 Common Syntactic Constructs
2.4 Character Data and Markup
2.5 Comments
2.6 Processing Instructions
2.7 CDATA Sections
2.8 Prolog and Document Type Declaration
2.9 Standalone Document Declaration
2.10 White Space Handling
2.11 End-of-Line Handling
2.12 Language Identification
3. Logical Structures
3.1 Start-Tags, End-Tags, and Empty-Element Tags
3.2 Element Type Declarations
3.2.1 Element Content
3.2.2 Mixed Content
3.3 Attribute-List Declarations
3.3.1 Attribute Types
3.3.2 Attribute Defaults
3.3.3 Attribute-Value Normalization
3.4 Conditional Sections
4. Physical Structures
4.1 Character and Entity References
4.2 Entity Declarations
4.2.1 Internal Entities
4.2.2 External Entities
4.3 Parsed Entities
4.3.1 The Text Declaration
4.3.2 Well-Formed Parsed Entities
4.3.3 Character Encoding in Entities
4.4 XML Processor Treatment of Entities and References
4.4.1 Not Recognized
4.4.2 Included
4.4.3 Included If Validating
4.4.4 Forbidden
4.4.5 Included in Literal
4.4.6 Notify
4.4.7 Bypassed
4.4.8 Included as PE
4.5 Construction of Internal Entity Replacement Text
4.6 Predefined Entities
4.7 Notation Declarations
4.8 Document Entity
5. Conformance
5.1 Validating and Non-Validating Processors
5.2 Using XML Processors
6. Notation


Text consists of intermingled character data and markup. Markup takes the form of start-tags, end-tags, empty-element tags, entity references, character references, comments, CDATA section delimiters, document type declarations, and processing instructions.

All text that is not markup constitutes the character data of the document.

Web ressurser:

W3C om XML
W3C definisjoner
Java og XML
XML-org
w3schools om XML
XML-parsere

Her kan du
VALIDERE XML

XML Quiz