XML regler
- XML dokumenter må ha en rot tag
- Alle tagger må ha en avsluttende tag
- XML tagger er case sensitive
- XML elementer må nestes korrekt
- Åpne tagger må inneholde en avsluttende slash, slik
<br/>
Tagger kan inneholde attributter.
Disse kommer i navn - verdi par, (name-value pair), slik:
<songlist sendedato= "03.04.06"> (hele eksempelet
her)
Kommentarer kan settes inn alle steder i teksten utenom tagger. De har
samme form som i html:
<!-- Kommentar, gyldig både i XML og html -->
Tagger kan ikke begynne på tall, &, xml.
Dersom teksten skal inneholde data som XML parseren tolker som noe annet
enn tekst, kan den pakkes inn i en CDATA, slik:
<![CDATA[ Text to be ignored ]]>
Tekst som ikke skal tolkes, f.eks < > & / kan også omskrives
med entity reference
Entity |
Character |
&alt; > & ' "
|
< > &
' " |
XML preserves white spaces
Namespaces
Siden mange kan bruke de samme taggene kan man bruke en URI (Universal
Resource Identifier. Kombinasjon av lokale navn, kolon
: og URI skaper universelle navn (universal
names).
Slik:
<wrox:name> Kevin Williams </wrox:name>
DTD
external:
Man deklarerer hvor et XML dokuments Data Type Definition
befinner seg i en Data Type Declaration, slik:
<!DOCTYPE MyXMLDoc SYSTEM "http://www.sundet.no/MyXMLDoc.dtd">
internal:
Nøkkelordet SYSTEM forteller at denne DTDen er
en ekstern fil. DTDen kan heter hva som helst.
Hvis DTDen skrives inne i XML dokumentet deklareres den slik:
<!DOCTYPE MyXMLDoc [ <!ELEMENT MyXMLDoc (#PCDATA)> ]>
Viktigst i DTDen er element deklarasjon
Innhold i en element deklarasjon i en DTD:
<!ELEMENT elementName (contentModel)>
hvor elementName er navnet på elementet og contentModel hva elementet
kan inneholde.
Operator |
Betyr: |
?
*
(ingenting)
+
|
0 eller 1 gang
0 eller flere
Akkurat 1
1 eller flere |
Det er mulig å sette | melleom elementene, betyr enten, eller,
men bare en av dem.
se W3C definisjoner
1. Introduction
1.1 Origin and Goals
1.2 Terminology
2. Documents
2.1 Well-Formed XML Documents
2.2 Characters
2.3 Common Syntactic Constructs
2.4 Character Data and Markup
2.5 Comments
2.6 Processing Instructions
2.7 CDATA Sections
2.8 Prolog and Document Type Declaration
2.9 Standalone Document Declaration
2.10 White Space Handling
2.11 End-of-Line Handling
2.12 Language Identification
3. Logical Structures
3.1 Start-Tags, End-Tags, and Empty-Element Tags
3.2 Element Type Declarations
3.2.1 Element Content
3.2.2 Mixed Content
3.3 Attribute-List Declarations
3.3.1 Attribute Types
3.3.2 Attribute Defaults
3.3.3 Attribute-Value Normalization
3.4 Conditional Sections
4. Physical Structures
4.1 Character and Entity References
4.2 Entity Declarations
4.2.1 Internal Entities
4.2.2 External Entities
4.3 Parsed Entities
4.3.1 The Text Declaration
4.3.2 Well-Formed Parsed Entities
4.3.3 Character Encoding in Entities
4.4 XML Processor Treatment of Entities and References
4.4.1 Not Recognized
4.4.2 Included
4.4.3 Included If Validating
4.4.4 Forbidden
4.4.5 Included in Literal
4.4.6 Notify
4.4.7 Bypassed
4.4.8 Included as PE
4.5 Construction of Internal Entity Replacement Text
4.6 Predefined Entities
4.7 Notation Declarations
4.8 Document Entity
5. Conformance
5.1 Validating and Non-Validating Processors
5.2 Using XML Processors
6. Notation
Text consists of intermingled character data and markup. Markup takes
the form of start-tags, end-tags, empty-element tags, entity references,
character references, comments, CDATA section delimiters, document type
declarations, and processing instructions.
All text that is not markup constitutes the character data of the document.
|