Aturan sintaks XML sangat sederhana dan logis. Aturannya mudah dipelajari, dan mudah digunakan.
Section Artikel
Dokumen XML harus berisi satu elemen root yang merupakan parents dari semua elemen lainnya:
<root> <child> <subchild>.....</subchild> </child> </root>
Dalam contoh ini <note> adalah elemen root:
<?xml version="1.0" encoding="UTF-8"?> <note> <to>Tove</to> <from>Jani</from> <heading>Reminder</heading> <body>Don't forget me this weekend!</body> </note>
Baris ini disebut prolog XML:
<?xml version="1.0" encoding="UTF-8"?>
Prolog XML bersifat opsional. Jika ada, itu harus didahulukan dalam dokumen.
Dokumen XML dapat berisi karakter internasional, seperti øæå Norwegia atau êèé Prancis.
Untuk menghindari kesalahan, kita harus menentukan pengkodean yang digunakan atau simpan file XML sebagai UTF-8.
UTF-8 adalah pengkodean karakter default untuk dokumen XML.
UTF-8 juga merupakan pengkodean default untuk HTML5, CSS, JavaScript, PHP, dan SQL.
Dalam XML, adalah ilegal untuk menghilangkan tag penutup. Semua elemen harus memiliki tag penutup:
<p>This is a paragraph.</p> <br />
Catatan: Prolog XML tidak memiliki tag penutup! Ini bukan sebuah kesalahan. Prolog bukan merupakan bagian dari dokumen XML.
Tag XML peka huruf besar kecil. Tag <Letter> berbeda dengan tag <lebar> .
Tag pembuka dan penutup harus ditulis dengan kasus yang sama:
<message>This is correct</message>
“Tag pembuka dan penutup” sering disebut sebagai “Tag awal dan akhir”.
Di HTML, kita mungkin melihat elemen bertingkat yang tidak tepat:
<b><i>This text is bold and italic</b></i>
Dalam XML, semua elemen harus bertumpuk dengan benar satu sama lain:
Dalam XML, semua elemen harus bertumpuk dengan benar satu sama lain:
Dalam contoh di atas, “Tersarang dengan benar” berarti bahwa karena elemen <i> dibuka di dalam elemen <b> , maka harus ditutup di dalam elemen <b> .
Elemen XML dapat memiliki atribut dalam pasangan nama / nilai seperti di HTML.
Dalam XML, nilai atribut harus selalu dikutip:
<note date="12/11/2007"> <to>Tove</to> <from>Jani</from> </note>
Beberapa karakter memiliki arti khusus dalam XML.
Jika kita menempatkan karakter seperti “<” di dalam elemen XML, ini akan menghasilkan kesalahan karena parser menafsirkannya sebagai awal dari elemen baru.
Ini akan menghasilkan kesalahan XML:
<message>salary < 1000</message>
Untuk menghindari kesalahan ini, ganti karakter “<” dengan referensi entitas:
<message>salary < 1000</message>
Ada 5 referensi entitas yang telah ditentukan sebelumnya dalam XML:
< | < | less than |
> | > | greater than |
& | & | ampersand |
' | ‘ | apostrophe |
" | “ | quotation mark |
Sintaks untuk menulis komentar dalam XML mirip dengan HTML:
<!-- This is a comment -->
dua tanda hubung di tengah komentar tidak diperbolehkan:
<!-- This is an invalid -- comment -->
XML tidak memotong banyak spasi (HTML memotong beberapa spasi menjadi satu spasi):
XML: | Hello Tove |
HTML: | Hello Tove |
Aplikasi Windows menyimpan baris baru sebagai: carriage return dan line feed (CR + LF).
Dokumen XML yang sesuai dengan aturan sintaks di atas disebut sebagai dokumen XML yang “Well formed”.