Untuk menampilkan halaman HTML dengan benar, web browser harus mengetahui charset yang akan digunakan.
Section Artikel
Dari ASCII ke UTF-8
ASCII adalah standar pengkodean karakter yang pertama dibuat. ASCII mendefinisikan 128 karakter berbeda yang dapat digunakan di internet: angka (0-9), huruf Inggris (A-Z), dan beberapa karakter khusus seperti! $ + – () @ <>.
ISO-8859-1 adalah kumpulan karakter default untuk HTML 4. Kumpulan karakter ini mendukung 256 kode karakter yang berbeda. HTML 4 juga mendukung UTF-8.
ANSI (Windows-1252) adalah rangkaian karakter Windows asli. ANSI identik dengan ISO-8859-1, kecuali ANSI memiliki 32 karakter tambahan.
Kumpulan karakter default untuk HTML5 adalah UTF-8, yang mencakup hampir semua karakter dan simbol yang ada di dunia.
Atribut charset HTML
Untuk menampilkan halaman HTML dengan benar, browser web harus mengetahui charset yang digunakan pada halaman.
Untuk itu charset dapat ditentukan dalam tag <meta>, seperti contoh dibawah ini.
Contoh :
<meta charset="UTF-8">
Perbedaan Antara Charset
Tabel berikut menampilkan perbedaan antara charset ASCII, ANSI, ISO-8859, dan UTF-8 yang telah dijelaskan di atas:
Nilai | ASCII | ANSI | 8859 | UTF-8 | Deskripsi |
---|---|---|---|---|---|
32 | Spasi | ||||
33 | ! | ! | ! | ! | exclamation mark |
34 | “ | “ | “ | “ | quotation mark |
35 | # | # | # | # | tanda angka |
36 | $ | $ | $ | $ | dollar |
37 | % | % | % | % | persen |
38 | & | & | & | & | ampersand |
39 | ‘ | ‘ | ‘ | ‘ | apostrophe |
40 | ( | ( | ( | ( | left parenthesis |
41 | ) | ) | ) | ) | right parenthesis |
42 | * | * | * | * | asterisk |
43 | + | + | + | + | tambah |
44 | , | , | , | , | koma |
45 | – | – | – | – | hyphen-minus |
46 | . | . | . | . | titik |
47 | / | / | / | / | solidus |
48 | 0 | 0 | 0 | 0 | digit nol |
49 | 1 | 1 | 1 | 1 | digit satu |
50 | 2 | 2 | 2 | 2 | digit dua |
51 | 3 | 3 | 3 | 3 | digit tiga |
52 | 4 | 4 | 4 | 4 | digit empat |
53 | 5 | 5 | 5 | 5 | digit lima |
54 | 6 | 6 | 6 | 6 | digit enam |
55 | 7 | 7 | 7 | 7 | digit tujuh |
56 | 8 | 8 | 8 | 8 | digit delapan |
57 | 9 | 9 | 9 | 9 | digit sembilan |
58 | : | : | : | : | colon |
59 | ; | ; | ; | ; | semicolon |
60 | < | < | < | < | kurang dari |
61 | = | = | = | = | sama dengan |
62 | > | > | > | > | lebih dari |
63 | ? | ? | ? | ? | tanda tanya |
64 | @ | @ | @ | @ | commercial at |
65 | A | A | A | A | Huruf kapital A |
66 | B | B | B | B | Huruf kapital B |
67 | C | C | C | C | Huruf kapital C |
68 | D | D | D | D | Huruf kapital D |
69 | E | E | E | E | Huruf kapital E |
70 | F | F | F | F | Huruf kapital F |
71 | G | G | G | G | Huruf kapital G |
72 | H | H | H | H | Huruf kapital H |
73 | I | I | I | I | Huruf kapital I |
74 | J | J | J | J | Huruf kapital J |
75 | K | K | K | K | Huruf kapital K |
76 | L | L | L | L | Huruf kapital L |
77 | M | M | M | M | Huruf kapital M |
78 | N | N | N | N | Huruf kapital N |
79 | O | O | O | O | Huruf kapital O |
80 | P | P | P | P | Huruf kapital P |
81 | Q | Q | Q | Q | Huruf kapital Q |
82 | R | R | R | R | Huruf kapital R |
83 | S | S | S | S | Huruf kapital S |
84 | T | T | T | T | Huruf kapital T |
85 | U | U | U | U | Huruf kapital U |
86 | V | V | V | V | Huruf kapital V |
87 | W | W | W | W | Huruf kapital W |
88 | X | X | X | X | Huruf kapital X |
89 | Y | Y | Y | Y | Huruf kapital Y |
90 | Z | Z | Z | Z | Huruf kapital Z |
91 | [ | [ | [ | [ | tanda kurung siku kiri |
92 | \ | \ | \ | \ | reverse solidus |
93 | ] | ] | ] | ] | tanda kurung siku kanan |
94 | ^ | ^ | ^ | ^ | circumflex accent |
95 | _ | _ | _ | _ | garis bawah |
96 | ` | ` | ` | ` | grave accent |
97 | a | a | a | a | Huruf kecil a |
98 | b | b | b | b | Huruf kecil b |
99 | c | c | c | c | Huruf kecil c |
100 | d | d | d | d | Huruf kecil d |
101 | e | e | e | e | Huruf kecil e |
102 | f | f | f | f | Huruf kecil f |
103 | g | g | g | g | Huruf kecil g |
104 | h | h | h | h | Huruf kecil h |
105 | i | i | i | i | Huruf kecil i |
106 | j | j | j | j | Huruf kecil j |
107 | k | k | k | k | Huruf kecil k |
108 | l | l | l | l | Huruf kecilr l |
109 | m | m | m | m | Huruf kecil m |
110 | n | n | n | n | Huruf kecil n |
111 | o | o | o | o | Huruf kecil o |
112 | p | p | p | p | Huruf kecil p |
113 | q | q | q | q | Huruf kecil q |
114 | r | r | r | r | Huruf kecil r |
115 | s | s | s | s | Huruf kecil s |
116 | t | t | t | t | Huruf kecil t |
117 | u | u | u | u | Huruf kecil u |
118 | v | v | v | v | Huruf kecil v |
119 | w | w | w | w | Huruf kecil w |
120 | x | x | x | x | Huruf kecil x |
121 | y | y | y | y | Huruf kecil y |
122 | z | z | z | z | Huruf kecil z |
123 | { | { | { | { | kurung kurawal buka |
124 | | | | | | | | | garis vertikal |
125 | } | } | } | } | kurung kurawal tutup |
126 | ~ | ~ | ~ | ~ | tilde |
127 | DEL | ||||
128 | € | euro | |||
129 | | | | NOT USED | |
130 | ‚ | tanda kutip single low-9 | |||
131 | ƒ | Huruf kecil latin f dengan hook | |||
132 | „ | tanda kutip ganda low-9 | |||
133 | … | horizontal ellipsis | |||
134 | † | dagger | |||
135 | ‡ | double dagger | |||
136 | ˆ | huruf pengubah aksen sirkumfleks | |||
137 | ‰ | tanda permil | |||
138 | Š | Huruf latin S kapital dengan with caron | |||
139 | ‹ | satu tanda kutip sudut kiri | |||
140 | Œ | Huruf latin kapital ligature OE | |||
141 | | | | TIDAK DIGUNAKAN | |
142 | Ž | Huruf latin Z kapital dengan caron | |||
143 | | | | TIDAK DIGUNAKAN | |
144 | | | | TIDAK DIGUNAKAN | |
145 | ‘ | tanda kutip tunggal kiri | |||
146 | ’ | tanda kutip tunggal kanan | |||
147 | “ | tanda kutip ganda kiri | |||
148 | ” | tanda kutip ganda kanan | |||
149 | • | bullet | |||
150 | – | en dash | |||
151 | — | em dash | |||
152 | ˜ | tilde kecil | |||
153 | ™ | Merek Terdaftar | |||
154 | š | Huruf latin s kecil dengan caron | |||
155 | › | satu tanda kutip sudut kanan | |||
156 | œ | Huruf latin ligature oe | |||
157 | | | | TIDAK DIGUNAKAN | |
158 | ž | Huruf latin z kecil dengan caron | |||
159 | Ÿ | Huruf latin kapital Y dengan diaeresis | |||
160 | no-break space | ||||
161 | ¡ | ¡ | ¡ | tanda seru terbalik | |
162 | ¢ | ¢ | ¢ | sen | |
163 | £ | £ | £ | pound | |
164 | ¤ | ¤ | ¤ | Mata uang | |
165 | ¥ | ¥ | ¥ | yen | |
166 | ¦ | ¦ | ¦ | broken bar | |
167 | § | § | § | tanda bagian | |
168 | ¨ | ¨ | ¨ | diaeresis | |
169 | © | © | © | tanda hak cipta | |
170 | ª | ª | ª | indikator ordinal feminin | |
171 | « | « | « | tanda kutip sudut ganda mengarah ke kiri | |
172 | ¬ | ¬ | ¬ | bukan tanda | |
173 | | | | tanda hubung lembut | |
174 | ® | ® | ® | tanda terdaftar | |
175 | ¯ | ¯ | ¯ | macron | |
176 | ° | ° | ° | lambang derajat | |
177 | ± | ± | ± | tanda plus-minus | |
178 | ² | ² | ² | superscript two | |
179 | ³ | ³ | ³ | superscript three | |
180 | ´ | ´ | ´ | acute accent | |
181 | µ | µ | µ | lambang micro | |
182 | ¶ | ¶ | ¶ | lambang pilcrow | |
183 | · | · | · | titik tengah | |
184 | ¸ | ¸ | ¸ | cedilla | |
185 | ¹ | ¹ | ¹ | superscript satu | |
186 | º | º | º | indikator ordinal maskulin | |
187 | » | » | » | tanda petik sudut ganda mengarah ke kanan | |
188 | ¼ | ¼ | ¼ | Pecahan seperempat | |
189 | ½ | ½ | ½ | Pecahan setengah | |
190 | ¾ | ¾ | ¾ | Pecahan tiga perempat | |
191 | ¿ | ¿ | ¿ | tanda tanya terbalik | |
192 | À | À | À | Huruf latin kapital A dengan with grave | |
193 | Á | Á | Á | Huruf latin kapital A dengan with acute | |
194 | Â | Â | Â | Huruf latin kapital A dengan circumflex | |
195 | Ã | Ã | Ã | Huruf latin kapital A dengan tilde | |
196 | Ä | Ä | Ä | Huruf latin kapital A dengan diaeresis | |
197 | Å | Å | Å | Huruf latin kapital A dengan ring diatasnya | |
198 | Æ | Æ | Æ | Huruf latin kapital AE | |
199 | Ç | Ç | Ç | Huruf latin kapital C dengan cedilla | |
200 | È | È | È | Huruf latin kapital E dengan grave | |
201 | É | É | É | Huruf latin kapital E dengan acute | |
202 | Ê | Ê | Ê | Huruf latin kapital E dengan circumflex | |
203 | Ë | Ë | Ë | Huruf latin kapital E dengan diaeresis | |
204 | Ì | Ì | Ì | Huruf latin kapital I dengan grave | |
205 | Í | Í | Í | Huruf latin kapital I dengan acute | |
206 | Î | Î | Î | Huruf latin kapital I dengan circumflex | |
207 | Ï | Ï | Ï | Huruf latin kapital I dengan diaeresis | |
208 | Ð | Ð | Ð | Huruf latin kapital Eth | |
209 | Ñ | Ñ | Ñ | Huruf latin kapital N dengan tilde | |
210 | Ò | Ò | Ò | Huruf latin kapital O dengan grave | |
211 | Ó | Ó | Ó | Huruf latin kapital O dengan acute | |
212 | Ô | Ô | Ô | Huruf latin kapital O dengan circumflex | |
213 | Õ | Õ | Õ | Huruf latin kapital O dengan tilde | |
214 | Ö | Ö | Ö | Huruf latin kapital O dengan diaeresis | |
215 | × | × | × | Lambang perkalian | |
216 | Ø | Ø | Ø | Huruf latin kapital O dengan stroke | |
217 | Ù | Ù | Ù | Huruf latin kapital U dengan grave | |
218 | Ú | Ú | Ú | Huruf latin kapital U dengan acute | |
219 | Û | Û | Û | Huruf latin kapital U dengan circumflex | |
220 | Ü | Ü | Ü | Huruf latin kapital U dengan diaeresis | |
221 | Ý | Ý | Ý | Huruf latin kapital Y dengan acute | |
222 | Þ | Þ | Þ | Huruf latin kapital Thorn | |
223 | ß | ß | ß | Huruf latin sharp s kecil | |
224 | à | à | à | Huruf latin a kecil dengan grave | |
225 | á | á | á | Huruf latin a kecil dengan acute | |
226 | â | â | â | Huruf latin a kecil dengan with circumflex | |
227 | ã | ã | ã | Huruf latin a kecil dengan tilde | |
228 | ä | ä | ä | Huruf latin a kecil dengan diaeresis | |
229 | å | å | å | Huruf latin a kecil dengan ring diatasnya | |
230 | æ | æ | æ | Huruf latin ae | |
231 | ç | ç | ç | Huruf latin c kecil dengan cedilla | |
232 | è | è | è | Huruf latin e kecil dengan grave | |
233 | é | é | é | Huruf latin e kecil dengan acute | |
234 | ê | ê | ê | Huruf latin e kecil dengan circumflex | |
235 | ë | ë | ë | Huruf latin e kecil dengan diaeresis | |
236 | ì | ì | ì | Huruf latin i kecil dengan grave | |
237 | í | í | í | Huruf latin i kecil dengan acute | |
238 | î | î | î | Huruf latin i kecil dengan circumflex | |
239 | ï | ï | ï | Huruf latin i kecil dengan diaeresis | |
240 | ð | ð | ð | Huruf latin eth | |
241 | ñ | ñ | ñ | Huruf latin n kecil dengan tilde | |
242 | ò | ò | ò | Huruf latin o kecil dengan grave | |
243 | ó | ó | ó | Huruf latin o kecil dengan acute | |
244 | ô | ô | ô | Huruf latin o kecil dengan circumflex | |
245 | õ | õ | õ | Huruf latin o kecil dengan tilde | |
246 | ö | ö | ö | Huruf latin o kecil dengan diaeresis | |
247 | ÷ | ÷ | ÷ | lambang pembagian | |
248 | ø | ø | ø | Huruf latin o kecil dengan stroke | |
249 | ù | ù | ù | Huruf latin u kecil dengan grave | |
250 | ú | ú | ú | Huruf latin u kecil dengan acute | |
251 | û | û | û | Huruf latin u kecil dengan circumflex | |
252 | ü | ü | ü | Huruf latin u kecil dengan diaeresis | |
253 | ý | ý | ý | Huruf latin y kecil dengan acute | |
254 | þ | þ | þ | Huruf latin thorn kecil | |
255 | ÿ | ÿ | ÿ | Huruf latin y kecil dengan diaeresis |
Set Karakter ASCII
ASCII menggunakan nilai dari 0 hingga 31 (dan 127) untuk mengatur karakter.
ASCII menggunakan nilai dari 32 hingga 126 untuk mengatur huruf, angka, dan simbol.
ASCII tidak menggunakan nilai 128-255.
Kumpulan Karakter ANSI (Windows-1252)
ANSI identik dengan ASCII untuk mengatur karakter yaitu dengan nilai dari 0 hingga 127.
ANSI memiliki serangkaian karakter miliknya sendiri untuk nilai dari 128 hingga 159.
ANSI identik dengan UTF-8 pada nilai 160 hingga 255.
Set Karakter ISO-8859-1
ISO-8859-1 memiliki nilai identik dengan ASCII untuk nilai dari 0 hingga 127.
ISO-8859-1 tidak menggunakan nilai 128 hingga 159.
ISO-8859-1 identik dengan UTF-8 untuk nilai 160 hingga 255.
Set Karakter UTF-8
UTF-8 identik dengan ASCII untuk nilai dari 0 hingga 127.
UTF-8 tidak menggunakan nilai 128 hingga 159.
UTF-8 identik dengan ANSI dan 8859-1 untuk nilai 160 hingga 255.
UTF-8 mempunyai nilai lanjutan dari nilai 256 dengan lebih dari 10.000 karakter berbeda.
Charset antara ASCII, ANSI, ISO-8859-1, dan UTF 8 memiliki nilai karakternyanya masing-masing, namun untuk beberapa nilai mereka memiliki nilai yang identik satu sama lain dan memiliki nilai yang berbeda pula.