HTML-Sonderzeichen

Zeichensätze, Sonderzeichen und Umlaute in HTML-Dokumenten

Der wichtigste Zeichensatz des Internets ist Ascii-Code
Dieser umfasst 7 Bit, also 128 Zeichen. So wird die Zahl 65 dem Buchstaben A zugeordnet. Große und kleine Buchbstaben unterscheiden sich um 32 Stellen und damit an nur einer Stelle in der Byte-Darstellung.
Erweiterte Codes waren meißt nur national gültig.
Da ein Byte(= 8 Bit) aber 256 Zeichen umfasst bleiben 128 Möglichkeiten offen.
Mit ISO 8859 gibt es nun einen standardisierten Zeichensatz, der die freien oberen 128 Zeichen für die Sonderzeichen der verschiedenen Kulturen nutzt.

Der (moderne) Server prüft anhand der ersten paar Bytes eines Dokuments, welche Zeichenkodierung gilt und benachrichtigt das Benutzerprogramm - den Browser - durch den "Charset"-Parameter im Content-Type-Header des HTTP-Protokolls. Da aber manche Server nicht gestatten, einen Charset-Parameter zu senden oder nicht entsprechend konfiguriert sind, bietet HTML seit Version 4 die Möglichkeit, den Zeichensatz durch die Angabe von

<meta http-equiv="content-type" content="text/html; charset=iso-8859-1">

(Western ISO Latin 1) im Kopf des Dokuments zu definieren.

Wird dieser Zusatz in den Header geschrieben, so müssen die folgenden Buchstaben nicht mit Umschrift geschrieben werden:
"ä, Ä, ö, Ö, ü, Ü, ß, ©, è, à".

Hinweis: Mehr Sonderzeichen – insbesondere das €-Teichen – verlangen die Angabe
<meta http-equiv="content-type" content="text/html; charset=iso-8859-15">
im Header.
Auf der sicheren Seite ist man mit dem Unicode, durch die Angabe von
<meta http-equiv="content-type" content="text/html; charset=utf-8" />.

Ein Wort zu älteren Browsern, diese reagieren besser, wenn die numerischen Codes benutzt werden. So stellt Netscape 4 z.B. das Aufzählungssymbol "•" korrekt dar, wenn es als

notiert ist. Wird der HTML-Name

verwendet, bringt Netscape 4 ein Fragezeichen oder ein leeres Rechteck.

Die Reihenfolge in der Tabelle ist nach dem Unicode gewählt.

Also so geht es nun:

  1. <meta http-equiv="content-type" content="text/html; charset=utf-8" /> im Header haben
  2. Unicode des Zeichens in Quelle 3 suchen.
  3. Unicode ist eine Hexadezimaldarstellung, also umrechnen, z.B.
    U+20AC steht für 2·16^3 + 0·16^2 + 10·16^1 + 12 = 8364
  4. Nun in den Quelltext ↺ schreiben und es erscheint €
  5. Umrechnung
Achtung beim Übertragen auf schulmodell.eu die "Namensbeschreibungen" verschwunden, das wird jetzt nach und nach ergänzt, sorry.
Zeichen Name Numerisch Beschreibung Unicode
" "     nicht brechendes Leerzeichen U+00A0
"¡" & iexcl; ¡ umgekehrtes Ausrufezeichen U+00A1
"¢" & cent; ¢ Cent U+00A2
"£" & pound; £ britisches Pfund U+00A3
"¤" ¤ ¤ generisches Währungszeichen U+00A4
"¥" ¥ ¥ japanischer Yen U+00A5
"¦" ¦ ¦ gebrochener senkrechter Strich U+00A6
"§" § § Paragraph, Absatzzeichen U+00A7
"¨" ¨ ¨ Umlaut mit Leerraum U+00A8
"©" © © Copyright U+00A9
"ª" ª ª weibliches Ordinal (Ordnungszahl) U+00AA
"«" « « typografisches Anführungszeichen nach links weisend = Guillemet nach links U+00AB
"¬" ¬ ¬ Negierung U+00AC
"­" ­ ­ weiches Trennzeichen U+00AD
"®" ® ® registrierte Handelsmarke U+00AE
"¯" ¯ ¯ Makron U+00AF
"°" ° ° Grad U+00B0
"±" ± ± Plusminus U+00B1
"²" ² ² hoch 2 = Quadrat U+00B2
"³" ³ ³ hoch 3 = Kubik U+00B3
"´" ´ ´ Akut mit Leerraum U+00B4
"µ" µ µ Mikro U+00B5
"¶" Absatzzeichen U+00B6
"·" · · Mittelpunkt U+00B7
"¸" ¸ ¸ Cedilla mit Leerraum U+00B8
"¹" ¹ ¹ hoch 1 U+00B9
"º" º º männliches Ordinal (Ordnungszahl) U+00BA
"»" » » typografisches Anführungszeichen nach rechts weisend = Guillemet nach rechts U+00BB
"¼" ¼ ¼ ein Viertel U+00BC
"½" ½ ½ ein Halb U+00BD
"¾" ¾ ¾ drei Viertel U+00BE
"¿" ¿ ¿ umgekehrtes Fragezeichen U+00BF
"À" À À großes lateinisches A mit Gravis U+00C0
"Á" Á Á großes lateinisches A mit Akut U+00C1
"Â" Â Â großes lateinisches A mit Zirkumflex U+00C2
"Ã" Ã Ã großes lateinisches A mit Tilde U+00C3
"Ä" Ä Ä Ä U+00C4
"Å" Å Å großes lateinisches A mit Ring U+00C5
"Æ" Æ Æ großes lateinisches AE = große lateinische Ligatur AE U+00C6
"Ç" Ç Ç großes lateinisches C mit Cedilla U+00C7
"È" È È großes lateinisches E mit Gravis U+00C8
"É" É É großes lateinisches E mit Akut U+00C9
"Ê" Ê Ê großes lateinisches E mit Zirkumflex U+00CA
"Ë" Ë Ë großes lateinisches E mit Diaeresis U+00CB
"Ì" Ì Ì großes lateinisches I mit Gravis U+00CC
"Í" Í Í großes lateinisches I mit Akut U+00CD
"Î" Î Î großes lateinisches I mit Zirkumflex U+00CE
"Ï" Ï Ï großes lateinisches I mit Umlaut U+00CF
"Ð" Ð Ð großes lateinisches ETH U+00D0
"Ñ" Ñ Ñ großes lateinisches N mit Tilde U+00D1
"Ò" Ò Ò großes lateinisches O mit Gravis U+00D2
"Ó" Ó Ó großes lateinisches O mit Akut U+00D3
"Ô" Ô Ô großes lateinisches O mit Zirkumflex U+00D4
"Õ" Õ Õ großes lateinisches O mit Tilde U+00D5
"Ö" Ö Ö Ö U+00D6
"×" × × Multiplikationszeichen U+00D7
"Ø" Ø Ø großes lateinisches O mit Querstrich U+00D8
"Ù" Ù Ù großes lateinisches U mit Gravis U+00D9
"Ú" Ú Ú großes lateinisches U mit Akut U+00DA
"Û" Û Û großes lateinisches U mit Zirkumflex U+00DB
"Ü" Ü Ü Ü U+00DC
"Ý" Ý Ý großes lateinisches Y mit Akut U+00DD
"Þ" Þ Þ großes lateinisches THORN U+00DE
"ß" ß ß kleines lateinisches ß = ess-zed U+00DF
"à" à à kleines lateinisches a mit Gravis U+00E0
"á" á á kleines lateinisches a mit Akut U+00E1
"â" â â kleines lateinisches a mit Zirkumflex U+00E2
"ã" ã ã kleines lateinisches a mit Tilde U+00E3
"ä" ä ä ä U+00E4
"å" å å kleines lateinisches a mit Ring = kleines lateinisches a Ring U+00E5
"æ" æ æ kleines lateinisches ae = kleine lateinische Ligatur ae U+00E6
"ç" ç ç kleines lateinisches c mit Cedilla U+00E7
"è" è è kleines lateinisches e mit Gravis U+00E8
"é" é é kleines lateinisches e mit Akut U+00E9
"ê" ê ê kleines lateinisches e mit Zirkumflex U+00EA
"ë" ë ë kleines lateinisches e mit Diaeresis U+00EB
"ì" ì ì kleines lateinisches i mit Gravis U+00EC
"í" í í kleines lateinisches i mit Akut U+00ED
"î" î î kleines lateinisches i mit Zirkumflex U+00EE
"ï" ï ï kleines lateinisches i mit Diaeresis U+00EF
"ð" ð ð kleines lateinisches Eth U+00F0
"ñ" ñ ñ kleines lateinisches n mit Tilde U+00F1
"ò" ò ò kleines lateinisches o mit Gravis U+00F2
"ó" ó ó kleines lateinisches o mit Akut U+00F3
"ô" ô ô kleines lateinisches o mit Zirkumflex U+00F4
"õ" õ õ kleines lateinisches o mit Tilde U+00F5
"ö" ö ö ö U+00F6
"÷" ÷ ÷ Divisionszeichen U+00F7
"ø" ø ø kleines lateinisches o mit Querstrich U+00F8
"ù" ù ù kleines lateinisches u mit grave U+00F9
"ú" ú ú kleines lateinisches u mit acute U+00FA
"û" û û kleines lateinisches u mit circumflex U+00FB
"ü" ü ü ü U+00FC
"ý" ý ý kleines lateinisches y mit Akut U+00FD
"þ" þ þ kleines lateinisches thorn U+00FE
"ÿ" ÿ ÿ kleines lateinisches y mit Diaeresis U+00FF
"ƒ" ƒ ƒ kleines lateinisches f mit Häkchen = Funktion = Florin U+0192
"Α" Α Α großes griechisches Alpha U+0391
"Β" Β Β großes griechisches Beta U+0392
"Γ" Γ Γ großes griechisches Gamma U+0393
"Δ" Δ Δ großes griechisches Delta U+0394
"Ε" Ε Ε großes griechisches Epsilon U+0395
"Ζ" Ζ Ζ großes griechisches Zeta U+0396
"Η" Η Η großes griechisches Eta U+0397
"Θ" Θ Θ großes griechisches Theta U+0398
"Ι" Ι Ι großes griechisches Iota U+0399
"Κ" Κ Κ großes griechisches Kappa U+039A
"Λ" Λ Λ großes griechisches Lambda U+039B
"Μ" Μ Μ großes griechisches Mu U+039C
"Ν" Ν Ν großes griechisches Nu U+039D
"Ξ" Ξ Ξ großes griechisches Xi U+039E
"Ο" Ο Ο großes griechisches Omicron U+039F
"Π" Π Π großes griechisches Pi U+03A0
"Ρ" Ρ Ρ großes griechisches Rho U+03A1
"Σ" Σ Σ großes griechisches Sigma U+03A3
"Τ" Τ Τ großes griechisches Tau U+03A4
"Υ" Υ Υ großes griechisches Ypsilon U+03A5
"Φ" Φ Φ großes griechisches Phi U+03A6
"Χ" Χ Χ großes griechisches Chi U+03A7
"Ψ" Ψ Ψ großes griechisches Psi U+03A8
"Ω" Ω Ω großes griechisches Omega U+03A9
"α" α α kleines griechisches alpha U+03B1
"β" β β kleines griechisches beta U+03B2
"γ" γ γ kleines griechisches gamma U+03B3
"δ" δ δ kleines griechisches delta U+03B4
"ε" ε ε kleines griechisches epsilon U+03B5
"ζ" ζ ζ kleines griechisches zeta U+03B6
"η" η η kleines griechisches eta U+03B7
"θ" θ θ kleines griechisches theta U+03B8
"ι" ι ι kleines griechisches iota U+03B9
"κ" κ κ kleines griechisches kappa U+03BA
"λ" λ λ kleines griechisches lambda U+03BB
"μ" μ μ kleines griechisches mu U+03BC
"ν" ν ν kleines griechisches nu U+03BD
"ξ" ξ ξ kleines griechisches xi U+03BE
"ο" ο ο kleines griechisches omicron U+03BF
"π" π π kleines griechisches pi U+03C0
"ρ" ρ ρ kleines griechisches rho U+03C1
"ς" ς ς kleines griechisches finales sigma U+03C2
"σ" σ σ kleines griechisches sigma U+03C3
"τ" τ τ kleines griechisches tau U+03C4
"υ" υ υ kleines griechisches ypsilon U+03C5
"φ" φ φ kleines griechisches phi U+03C6
"χ" χ χ kleines griechisches chi U+03C7
"ψ" ψ ψ kleines griechisches psi U+03C8
"ω" ω ω kleines griechisches omega U+03C9
"ϑ" ϑ ϑ kleines griechisches theta U+03D1
"ϒ" ϒ ϒ griechisches ypsilon mit hook symbol U+03D2
"ϖ" ϖ ϖ griechisches pi U+03D6
"•" gefüllter Kreis (bullet) = Aufzählungssymbol U+2022
"…" Auslassungspunkte U+2026
"′" einfaches Anführungszeichen = Minuten = Fuss U+2032
"″" doppeltes Anführungszeichen = Sekunden = Inch U+2033
"‾" Überstreichung U+203E
"⁄" Bruchstrich U+2044
"℘" &weierpv großes P, dargestellt in einem Skriptfont = Weierstraß'sche P-Funktion U+2118
"ℑ" großes I Fraktur = imaginärer Anteil einer Zahl U+2111
"ℜ" großes R Fraktur = realer Anteil einer Zahl U+211C
"™" Handelsmarke U+2122
"ℵ" Alefsymbol = erste finite Ordnungszahl U+2135
"←" Pfeil nach links U+2190
"↑" Pfeil nach oben U+2191
"→" Pfeil nach rechts U+2192
"↓" Pfeil nach unten U+2193
"↔" Pfeil nach links und rechts U+2194
"↵" Pfeil nach unten mit Ecke nach links = carriage return = Zeilenumbruch U+21B5
"⇐" Doppelpfeil nach links U+21D0
"⇑" Doppelpfeil nach oben U+21D1
"⇒" Doppelpfeil nach rechts U+21D2
"⇓" Doppelpfeil nach unten U+21D3
"⇔" Doppelpfeil nach links und rechts U+21D4
"∀" für alle U+2200
"∂" partiales Differential U+2202
"∃" es gibt U+2203
"∅" leere Menge U+2205
"∇" Nablafunktion U+2207
"∈" Element von U+2208
"∉" kein Element von U+2209
"∋" enthält U+220B
"∏" Produktzeichen U+220F
"∑" Summenzeichen U+2211
"−" Minuszeichen U+2212
"∗" Stern-Operator U+2217
"√" Quadratwurzel U+221A
"∝" proportional zu U+221D
"∞" unendlich U+221E
"∠" Winkel U+2220
"∧" logisches Und U+2227
"∨" logisches Oder U+2228
"∩" Schnittmenge U+2229
"∪" Vereinigung U+222A
"∫" Integral U+222B
"∴" darum U+2234
"∼" Tilde-Operator = ähnlich wie U+223C
"≅" ungefähr gleich U+2245
"≈" ≈; fast gleich = asymptotisch zu U+2248
"≠" nicht gleich U+2260
"≡" identisch U+2261
"≤" weniger oder gleich U+2264
"≥" größer oder gleich U+2265
"⊂" Untermenge von U+2282
"⊃" Obermenge von U+2283
"⊄" Keine Untermenge von U+2284
"⊆" Untermenge oder gleich U+2286
"⊇" Obermenge oder gleich U+2287
"⊕" Pluszeichen im Kreis = direkte Summe U+2295
"⊗" Multiplikationszeichen im Kreis = Vektorprodukt U+2297
"⊥" senkrecht auf = orthogonal zu U+22A5
"⋅" Punktoperator U+22C5
"⌈" linke Ecke oben (Rahmen) U+2308
"⌉" rechte Ecke oben (Rahmen) U+2309
"⌊" linke Ecke unten (Rahmen) U+230A
"⌋" rechte Ecke oben (Rahmen) U+230B
"〈" linke winklige Klammer U+2329
"〉" rechte winklige Klammer U+232A
"◊" Raute U+25CA
"♠" gefülltes Pik U+2660
"♣" gefülltes Kreuz U+2663
"♥" gefülltes Herz U+2665
"♦" gefülltes Karo U+2666
""" " " Anführungszeichen U+0022
"&" & & Ampersand U+0026
"<" < < weniger als U+003C
">" > > mehr als U+003E
"Œ" Œ Œ große lateinische Ligatur OE U+0152
"œ" œ œ kleine lateinische Ligatur oe U+0153
"Š" Š Š großes lateinisches S mit Caron U+0160
"š" š š kleines lateinisches s mit Caron U+0161
"Ÿ" Ÿ Ÿ großes lateinisches Y mit Diaeresis U+0178
"ˆ" ˆ ˆ Zirkumflex U+02C6
"˜" ˜ ˜ kleine Tilde U+02DC
" " n-Raum U+2002
" " m-Raum U+2003
" " feiner Leerraum U+2009
"‌" Null-Leerraum, der nicht zusammenführt (z.B. um Worte wie www.langerlink.de ohne Trennzeichen zu trennen) U+200C
"‍" Null-Leerraum, der zwei Worte zusammenführt U+200D
"‎" links-nach-rechts-Fragezeichen U+200E
"‏" rechts-nach-links-Fragezeichen U+200F
"–" n-Strich = Viertelgeviert U+2013
"—" m-Strich = Dreiviertelgeviert U+2014
"‘" linkes einfaches Anführungszeichen oben U+2018
"’" rechtes einfaches Anführungszeichen oben U+2019
"‚" einfaches Anführungszeichen unten U+201A
"“" linkes doppeltes Anführungszeichen oben U+201C
"”" rechtes doppeltes Anführungszeichen oben U+201D
"„" doppeltes Anführungszeichen unten U+201E
"†" "Dolch" U+2020
"‡" doppelter "Dolch" U+2021
"‰" Promille U+2030
"‹" einzelnes, nach links weisendes winkliges Anführungszeichen U+2039
"›" einzelnes, nach rechts weisendes winkliges Anführungszeichen U+203A
"€" Euro U+20AC

 

Quelle 1: http://www.sachen-fuer-webmaster.de/artikel/83.html

Quelle 2: http://de.wikipedia.org/wiki/Wikipedia:Sonderzeichen

Quelle 3: http://www.unicode.org/charts/ hier findet man alles zum Unicode