![]() |
Gemeinde der Christen ECCLESIA | |
META-Tags (META-Angaben)Inhaltsverzeichnis |
Hilfen zum Erstellen von META-TagsEs gibt im Web einige Seiten, die Hilfestellung zu META-Tags anbieten. Eine kleine Auswahl sei hier genannt: |
Zeichensatz / MIME-TypDie content-type-Angabe benachrichtigt den Browser darüber, was für eine Datei vom Server geschickt wird. Sie enthält zunächst den MIME-Typ der Datei. Das ist bei HTML-Dokumenten immer text/html. Außerdem kann ein bestimmter Zeichensatz angegeben werden. Das ist hauptsächlich dann sinnvoll, wenn der Text sprachspezifische Zeichen mit ASCII-Werten über 127 enthält, also Umlaute, akzentuierte Buchstaben oder Zeichen wie die Cedille. Der normale Zeichensatz für westeuropäische Sprachen (inklusive Deutsch) ist ISO-8859-1. Die typische Angabe für einen deutschen HTML-Text wäre also: <META http-equiv="content-type" content="text/html; charset=iso-8859-1"> Die Angabe des Zeichensatzes ist vor allem dann wichtig, wenn der Text Zeichen enthalten soll, die nicht im 7-Bit ASCII vorkommen, wie Umlaute oder akzentuierte Buchstaben, und der Text auch von Benutzern gelesen werden soll, die üblicherweise einen anderen Zeichensatz benutzen. Gerade auf dem Gebiet der Zeichensätze ist zur Zeit einiges im Umbruch. Die bisher auf den meisten Computersystemen (vor allem auf DOS/Windows) benutzten Zeichensätze haben nur 256 Zeichen (8 Bit). Damit lassen sich aber nicht alle Sonderzeichen, die man gerne hätte darstellen. Deswegen wurden inzwischen Zeichensätze mit 32-Bit-Codierung vorgeschlagen. Diese Unicode-Zeichensätze müssen gesondert auf dem Rechner installiert werden. Die Standard-Zeichensätze für Windows und Mac werden z.B. von Microsoft kostenlos zum Download angeboten. Mit der Angabe charset=utf-8 wird dieser Unicode-Zeichensatz aktiviert. Damit ist es dann möglich, z.B. griechische Buchstaben zu codieren. Diese werden vom Browser aber nur dann korrekt dargestellt, wenn der Browser die entsprechenden Protokoll-Normen von HTML 4.0 unterstützt und der Rechner, auf dem der Browser läuft, auch die Unicode-Zeichensätze installiert hat. Für die Zukunft bieten sich hier also interessante Möglichkeiten. Zur Zeit muß man von einem Gebrauch allerdings eher abraten, da im Augenblick wohl nur ein kleiner Teil der Benutzer diese Voraussetzungen erfüllen. |
Sprache des Dokumentinhalts<META http-equiv="content-language" content="de"> Mit diesem Tag kann man die Sprache des Dateiinhalts angeben. Die Kürzel für die Sprache sind nach ISO-639, bzw. ISO-3166 (hier die 2-Buchstabenkürzel benutzen!) definiert. Anmerkung: In manchen Quellen findet man auch die Form http-equiv="language". Da die META-Tags nicht standardisiert sind, ist diese Form offensichtlich zulässig. Da die Bezeichnung für die Sprache im HTTP-Header jedoch Content-language ist, und auch in den W3C-Dokumenten diese Form verwendet wird, ist sie wohl der kürzeren vorzuziehen. |
Angabe von Inhalten / Kinderschutz mit PICSDer Wunsch danach, den Zugriff auf Internet-Inhalte einschränken zu können (z.B. um Kinder vor ungeeigneten Angeboten zu schützen) hat zur Entwicklung von PICS (Platform for Internet Content Selection) geführt. Die PICS-Labels geben Auskunft über den Inhalt einer Datei und können von geeigneter Filter-Software ausgewertet werden. Diese PICS-Labels kann man von einem PICS-Service beziehen, oder per META-Tags selbst in das Dokument einbauen, was natürlich für den Benutzer, der sich die Seite anschaut keinerlei Sicherheiten bietet, ob das PICS-Label zutreffend ist. Ein Beispiel für ein solches PICS-Label ist: <META http-equiv="PICS-Label" content='
(PICS-1.1 "http://www.gcf.org/v2.5"
labels on "1994.11.05T08:15-0500"
until "1995.12.31T23:59-0000"
for "http://w3.org/PICS/Overview.html"
ratings (suds 0.5 density 0 color/hue 1))
'>
Der Gebrauch der PICS-Labels und deren Anwendung ist noch nicht standardisiert und wer sich dafür interessiert sollte sich unter http://www.w3.org/PICS/ selbst informieren. Es sei noch angemerkt, daß parallel zu PICS vom W3C eine zweite Gruppe an sogenannten RDF-Labels (RDF steht für "Resource Description Framework") arbeitet, die auf XML basieren. Informationen hierzu finden sich unter http://www.w3.org/RDF. |
META-Tags für SuchmaschinenPublikationsdaten (Autor, Inhalt, Stichworte, Datum)Mit diesen META-Tags kann man Suchmaschinen Angaben über verschiedene Publikationsdaten machen. Bis heute gibt es aber kaum eine Suchmaschine, die diese Angaben auch vollständig auswertet. Das könnte sich in Zukunft jedoch ändern, so daß dann auch Suchen nach Autoren oder ähnlichen Angaben möglich wären. <META name="description" content="Was man hier hineinschreibt,
das wird dann von der Suchmaschine (vielleicht) angezeigt.">
<META name="author" content="Wolfgang Hutter, Albert Einstein">
<META name="keywords"
content="HTML, Hypertext Markup Language, Meta-Informationen">
<META name="date" content="1998-04-30T08:49:37+00:00">
Zusätzlich kann seit HTML 4.0 die Sprache der Stichworte noch mit angegeben werden. Das sieht dann etwa so aus: <META name="keywords" lang="de" content="Sterne, Astronomie"> <META name="keywords" lang="en" content="stars, astronomy"> <META name="keywords" lang="fr" content="étoiles, astronomie"> Ein anderer Ansatz zu diesen META-Angaben wurde von einer Gruppe von Experten entwickelt, die sich "Dublin Core" nennen. Sie haben ein System von META-Angaben veröffentlicht, das auch vom W3-Consortium begrüßt wurde und sich zukünftig als Standard durchsetzen könnte. Das Tag für den Titel hat zum Beispiel folgende Form: <META name="DC.Title" content="META-Tags"> Neben diesem Feld gibt es noch viele weitere Angaben wie DC.Subject, DC.Description, DC.Language oder DC.Rights. Außerdem läßt sich in diesem System zwischen Autor/Urheber (DC.Creator), Herausgeber (DC.Publisher) und Leuten, die beigetragen haben (DC.Contributor) unterscheiden. Anmerkung: einzelne Suchmaschinen, wie z.B. Fireball werten eigene META-Tags, wie page-topic, page-type oder audience, aus. Im Sinne einer Standardisierung, die letztlich der Qualität der Suche im WWW zugute kommt, sind solche Alleingänge aber eher kritisch zu bewerten. |
Darf diese Seite von einer Suchmaschine erfaßt werden?Wenn man nicht möchte, daß die HTML-Seite von einer Suchmaschine indiziert wird, dann kann man das mit dem Tag <META name="robots" content="noindex"> erreichen. Umgekehrt wird die ausdrückliche Erlaubnis mit content="index" gegeben. Suchmaschinen verfolgen und speichern in der Regel auch die Links, die in einem HTML-Dokument aufgeführt sind. Möchte man das aktuelle Dokument zwar indizieren lassen, das Indizieren der weiteren Links jedoch verhindern, dann gibt man content="nofollow" an. Um dieses rekursive Durchsuchen ausdrücklich zu erlauben setzt man content="follow". Eine Kombination dieser Angaben ist auch möglich. So weist der Tag <META name="robots" content="noindex, follow"> die Suchmaschine an, die aktuelle Seite nicht zu indizieren, aber die weiteren Links aufzunehmen. Das kann zum Beispiel für eine Frame-Hauptseite sinnvoll sein. Außerdem kann man die Suchmaschinen anweisen nach einer gewissen Zeitspanne wieder vorbeizukommen: <META name="revisit-after" content="20 days"> Ob die einzelnen Suchmaschinen sich jedoch an diese Anweisung halten ist eine andere Frage. Weiterführende Literatur und benutzte Quellen
|
|
|