untief.org

Tag-URI

veröffentlicht
2012-06-21
verschlagwortet
URI

RFC 4151 beschreibt das URI-Schema tag. Die beiden Autoren, Tim Kindberg und Sandro Hawke, haben dazu auch eine Website erstellt: http://taguri.org/.

Mit Tag-URIs kann (fast) jeder Was-auch-immer für alle Zeiten global eindeutig identifizieren.

Nehmen wir zum Beispiel mal diesen Blogeintrag. Ich habe ihm die HTTP-URI <http://untief.org/blog/2012/06/tag-uri> gegeben. Nun gebe ich ihm auch eine Tag-URI: <tag:untief.org,2011-11-11:taguri>. Und direkt noch eine: <tag:untief.org,2012-06-21:WasAuchImmer>. Und das T-Shirt, das ich beim Verfassen dieses Eintrags getragen habe, bekommt <tag:untief.org,2012-05-25:taupe> als URI. Natürlich kann ich mein T-Shirt nun auch verlinken – eine Tag-URI löst jedoch ganz bewusst nicht auf, sie soll ausschließlich identifizieren.

Aufbau einer Tag-URI

Eine Tag-URI hat immer folgenden Aufbau: tag:WER,WANN:WAS.

WER wird mit einer eigenen E-Mail-Adresse oder mit einem eigenen Domainnamen ersetzt.

WANN wird mit einem Datum (im Format YYYY-MM-DD) ersetzt, an dem man (um 00:00 UTC) die angegebene E-Mail-Adresse bzw. den Domainnamen besessen hat.

WAS wird mit einem frei wählbaren String ersetzt, der für die Kombination aus WER und WANN eindeutig ist.

Mehr zum WER-Teil

Eine Domain (gilt auch für den Domainteil einer E-Mail-Adresse) darf nur aus diesen Zeichen bestehen:

IDNs muss man also wohl mit Punycode kodieren.

Zwischen Groß- und Kleinschreibung wird unterschieden; es wird empfohlen, Domains immer klein zu schreiben.

Die erlaubten Zeichen für den Lokalteil einer E-Mail-Adresse entsprechen nicht dem E-Mail-Standard; so ist etwa in Tag-URIs das Pluszeichen nicht erlaubt.

Mehr zum WANN-Teil

Man muss hier kein Datum wählen, das einen Bezug zur Ressource hat, die man mit der URI beschreiben möchte. Das Datum dient einzig dazu, sicherzustellen, dass ein Vor- oder Nachbesitzer der Domain/E-Mail-Adresse nicht (zufällig) die selbe Tag-URI vergeben kann. Man könnte also alle Tag-URIs, die man jemals vergeben möchte, immer mit dem gleichen Datum angeben. Zur Sicherheit sollte man nicht gerade den Tag wählen, an dem man die Domain/E-Mail-Adresse registriert hat.

Man darf kein zukünftiges Datum wählen.

Wenn man den ersten Tag eines Monat angibt, darf man die Angabe des Tages weglassen (YYYY-MM). Wenn man den ersten Januar angibt, darf man die Angabe des Tages und des Monats weglassen (YYYY). Das bedeutet aber nicht, dass man die E-Mail-Adresse bzw. den Domainnamen den ganzen Monat bzw. das ganze Jahr besessen haben muss. Im Falle der Angabe „1998“ ist weiterhin nur der Besitz um 0 Uhr (nach UTC) des 1. Januar 1998 relevant. Wenn zwei Tag-URIs das gleiche Datum angeben, eine davon aber in der verkürzten Form, dann können diese URIs nie gleich sein.

Wenn die E-Mail-Adresse bzw. der Domainname unmittelbar vor dem Übergang in den eigenen Besitz unregistriert war (und sich das belegen lässt), dann darf man auch Daten aus diesem Zeitraum wählen.

Mehr zum WAS-Teil

Erlaubt sind folgende Zeichen:

Der String darf auch prozentkodierte Zeichen enthalten, wenn möglich sollte man aber darauf verzichten. Ein prozentkodiertes Zeichen besteht aus einem Prozentzeichen (%) gefolgt von zwei hexadezimalen Zahlen.

Man muss sicherstellen, dass der String für das angegebene Datum eindeutig ist. An einem anderen Datum darf man den gleichen String natürlich wieder für etwas anderes verwenden. Wenn die E-Mail-Adresse bzw. der Domainname mehreren Leuten gehört, dann müssen sich natürlich alle Besitzer untereinander absprechen bzw. informieren, welche Strings vergeben sind.

Eine Tag-URI darf natürlich auch ein Fragment haben. Man hängt einfach hinter dem WAS-Teil eine Raute an, gefolgt von dem Fragmentbezeichner: tag:WER,WANN:WAS#FRAGM (auch beim Fragment ist Prozentkodierung erlaubt, aber nicht empfohlen).