HTML-Einführung von Hubert Partl, Jänner 1997
Die meisten Institutionen, Universitäten, Firmen u.dgl. legen außerdem großen Wert darauf, daß der Inhalt aller Veröffentlichungen dem Ansehen der Institution angemessen ist und mit ihrem Public-Relations-Konzept in Einklang steht, und daß das Layout ihrer "Corporate Identity" entspricht.
Das Speichern von Informationen im World Wide Web bedeutet nicht automatisch den Verzicht des Autors auf das Urheberrecht und die Nutzungsrechte ("Copyright"). Alle kreativen Werke (Texte, Töne, Bilder und dergleichen) sind weltweit urheberrechtlich geschützt, auch wenn sie in Büchern, in Rundfunksendungen oder im World Wide Web veröffentlicht wurden.
Außerdem ist es wichtig, die Informationen so zu strukturieren und anzulegen, daß sie von den Interessenten auch gefunden werden.
Bitte, bedenken Sie:
Es ist technisch sehr leicht, Web-Pages zu veröffentlichen, die nur geringen Informationsgehalt aufweisen, unlogisch strukturiert, verwirrend angeordnet, schlampig formuliert, schwer verständlich oder schwer auffindbar sind, sachliche oder sprachliche Fehler enthalten, unüberlegt und unprofessionell aussehen oder mit der Mehrzahl der Web-Browser gar nicht richtig gelesen werden können. Die vorliegende HTML-Einführung soll Ihnen helfen, diesbezügliche Fehler zu vermeiden und es besser zu machen, und weitere Hinweise zu Web-Designern und WWW-Projekten finden Sie bei Stefan Münz.
Bei einem über das World Wide Web veröffentlichten File hingegen können Sie nicht wissen, mit was für einer Client-Software und auf was für einem Bildschirm, mit welchen Fenstergrößen und mit welchen Schriftarten und Schriftgrößen die verschiedenen Benutzer diese Information lesen werden.
Sie müssen deshalb den Inhalt ihrer Information in seiner logischen Struktur festlegen und nicht bloß in seinem sichtbaren Aussehen ("Layout").
HTML unterstützt zu diesem Zweck ein "logisches Markup", bei dem die logische Bedeutung der Text-Teile so festgelegt wird, daß sie vom jeweiligen Web-Browser in der für den Benutzer (Client) optimalen Form dargestellt werden können. Außerdem verwenden Suchhilfen die HTML-Befehle dazu, um zu entscheiden, welche Wörter bei der Stichwort-Suche berücksichtigt werden sollen - auf Grund ihrer logischen Bedeutung.
Verschiedene Web-Browser stellen die im Informationssystem gespeicherten Informationen in ganz verschiedener Art und Weise dar: Manche unterstützen nur eine einfache Textausgabe im Zeilenmodus mit einer einheitlichen Schrift, viele andere unterstützen auch Bilder und Verzierungen sowie verschiedene Schriftarten und -größen. Die Steuerung erfolgt bei manchen Browsern mit einer Tastatur, bei anderen mit einer Maus oder einem Touch-Screen. Es sind auch Browser denkbar, die die Informationen in Blindenschrift oder akustisch (als gesprochene Texte) oder in Form von dreidimensionalen Virtual-Reality-Szenen darstellen.
Hinweise für die Verwendung Ihrer Informationen sollten Sie deshalb stets so formulieren, daß sie für alle verschiedenen Web-Browser gelten, also z.B. weder "Drücken Sie im Feld ... die Return-Taste" noch "Klicken Sie mit der Maus auf ..." sondern "Wählen Sie ... aus".
Wie funktioniert nun dieses "logische Markup"?
Sie geben in Ihrem HTML-File am WWW-Server mit den in den Text eingestreuten HTML-Befehlen ("Tags") an, daß ein bestimmter Textteil eine Überschrift, ein anderer eine Erklärung, eine Aufzählung, ein hervorgehobenes Wort und dergleichen oder ein Hyper-Link oder ein Bild ist (wie, das lernen Sie in der vorliegenden HTML-Einführung).
Diese Elemente werden dann vom Web-Browser auf dem Bildschirm eines jeden Benutzers so dargestellt, daß das Layout diese logische Bedeutung richtig wiedergibt, und zwar so, wie es der Benutzer haben möchte - in der Anordnung, die er gewöhnt ist und die er übersichtlich findet, und mit der Schriftart, Schriftgröße und Farbe, die er je nach der Auflösung seines Bildschirms und der Sehschärfe seiner Augen am besten lesen kann.
Wenn Ihr HTML-File auf Ihrem eigenen Browser mit Ihren eigenen persönlichen Einstellungen (Optionen, Präferenzen) gut aussieht, dann bedeutet das noch lange nicht, daß es auch bei anderen Lesern mit den von ihnen verwendeten Browsern und persönlichen Einstellungen gut aussieht oder überhaupt sinnvoll lesbar ist.
Wie Sie als Autor das Layout trotzdem mit HTML-Befehlen festlegen oder zumindest beeinflussen können, ist im Kapitel "Layout und Spezialeffekte" beschrieben. In Fällen, bei denen das genaue Layout wichtig ist (z.B. bei Formularen oder Diagrammen), kann es eventuell sinnvoller sein, die Information nicht als HTML-File sondern als PostScript- oder PDF- oder RTF-File oder als GIF-Bild oder Image-Map abzuspeichern.
Ein Beispiel, wie man es nicht machen sollte, finden Sie im Kapitel "Wenn die Glocken locken".
Viele, aber nicht alle Web-Browser tolerieren viele, aber nicht alle Abweichungen von den strikten HTML-Sprachregeln. Wenn Ihr HTML-File also von Ihrem eigenen Browser richtig verstanden wird, dann bedeutet das noch nicht, daß es sich tatsächlich um syntaktisch richtige HTML handelt und daß es auch von anderen Lesern mit den von ihnen verwendeten Browsern gelesen werden kann.
Um sicherzustellen, daß Ihre HTML-Files tatsächlich brauchbar sind, müssen Sie deswegen HTML-Prüfprogramme (Validatoren) verwenden, die eigens für diesen Zweck eingerichtet wurden (siehe die Referenzen).
Dies kann selbstverständlich nur dann funktionieren, wenn alle Beteiligten die offiziellen oder inoffiziellen Normen für die Datenübertragung und die Datenformate genau einhalten: TCP/IP, HTTP, HTML...
Manche kommerzielle Firmen wie z.B. Netscape oder Microsoft bemühen sich, WWW-Software zu vertreiben, die zusätzliche Features aufweist, die über die vom W3-Consortium zusammengestellten HTML-Spezifikationen hinausgehen oder ihnen, noch schlimmer, sogar widersprechen. Damit werden alle Benutzer, die diese "Extras" ausnützen wollen, gezwungen, die Software dieser Firma zu kaufen.
Die Einengung auf ein bestimmtes Produkt oder eine Firma ist in diesem innovativen Bereich besonders ungünstig, wie die jüngsten Erfahrungen lehren:
1993 wurde für Informationssysteme hauptsächlich Gopher verwendet.Wenn Ihre HTML-Files auch noch nächstes Jahr brauchbar sein sollen und wenn Sie nicht einen großen Teil der Interessenten vom Zugriff auf Ihre Informationen ausschließen wollen, dann müssen Sie als Autor auf solche firmenspezifische "Extrawürste" verzichten und möglichst nur die HTML-Befehle einsetzen, die auf allen Browsern ein richtig lesbares Ergebnis bewirken (De-facto-Norm).1994 wurde Gopher von Mosaic fast vollständig verdrängt.
1995 wurde Mosaic von Netscape fast vollständig verdrängt, und daneben brachten auch viele andere Firmen (einschließlich der Giganten IBM und Microsoft) ihre eigenen, teilweise inkompatiblen Web-Brwowser heraus.
1996 warfen die Konkurrenten Netscape und Microsoft alle paar Monate neue Versionen ihrer Web-Browser auf den Markt, die immer ausgefeiltere Layout-Spezialitäten vor allem in Hinblick auf hochauflösende PC-Bildschirme unterstützten (Farben, Tabellen, Frames, Style-Sheets). Gleichzeitig wurde mit WebTV eine Möglichkeit geschaffen, Web-Pages auf Fernseh-Bildschirmen zu betrachten, die eine wesentlich geringere Auflösung als PC-Bildschirme aufweisen.
Beispiele für "Extrawürste", die nicht (oder noch nicht) von allen gängigen Web-Browsern richtig verarbeitet werden, sind <animate>, <applet> <blink>, <bgsound>, <center>, <embed>, <font>, <frame>, <frameset>, <marquee> <object>, <script> <style>, u.a.
Wenn Sie solche neue oder nicht genormte oder nicht von allen Web-Browsern unterstützte Elemente verwenden, dann achten Sie bitte darauf, daß Ihre Informationen trotzdem von allen Web-Browsern wenigstens einigermaßen brauchbar dargestellt werden können, z.B. indem Sie "Alternativen" wie ALT= oder NOFRAMES und dergleichen einfügen. Hinweise für solche hilfreiche Tricks finden Sie in den Kapiteln über Tabellen, Zentrierung, Farbe, Bilder, Frames, Image-Maps und bei allen Layout- und Spezialeffekten. Im Zweifelsfall halten Sie sich lieber an die alte Grundregel der Informationsverarbeitung:
Sei möglichst konservativ beim Schreiben
und möglichst liberal beim Lesen!
<xxx>
Manche dieser Befehle (Tags) haben auch
Parameter (Attribute und Argumente),
z.B. in einer Form wie
<xxx yyy=zzz>
Bei den Befehlen xxx und den Attributen yyy ist die Groß-
oder Klein-Schreibung egal, bei den Argumenten zzz trifft dies
nicht immer zu.
Wenn die Argumente Sonderzeichen enthalten,
müssen sie in Anführungszeichen (Quotes) eingeschlossen
werden:
<xxx yyy="zzz">
Einfache oder mehrfache Leerstellen oder Zeilenwechsel haben (von Spezialfällen abgesehen) dieselbe Bedeutung, d.h. sie wirken jeweils so wie eine Leerstelle.
Die meisten HTML-Befehle treten paarweise auf,
mit einem "Start-Tag" der Form <xxx>
und einem "End-Tag" der Form </xxx>
.
Diese Befehlspaare geben jeweils
die Bedeutung des dazwischen liegenden Textes an.
So ist z.B. der zwischen <h1>
und </h1>
stehende
Text eine
Überschrift.
Manche HTML-Befehle treten einzeln auf,
also ohne einen End-Tag.
Sie bezeichnen bestimmte Elemente, die zwischen dem Text stehen.
So bedeutet z.B.
<hr>
eine
Linie
zwischen zwei Absätzen.
Die paarweisen HTML-Befehle müssen immer richtig geschachtelt werden. Dies soll an dem folgenden Beispiel durch das Einrücken der Eingabe-Zeilen veranschaulicht werden. (Was die einzelnen Befehle bedeuten, wird nicht hier sondern in den jeweiligen Kapiteln der HTML-Einführung beschrieben.)
<HTML> <HEAD> <TITLE> Der Titel des HTML-Files </TITLE> </HEAD> <BODY> <H1> Die Überschrift </H1> <P> Der erste Absatz. </P> <P> Ein <EM> betontes </EM> Wort im zweiten Absatz. Nach diesem Absatz kommt eine Linie: </P> <HR> <P> Das ist der letzte Absatz. </P> </BODY> </HTML>
Nicht erlaubt wäre also z.B. eine Konstruktion wie
<P>xxxxxx <EM>xxxx</P> <P>xxxx</EM> xxxxxx</P>Stattdessen müßte man es so schreiben:
<P>xxxxxx <EM>xxxx</EM></P> <P><EM>xxxx</EM> xxxxxx</P>In einigen wenigen Fällen darf der End-Tag weggelassen werden, so ist z.B. die explizite Angabe von
</p>
in den obigen
Beispielen nicht unbedingt notwendig.
Kommentare können in der Form
<!-- Kommentartext -->
eingefügt werden.
Damit der Kommentartext tatsächlich
von allen Browser-Versionen ignoriert wird,
sollte er weder --
noch >
enthalten.
<html> <head> <title>Haupt-Ueberschrift</title> <link rev=made href="mailto:username@hostname.domainname"> </head> <body> <h1>Haupt-Überschrift</h1>und mit den folgenden Befehlen enden:
</body> </html>
Das gesamte HTML-File wird zwischen
<html>
und </html>
eingeschlossen.
Zwischen <head>
und </head>
stehen die Angaben, die für die Verwaltung des HTML-Files
notwendig sind (Titel, Autor und dergleichen).
Zwischen <body>
und </body>
steht die Information, die am Bildschirm des Benutzers
dargestellt werden soll, also die
Textelemente,
Hypertext-Links,
Bilder und Töne.
Zwischen <title>
und </title>
steht die Überschrift des HTML-Files,
die in
Bookmarks
und
Suchhilfen
verwendet wird.
Zwischen <h1>
und </h1>
steht die
Überschrift,
die am Bildschirm zu Beginn des Textes erscheint.
Da sie nicht wissen können, über welche Hypertext-Links, Bookmarks oder Suchhilfen die Leser auf Ihre Information zugreifen werden, sollten Sie Titel, Überschriften und Inhalt Ihrer Files immer möglichst vollständig und auch ohne Kontext verständlich formulieren, also z.B. nicht bloß "Einleitung" sondern "Einleitung zur HTML-Einführung", und nicht bloß "Statistik-Abteilung" sondern "Abteilung für Statistik des Instituts für Mathematik an der Universität für Bodenkultur in Wien".
Zwischen <title>
und </title>
dürfen (im Gegensatz zu <h1>
)
nur normale ASCII-Buchstaben stehen,
keine
Entities
(deutsche Umlaute etc.) und keine HTML-Befehle.
Manche Web-Browser haben eine Funktion für das Senden
von Kommentaren an den Autor des HTML-Files.
Zu diesem Zweck und auch aus anderen praktischen Gründen
ist es notwendig, daß die Mail-Adresse des Autors als
Mailto-URL
im <link>
-Befehl angegeben wird.
Unabhängig davon ist es empfehlenswert, am Ende des lesbaren Textes (Body) eines jeden HTML-Files den Namen und die Mail-Adresse des Autors, das Datum der Erstellung oder der letzten Aktualisierung, und eventuell auch ein Hypertext-Link auf die WWW-Start-Seite (Home-Page) der Institution anzugeben.
Als erste Zeile des Files (vor dem Befehl <html>
)
kann man die
HTML-Version
mit einem
SGML-Befehl
wie z.B.
<!DOCTYPE HTML
PUBLIC "-//IETF//DTD HTML 2.0//EN">
oder
<!DOCTYPE HTML
PUBLIC "-//W3C//DTD HTML 3.2//EN">
angeben.
Wenn diese Angabe fehlt, wird HTML 2.0 angenommen.
Für mehrere kleine Files und gegen wenige allzu große Files sprechen die folgenden Punkte:
Unter Betriebssystemen, die wie MS-DOS nur 3 Zeichen lange Extensions erlauben, müssen die Files unter Filenamen der Form "xxxxx.htm" abgespeichert werden. In manchen Fällen kann man dann trotzdem in den URLs (Hypertext-Links, Bookmarks und Suchhilfen) die Filenamen als "xxxxx.html" mit der kompletten Extension angeben, die Extension wird dann vom Betriebssystem automatisch richtig gekürzt; in vielen Fällen funktioniert das aber nicht.
Es wird empfohlen, zusammengehörende HTML-Files jeweils in einem Directory gemeinsam abzuspeichern und in Querverweisen zwischen ihnen nur relative URLs zu verwenden, damit die Files auch nach einer eventuellen Übertragung auf einen anderen WWW-Server oder in einen anderen Bereich verwendet werden können.
Für das Erstellen eines HTML-Files genügt ein einfacher Text-Editor. Wenn Sie es mit einem Textverarbeitungs-Programm wie MS-Word erstellen, müssen Sie das File als reines ASCII-File speichern ("nur Text").
Es gibt auch verschiedene Hilfsprogramme, mit denen Web-Pages menügesteuert am Bildschirm erstellt sowie Win-Word-Files, RTF-Files, LaTeX-Files und andere File-Formate mehr oder weniger automatisch in HTML-Files umgewandelt werden können (siehe die Referenzen).
HTML-Files müssen immer unter den richtigen Filenamen angelegt werden.
Viele, aber nicht alle Web-Browser tolerieren viele, aber nicht alle Abweichungen von den HTML-Sprachregeln. Wenn Ihr HTML-File also von Ihrem eigenen Browser richtig verstanden wird, dann bedeutet das noch nicht, daß es sich tatsächlich um richtige HTML handelt und daß es auch von anderen Lesern mit den von ihnen verwendeten Browsern gelesen werden kann.
Bevor Sie Ihre Web-Page für alle Welt zugänglich machen, sollen Sie Ihr Werk deshalb mit mindestens zwei verschiedenen Web-Browsern als "lokales File" testen: einem im Line-Mode (z.B. Lynx) und einem im Graphik-Mode (z.B. Mosaic oder Netscape), oder zumindest mit verschiedenen persönlichen Einstellungen (z.B. mit und ohne Bilder) und verschiedenen Fenstergrößen.
Außerdem sollten Sie sich nicht auf die Fehlertoleranz der eigenen Web-Browser verlassen, sondern HTML-Prüfprogramme ("Validatoren") verwenden, die sowohl die HTML-Sprachregeln als auch die Eigenheiten von allen Web-Browsern berücksichtigen und damit die Brauchbarkeit Ihrer HTML-Files wirklich sicherstellen - so ähnlich wie Spell-Checker-Programme in der Textverarbeitung.
Solche Programme können am eigenen PC installiert werden, wesentlich einfacher und bequemer ist es aber, die öffentlichen HTML-Validatoren zu verwenden, denen man nur den URL des HTML-Files angibt und die einem dann sofort alle in diesem File enthaltenen Fehler oder ungünstigen Konstruktionen anzeigen (siehe die Referenzen).
Dieser Server-Computer muß ständig (24 Stunden täglich) mit dem Internet verbunden sein. Günstig ist ein Rechner mit einem Multi-Tasking-Betriebssystem wie Unix, schnellen Platten und einem leistungsfähigen Internet-Anschluß. Als Server-Software kommen mehrere kostenlose Software-Produkte von Institutionen wie CERN und NCSA sowie kostenpflichtige Produkte von Software-Firmen in Frage (siehe die Referenzen).
Wenn Sie keinen solchen Rechner besitzen (z.B. nur einen PC oder nur eine Telefon-Verbindung zum Internet) oder keine solche Software betreiben wollen, müssen Sie einen Bereich auf einem WWW-Server "ausborgen" oder mieten. In vielen Universitäten und größeren Firmen bietet das EDV-Zentrum allen Mitarbeitern eine Möglichkeit dafür, und kommerzielle Internet-Provider stellen privaten Kunden und Firmen WWW-Server-Bereiche gegen Bezahlung zur Verfügung.
HTML-Files müssen immer unter den richtigen Filenamen abgespeichert werden.
Bevor Sie Ihre HTML-Seite für alle Welt zugänglich machen, müssen Sie Ihr Werk korrekturlesen und testen.
Die Vorgangsweise beim Speichern eines HTML-Files auf einem WWW-Server sollte so ähnlich wie im folgenden Beispiel ablaufen:
Nachdem Sie das File im WWW veröffentlicht haben, sind Sie dafür verantwortlich, den Inhalt laufend zu aktualisieren - oder das File, wenn es nicht mehr relevant ist, zu löschen.
Im einfachsten Fall lassen Sie ein Hypertext-Link auf Ihre WWW-Informationen vom "Webmaster" im EDV-Zentrum Ihrer Institution bzw. Ihres Internet-Providers in dessen WWW-Informationssystem einbauen. Viele Universitäten haben zum Beispiel auf ihrem WWW-Server so etwas wie eine Liste aller Informationen innerhalb der Universität.
Die Universitäten und Firmen selbst lassen Ihren WWW-Server am besten in einer Liste aller Informationssysteme ihres Landes eintragen, und diese Landeslisten sind ihrerseits in weltweiten Listen und Suchhilfen auffindbar (siehe die Referenzen).
Zusätzlich kann es sinnvoll sein, WWW-Informationen über bestimmte Themen in fachspezifischen Listen und in Suchhilfen einzutragen. Hinweise, wie man solche Eintragungen vornimmt und welche Informationen man dabei angeben muß, findet man meistens in den betreffenden WWW-Listen und Suchhilfen selbst.
Sehr interessante WWW-Informationen kann man außerdem in einschlägigen Mailing-Listen oder Usenet-Newsgruppen bekanntgeben - in weltweiten oder regionalen, allgemeinen oder fachspezifischen - aber nur, wenn die Information für die Mitglieder dieser Gruppen auch wirklich interessant und wichtig ist.
Eine einfache, aber durchaus wirksame Methode ist es, in der "E-Mail-Signature" nicht nur die eigene Mail-Adresse sondern auch den URL der eigenen WWW-Information anzugeben und damit eine nicht als lästig empfundene, aber bei allen fachlichen Kontakten sichtbare "Reklame" für diesen URL zu machen.
Natürlich sollte man in allen diesen Fällen nicht nur den URL sondern auch ein, zwei Stichwörter über den Inhalt der damit erreichbaren Informationen angeben. Dabei sind sachliche Hinweise wie z.B. "Spielpläne für Opernfreunde in Europa" erfolgreicher als ein nichtssagendes "Viele interessante Informationen" oder ein marktschreierisches "Lauter laute Links".
Bitte, bedenken Sie:
Falsche oder nicht mehr aktuelle Informationen sind schlechter als gar keine Information.Sie als Autor sind dafür verantwortlich, alle von Ihnen im WWW angelegten und damit weltweit veröffentlichten HTML-Files laufend aktuell zu halten und bei Bedarf zu korrigieren - oder das File, wenn es nicht mehr relevant ist oder Sie es nicht mehr weiter aktualisieren möchten, zu löschen.
Es kann hilfreich sein, die Leser um Mithilfe zu bitten, etwa wie im folgenden Beispiel:
Verantwortlich für den Inhalt dieser Web-Page ist Dr. Hubert Partl im zentralen Informatikdienst der BOKU Wien. Bitte, senden Sie Fragen, Hinweise (z.B. auf nicht mehr aktuelle Informationen, fehlende Informationen oder ungünstige WWW-Links) und Verbesserungsvorschläge (Korrekturen, Ergänzungen, Hinzunahme von interessanten Links) per E-Mail an partl@mail.boku.ac.at
Das Löschen selbt kann einfach mit dem entsprechenden Systembefehl erfolgen (unter Unix z.B. mit rm). Vorher müssen aber alle Hypertext-Links, die noch auf dieses File verweisen, gelöscht bzw. korrigiert werden.
Da Sie nicht wissen können, wo überall im World Wide Web andere Leute Links auf Ihr altes File in deren HTML-Files oder in Bookmarks oder in Suchhilfen angelegt haben, ist es empfehlenswert, das File nicht sofort zu löschen sondern während einer längeren Übergangszeit durch ein kleines HTML-File zu ersetzen, das angibt, warum die Information nicht mehr gültig ist, und ein Hypertext-Link auf die neue, bessere Information enthält, die das alte HTML-File ersetzt.