Title: HTML - Hypertext Markup Language
Author: Arnoud Engelfriet
Date: July 1996
Published in: Impact jaargang 2 nummer 6, 1996.

HTML - Hypertext Markup Language

Het World Wide Web is het populairste deel van het Internet, vanwege het gemak waarmee informatie te vinden is. Documenten op het Web worden geschreven in HTML, een platform-onafhankelijke taal die inmiddels weer aan versie 3.2 toe is. Helaas blijkt dat niet iedereen de mogelijkheden van HTML inziet.

De geschiedenis van HTML

HTML is een afkorting voor hypertext markup language oftewel "hypertekst opmaaktaal". De taal werd begin jaren negentig ontwikkeld om op eenvoudige manier hypertekst-mogelijkheden op te nemen in teksten. HTML is min of meer te vergelijken met hoe bv. WordPerfect teksten opmaakt, alleen zijn in HTML de "instructies" een stuk simpeler. Ze bestaan namelijk uit leesbare woorden en kunnen met elke editor worden ingevoerd. Hierdoor is het mogelijk om programma's uitvoer te laten genereren in HTML formaat.

De allereerste versie van de taal was nauwelijks gestructureerd. In begin 1994 werd de ontwikkeling overgenomen door de W3C (World Wide Web Consortium) en werd besloten de taal formeel in SGML vast te leggen. Het resultaat hiervan werd in juni 1995 gepubliceerd als HTML versie 2.0. Elk programma dat HTML bestanden kan afbeelden (de Web-browsers) dient tenminste alle elementen uit HTML 2.0 te ondersteunen. Enige maanden eerder in 1995 verscheen een nieuwe, experimentele versie van HTML, aangeduid met HTML 3.0. Deze nieuwe versie bevatte vele nieuwe elementen en verbeteringen ten opzichte van HTML 2.0, zoals bijvoorbeeld tabellen, mogelijkheden om wiskundige formules op te nemen, en een verbeterde manier om klikbare plaatjes te gebruiken (de zgn. "imagemaps").

Netscape, de populairste browser van dat moment, nam diverse elementen uit HTML 3.0 over, maar introduceerde ook vele eigen elementen onder de noemer "HTML 3.0". Dit zorgde (en zorgt) voor de nodige verwarring bij de gebruikers. Op dit moment komt het nog vaak voor dat mensen de term "HTML 3.0 element" gebruiken om een Netscape-specifiek element aan te geven.

HTML versie 3.2 - Wilbur

Om aan deze verwarring een einde te maken, werd in 1996 een nieuwe versie van HTML gepubliceerd. Dit werd HTML 3.2, ook wel aangeduid met de codenaam "Wilbur". HTML versie 3.2 bevat alle elementen die browsers op dit moment ondersteunen en kan dus worden gezien als de opvolger van HTML 2.0. Vanwege het gebrek aan ondersteuning door de browsers van dit moment kwamen de meeste nieuwe elementen uit HTML 3.0 te vervallen. De enige echt nieuwe elementen in HTML 3.2 zijn tabellen en de mogelijkheid om kleuren voor een pagina aan te geven. De W3C werkt momenteel aan een nieuwe experimentele versie, als opvolger van versie 3.0. Opvallend detail is dat Netscape zelf nog steeds op haar Website claimt te streven naar volledige ondersteuning van de HTML 3.0 specificatie.

Informatie over HTML 3.2 is te vinden op http://www.htmlhelp.com/reference/wilbur/

Structuur en geen presentatie

De belangrijkste eigenschap van HTML is het feit dat de taal structuur-georienteerd is en niet presentatie-georienteerd. Het eerder genoemde WordPerfect is zuiver gericht op presentatie. Een taal als LATEX is een kruising tussen beiden: in deze taal kan de structuur van een tekst worden aangegeven, maar ook kunnen expliciete instructies voor het afdrukken worden opgenomen.

Omdat in HTML de opmaak de structuur van de tekst aangeeft, is het mogelijk om op elk platform een juiste afbeelding te genereren. Zo is het bijvoorbeeld mogelijk om aan te geven dat een stuk tekst extra nadruk moet krijgen. Meestal wordt dit gedaan door de tekst in italics (cursief schrift) te zetten, maar dit zou betekenen dat systemen die geen cursief schrift kunnen afbeelden geen nadruk kunnen aangeven. Wanneer nu echter bekend is dat de tekst nadruk moet krijgen, kan zo'n systeem dit op een andere manier aangeven, bijvoorbeeld door de tekst af te beelden in rood i.p.v. in zwart. Een bijkomend voordeel is dat nu de benadrukte stukken te onderscheiden zijn van de citaten en de boektitels, ondanks het feit dat het gebruikelijk is alle drie in cursief schrift af te beelden. Dit maakt automatische verwerking van de documenten mogelijk. Zoekmachines zijn nu b.v. in staat om de kopjes in een document te gebruiken om een samenvatting of overzicht te genereren.

Een voorbeeld hiervan is te zien in figuren 1 en 2. Beide afbeeldingen zijn het resultaat van hetzelfde HTML document.

De structuur-georienteerdheid en de eenvoudigheid van HTML zijn de belangrijkste redenen dat de taal zo succesvol geworden is. Op vrijwel elk platform zijn diverse browsers beschikbaar die HTML bestanden kunnen afbeelden. Ondanks de beperkingen van sommige platforms (zoals bijvoorbeeld een vt100 terminal) is het toch mogelijk om HTML bestanden goed weer te kunnen geven. Dit zou nooit mogelijk zijn geweest wanneer HTML een zuivere presentatie-taal geweest was.

Het WordPerfect paradigma

De laatste maanden richten auteurs op het World Wide Web zich steeds meer op grafische systemen. Ook blijkt dat een groot aantal auteurs het moeilijk vindt om af te stappen van het "WordPerfect paradigma" oftewel de neiging om HTML te gebruiken als pure presentatietaal. Dit is voor een gedeelte te wijten aan de populariteit van de (grafische) browser Netscape. Veel auteurs beschouwen de uitvoer in Netscape als de uitvoer van hun HTML document en realiseren zich niet dat het document er op een ander systeem heel anders uit ziet.

Het gebruik van grafische HTML editors versterkt dit effect alleen maar. Deze editors genereren zelf de HTML en bieden de auteur een WYSIWYG (What You See Is What You Get) interface. Hierdoor lijkt het schrijven van HTML sterk op het schrijven van een document in WordPerfect of Word. De term WYSIWYG is nu echter misleidend. Alhoewel de auteur ziet wat hij verwacht, geldt dit niet noodzakelijkerwijs voor alle lezers. Het aantal mogelijke manieren om het document te bekijken (ander besturingssysteem, meer of minder kleuren, hogere/lagere resolutie, wel of geen plaatjes, ander lettertype, enzovoort) maakt het onmogelijk om een consistente presentatie te garanderen.

Conclusie

Informatie die op het World Wide Web wordt gepubliceerd, wordt aan de hele wereld aangeboden. Het doel van HTML is om dit aanbieden zo eenvoudig mogelijk te maken, zodat iedereen, ongeacht hardware, software en configuratie de informatie in kan zien. Hiervoor moet de auteur wel afstappen van het idee dat hij de presentatie van zijn document kan controleren. Wanneer hij zich in plaats daarvan richt op de inhoud van het document, kan hij misschien niet garanderen dat iedereen ziet wat hij ziet, maar wel dat iedereen het ziet.

Om een betere presentatie te verkrijgen, kan gebruik worden gemaakt van "style sheets". Met behulp van een speciaal voor dit doel ontwikkelde taal, CSS genaamd, kan voor elk element de presentatie (lettertype, corpsgrootte, kleur, enzovoorts) worden gedefinieerd. Hiermee is de presentatie losgekoppeld van de structuur, waardoor beiden aanwezig zijn in het document. Deze techniek is momenteel nog in een experimentele fase, maar algemeen wordt verwacht dat style sheets in de toekomst een essentieel onderdeel van een Website zullen vormen.

Article index | Comments
Copyright © 1998 by Arnoud Engelfriet. All rights reserved.