Savit's HTML Polish Guide !!!

Tworzenie własnych dokumentów WWW

W miarę rozwoju sieci komputerowych, szczególnie Internetu, już na początku lat 90. zaczęto borykać się z problemem wygodnego sposobu dystrybuowania informacji. Dane udostępniane wyłącznie w formie plików stawały się coraz mniej czytelne, rozpoczęto więc poszukiwania nowych form przekazu. Pierwsze z nich zdefiniowano w postaci standardu MIME (Multimedia Internet Mail Extension) i zaimplementowano w systemie informacyjnym Gopher. Wtedy to właśnie po raz pierwszy stało się możliwe zintegrowanie elektronicznych wiadomości tekstowych z grafiką, dźwiękiem oraz animacją. Kolejnym krokiem, mającym na celu udostępnianie informacji szerokiej rzeszy użytkowników, było stworzenie systemu World Wide Web.


W WWW dokumenty są udostępniane dzięki systemowi serwerów, na których zostało zainstalowane specjalne oprogramowanie obsługujące protokół HTTP. Każdy, kto chce obejrzeć zasoby jednego z serwerów, musi podać odpowiedni adres, a później wyszukać interesujące go dokumenty. Proces ten może być znacznie ułatwiony, gdy skorzysta się z - licznie występujących w dokumentach - tzw. odnośników, które wskazują na inne strony WWW. W ten sposób użytkownik nie musi wiedzieć, gdzie znajduje się poszukiwany przez niego dokument. Wystarczy tylko, aby kierował się kilkoma podstawowymi zasadami „nawigacji" w WWW.

W tym rozdziale opisano sposób, w jaki można samodzielnie tworzyć i udostępniać informację w WWW. Do tego celu służy język HTML (Hypertext Markup Language), który wywodzi sie z języka SGML (Structured General Markup Language). Dokumenty HTML mogą być udostępniane przez bardzo różnorodne systemy i serwery. Mogą one zawierać nie tylko teksty, lecz także obrazki, dźwięk i animacje.

Poniżej został opisany standard HTML 2.0 oraz kilka elementów z HTML 3.0, obsługiwanych przez najnowsze wersje przeglądarek WWW Netscape Navigator 2.0, Microsoft Internet Explorer oraz Mosaic2.1. Najbardziej uniwersalną, obsługującą większość nowych komend (w tym tzw. rozszerzenia Netscape’a), wydaje się pierwsza z nich.

Gdy jakieś polecenie czy atrybut będzie charakterystyczny tylko dla programu Netscape 2.0, zostanie to zasygnalizowane w tekście oznaczeniem .

Jako uzupełnienie HTML zostanie również opisany sposób dołączania do dokumentów różnych obiektów, takich jak filmy wideo czy obiekty VRML oraz apletów (programików) napisanych w języku Java (obsługiwanym jednak wyłącznie przez 32-bitową wersję Netscape’a).

Przykład na „rozgrzewkę"

Jako przykład wprowadzający może posłużyć poniższy krótki dokument HTML:


<html>
<head>
<title> Dokument przykładowy </title>
</head>
<body>
<h1> Pierwszy dokument</h1>
Ten bardzo prosty przykład powinien
wprowadzić w strukturę dokumentów HTML. 
Zawiera on znikomą liczbę elementów, 
za pomocą których można już w bardzo 
przyzwoity sposób przedstawić odpowiednią
porcję informacji.

<br>
Poniżej przestawiony jest przykład listy:
<br>
<ul>
<li> Lista 
<li> może
<li> zawiera
<li> wiele pozycji.
<li> W dowolnym miejscu można np. umieścić słowo „title".
</ul>
<hr>
</body>
</html>

Postać strony WWW z pierwszego przykładu dokumentu HTML

Ten pierwszy przykład może się wydać niezbyt przejrzysty. Pokazuje on jednak, że dokumenty HTML zawsze muszą być tworzone według pewnych, z góry określonych reguł.

To, co chcemy traktować jako dokument HTML, musi zostać „obramowane" specjalnymi etykietami (tags) <HTML> oraz </HTML>. Pomiędzy nimi znajdują się wszystkie inne elementy, wpływające bezpośrednio na wygląd oraz na identyfikację danej strony WWW. Zwykle taki dokument dzieli się na dwie części: nagłówek (<HEAD>) oraz część główną (<BODY>). Ich deklaracja jednak nie jest obowiązkowa.

W nagłówku najczęściej umieszczony jest tytuł dokumentu, który w zależności od przeglądarki wyświetlany jest później w różny sposób (na przykład w tytule okna). Do tego dochodzą również inne elementy, które choć nie są przedstawiane na ekranie, mogą przykładowo sterować procesami komunikacji pomiędzy serwerami a klientami WWW. W prezentowanym przykładzie dokumentowi został nadany tytuł „Dokument przykładowy".

Główna część dokumentu zawiera przedstawiane elementy tekstowe oraz elementy służące do powiązania aktualnej strony z innymi. W naszym przykładzie widoczna jest na przykład pozioma linia oddzielająca - uzyskana przy użyciu etykiety <HR> (horizontal rule) - oraz nagłówek wpisany pomiędzy <H1> a </H1>.

W przypadku elementu <HR> dodatkowo zastosowano parametr WIDTH=200 oraz ALIGN=center, dzięki czemu linia rozdzielająca prezentowana jest na środku ekranu i ma długość 200 pikseli. Atrybuty umieszcza się zawsze w sekcji pierwszego ogranicznika zaraz po głównej instrukcji, a ich wartości poprzedzone są zawsze znakiem równości. Kolejne atrybuty oddzielane są spacjami. Większość etykiet HTML posiada jeden lub kilka atrybutów, istnieją jednak komendy bezparametrowe (na przykład <TITLE>).


Dokumenty muszą posiadać strukturę

Z powyższego przykładu można wnioskować, że dokumenty HTML nie różnią się znacznie od prostych plików tekstowych, posiadających odpowiednią strukturę. Można je zatem tworzyć i poprawiać za pomocą dowolnego edytora tekstowego i zapisywać w standardzie ANSI. Na rynku pojawiło się wiele programów pomocniczych, ułatwiających proces tworzenia dokumentów. Niektóre z nich potrafią tłumaczyć na standard HTML pliki ze znanych edytorów tekstu (na przykład Word, LaTex), inne ułatwiają bezpośrednią edycję. Kilka takich programów zostanie opisanych na końcu tego działu. Znajdą się one również na dołączonym do zeszytu CD-ROM-ie.

Oznaczanie etykiet

Komentarze

Znaki specjalne i narodowe

Znaki narodowe i specjalneJuż na początku rozwoju komputerów pojawiały się spore problemy związane z przedstawianiem na monitorach znaków narodowych i specjalnych oraz z przypisaniem ich do odpowiednich klawiszy na klawiaturach. W tzw. międzyczasie został opracowany standard ANSI, który umożliwiał przedstawianie 256 znaków. Niektóre z nich stanowiły specjalne znaki sterujące, większość jednak mogła być prezentowana na ekranie. W standardzie HTML w zasadzie wyświetlane są wszystkie znaki ANSI. Wyjątek stanowią sekwencje zaznaczające bloki.

Niektóre edytory do tej pory pracują w trybie kodowania 7-bitowego (ISO-646). Aby umożliwić transmisję dokumentów HTML również w tym systemie, zostały wprowadzone specjalne sekwencje (tzw. sekwencje ESCAPE) dla znaków, których kod większy jest od 127.

W ten sposób możliwe jest na przykład przedstawianie ograniczników < i > jako normalnego tekstu. Pierwszy z ograniczników wyświetlany jest za pomocą sekwencji &lt; drugi po wpisaniu &gt;. W tym momencie znaki te tracą swoje poprzednie właściwości i stają się zwykłymi symbolami, prezentowanymi na ekranie jako znaki mniejszości i większości.

Lista znaków specjalnych i narodowych


Nagłówek dokumentu

Nagłówek strony WWW nadaje jej specjalny, określony charakter. W nim zawarte są ogólne informacje o tekście zamieszczonym w dokumencie. Nagłówek oznaczany jest poprzez ograniczniki <HEAD> oraz </HEAD> . Wszystkie elementy, które zostały umieszczone pomiędzy tymi etykietami nie będą przedstawiane w głównym oknie przeglądarki WWW.

Główna część dokumentu

Gdy ktoś przyzwyczajony jest do superwygodnych edytorów tekstu, być może zdziwi się, iż korzystając z języka HTML ma o wiele mniejsze możliwości formowania tekstu. Taki zamysł był jednak świadomy. W przypadku przetwarzania tekstu za pomocą wyspecjalizowanych edytorów największy nacisk kładzie się na dokładną i wierną prezentację dokumentu, odpowiadającą wydrukowi na drukarce. HTML natomiast na pierwszy plan wysuwa potrzebę uniezależnienia wyświetlania od środowiska. Dlatego też dokumenty WWW mogą być oglądane z poziomu większości platform sprzętowych oraz z wykorzystaniem różnorodnego oprogramowania (pracującego zarówno w środowisku graficznym, jak i tekstowym).

Łatwo można dostrzec, że dokumenty HTML posiadają określoną strukturę, przez co łatwiej się je czyta. Zostało to osiągnięte dzięki zastosowaniu tzw. logicznych atrybutów tekstu, które określają, w jaki sposób tekst (lub jego fragmenty) ma być wyświetlany na ekranie.

Body

Właściwy dokument oraz wszystkie jego elementy wyświetlane są w części głównej (BODY). Aby móc ją oznaczyć, stosuje się ograniczniki <BODY> ... </BODY>. Wszystko, co zostało umieszczone pomiędzy nimi, należy do części dokumentu, która zostanie zaprezentowana w oknie. Zwykle jednak nie jest konieczne korzystanie z sekwencji <BODY> ... </BODY>, ponieważ przeglądarki WWW są często „niekonsekwentne" w interpretacji niektórych komend. Dla większej czytelności z etykiety tej nie warto jednak rezygnować, a już w szczególności wydaje się to nierozsądne, gdy zapragniemy na przykład „podłożyć" tło dokumentu lub określić w inny sposób wygląd strony.

Element ten cechuje bowiem dość duży zestaw atrybutów, które okazują się bardzo pomocne w dołączaniu do dokumentu wielu „bajerów". Poniżej przedstawione zostały wszystkie atrybuty elementu BODY wraz z opisem:

Ponadto w przypadku programu Netscape 2.0 dla wszystkich atrybutów operujących na kolorach (oprócz ALINK) można używać wartości w formie nazw w języku angielskim. Dostępne kolory to Black, Olive, Teal, Red, Blue, Maroon, Navy, Gray, Lime, Fuchsia, White, Green, Purple, Silver, Yellow oraz Aqua.
Stosując tło należy pamiętać, że jest ono definiowane za pomocą pliku graficznego, co zawsze spowalnia transmisję dokumentu. Rozsądnym rozwiązaniem jest zatem używanie jak najmniejszych rozmiarów obrazka reprezentującego tło.

Logiczne właściwości tekstu

Atrybuty tekstu dzielą się na logiczne i fizyczne. Elementy logiczne nadają tekstowi pewną określoną strukturę (na przykład znane już <UL> oraz <H1>). Swoją nazwę mogą usprawiedliwić tym, że są one inaczej wyświetlane przez różne przeglądarki. Obojętne jest jednak, w jaki sposób prezentowany jest na przykład nagłówek, ważne jest, że musi on wyraźnie oddzielać się od reszty tekstu. To samo dotyczy pozostałych elementów, np. numerowanych list czy elementów formatujących tekst w bloki.

Nagłówki

Listy

Inne właściwości logiczne tekstu

Pozostałe elementy logiczne są rzadziej używane i mają mniejsze znaczenie. Wszystkie mogą być w różny sposób przedstawiane w zależności od używanej przeglądarki. Najistotniejsze jednak właściwości tekstu, warunkowane typem informacji prezentowanej na ekranie, pozostają zachowane. W języku HTML 2.0 do dyspozycji mamy siedem dodatkowych elementów logicznych. Oto one:

Wyróżnienie: za pomocą elementu <EM>...</EM> (emphasized) tekst znajdujący się pomiędzy ogranicznikami zostaje w pewien sposób wyróżniony. Wg zaleceń języka powinien być on prezentowany za pomocą kursywy.

Tekst pogrubiony: element <STRONG>...</STRONG> pozwala na wyświetlanie tekstu czcionką pogrubioną.

Cytat: za pomocą <CITE>...</CITE> mogą być przedstawiane cytaty. Najczęściej są one prezentowane w postaci czcionki pochyłej.

Skróty klawiszowe: często w różnych podręcznikach symbole przycisków klawiatury są prezentowane w odmienny sposób. W przypadku HTML umożliwia nam to sekwencja <KBD>...</KBD>, która zwiększa czytelność tego typu tekstów. Jako formę prezentacji proponuje się czcionkę z nieproporcjonalnymi odstępami.

Wzór literowy: zestawienia wzorów liter można przedstawiać dzięki sekwencji <SAMP>...</SAMP>. Weług definicji powinien to być tekst pisany czcionką maszynową z nieproporcjonalnymi odstępami.

Miganie: element <BLINK>...</BLINK> nadaje tekstowi zawartemu pomiędzy tymi ogranicznikami atrybut migania

Zmienne: element <VAR>...</VAR> określa wystąpienie w tekście jakiejś zmiennej. Tekst pomiędzy ogranicznikami winien być przedstawiany kursywą.

Kod źródłowy: za pomocą elementu <CODE>...</CODE> zaznaczany jest tekst źródłowy. Sposób prezentacji jest zwykle identyczny z elementem <KBD>. Warto tutaj podkreślić fakt, że elementu <CODE> nie można mylić z instrukcją <PRE> (patrz ustęp poniżej), ponieważ tekst kodu traktowany jest w standardowy sposób (dotyczy to przede wszystkim automatycznego podziału na wiersze oraz skracania ciągu białych znaków do pojedynczej spacji). Oczywiście tekst ten prezentowany jest zwykle za pomocą czcionki nieproporcjonalnej.

Fizyczne właściwości tekstu

Elementy formatujące bloki

Kotwice i odnośniki

Obrazki

Mapy

Tabele

Ramy (Netscape 2.0)

Formularze


Dodatki (Plug-Ins) do Netscape’a

W programie Netscape już od wersji 1.1 dla Windows wprowadzono innowację, będącą pewnym uzupełnieniem języka HTML, dzieki której stało się możliwe bezpośrednie wstawianie do dokumentu obiektów różnego typu: filmów wideo, obrazków o niestandardowych formatach, obiektów VRML czy też dźwięków. Rozszerzenia Netscape’a przypominają techniką OLE 2.0, stosowaną w wielu aplikacjach Windows, dzięki której możliwe jest swobodne łączenie ze sobą dokumentów pochodzących z różnych programów. Każdy z nich musi jednak współpracować z odpowiednimi bibliotekami obsługującymi mechanizmy OLE.

W przypadku Netscape’a mamy podobną sytuację. Program ten można bowiem rozbudować o dodatkowe moduły tzw. plug-ins (patrz rozdział „Przeglądarki WWW"), które po zainstalowaniu umożliwiają wstawianie obsługiwanych przez nie obiektów. Generalnie programy te dzielą się na trzy rodzaje. W pierwszym typie (embed) wstawiane elementy są częścią składową dokumentu (na przykład obiekty VRML, filmy wideo). Typ full-scren (pełny ekran) z kolei polega na tym, że obiekt prezentowany jest w oknie przeglądarki jako jedyny (na przykład pliki *.PDF programu Adobe Acrobat). Ostatni hidden (ukryty) nie powoduje żadnych zmian na ekranie, może jednak przykładowo odgrywać muzykę MIDI lub odpowiadać za kompresję danych.
Za implementację obiektów plug-ins w dokumencie HTML odpowiedzialny jest tylko jeden element o nazwie <EMBED>. Jego obowiązkowym atrybutem jest SRC (podobnie jak dla elementu <IMAGE>), który w tym przypadku może wskazywać na dowolny plik. Dzięki parametrom WIDTH oraz HEIGHT dodatkowo można również ustalić wielkość okna, w którym prezentowany będzie obiekt. Oto przykład:

<EMBED SRC=video.avi WIDTH=100 HEIGHT=80>

W zależności od zainstalowanego modułu plug-in mogą być używane inne atrybuty. Na przykład dla programu WebFX obsługującego wirtualne sceny VRML dodatkowo można stosować BORDER oraz ALIGN.

Obiekty VRML w programie Netscape, wstawione do dokumentu za pomocą elementu <EMBED>


Wstawianie w dokument apletów i skryptów języka Java

Coraz modniejszy język Java zakrada się powoli do serwerów WWW. Obiekty tego języka w dokumentach HTML mogą być stosowane praktycznie do wszystkiego, poczynając od zabawy (animacje, gry itp.), kończąc na programach edukacyjnych, użytkowych czy też menedżerskich.

Jak dotąd, jedynymi znanymi przeglądarkami WWW, obsługującymi aplety (krótkie programiki) obiektowego języka Java, są HotJava oraz Netscape 2.0 w wersji 32-bitowej. W drugim z wymienionych programów wprowadzono dodatkowo możliwość obsługi tzw. skryptu Java (ang. JavaScript) będącego reprezentantem nieco uboższej formy tego języka (wtedy wystarczy wersja 16-bitowa Netscape). Komendy skryptowe mogą być wpisywane bezpośrednio w dokumencie i uruchamiane w trybie interpretera linia po linii (aplety Java muszą być wcześniej przetworzone za pomocą odpowiednich kompilatorów).

Należy w tym momencie podkreślić, że wyjaśnione zostaną tu zasady wstawiania do dokumentu przekompilowanego już apletu lub skryptu Java, a nie sposób ich implementowania. Dokładne informacje na temat samego języka znajdują się pod adresem http://java.sun.com (Java) lub na serwerze firmy Netscape (JavaScript).

Zacznijmy od mniej skomplikowanego przypadku, obrazującego sytuację gdy do naszego dokumentu zechcemy dołączyć skrypt Java. Cały kod źródłowy skryptu musi zostać wtedy umieszczony pomiędzy elementami <SCRIPT> ... </SCRIPT>. Ogranicznik otwierający musi dodatkowo zawierać obowiązkowy atrybut LANGUAGE z wartością JavaScript (również obligatoryjną). Przykład:

<SCRIPT LANGUAGE="JavaScript">
... kod źródłowy skryptu ...
</SCRIPT>

Kod źródłowy nie musi być jednak wpisywany bezpośrednio w dokumencie. Może się on również mieścić w osobnym pliku wskazywanym przez wartość dodatkowego atrybutu SRC. Na przykład:

<SCRIPT LANGUAGE="JavaScript" SRC=source.jav>

O wiele bardziej rozbudowana jest składnia związana z obsługą skompilowanych apletów języka Java. Tutaj podstawowym elementem jest <APPLET>...</APPLET>, który posiada szereg charakteryzujących go parametrów. W najprostszej postaci wstawienie apletu do dokumentu może mieć następującą postać:

<APPLET CODE=MyApplet.class WIDTH=100 HEIGHT=140> 
</APPLET>

W tym przypadku uruchamiany jest przekompilowany kod MyApplet.class, znajdujący się na lokalnym komputerze (użyty atrybut CODE) w oknie o rozmiarach 100x140 (w pikselach).

Najczęściej jednak fragmenty dokumentów HTML, odwołujące się do apletów wyglądają bardziej zawile. Oto przykład:

<APPLET CODEBASE="http://java.sun.com/JDK-prebeta1/applets/NervousText" CODE="NervousText.class" WIDTH=400 HEIGHT=75 ALIGN=center >
<PARAM NAME="text" VALUE="To jest przeglądarka apletów.">
<BLOCKQUOTE>
<HR>

Jeśli nie posiadasz przeglądarki współpracującej z językiem Java, to zamiast „skaczącego tekstu" zobaczysz tylko tekst z tego paragrafu.

<HR>
</BLOCKQUOTE>
</APPLET>

Teraz przeglądarka ładuje gotowy aplet z serwera firmy Sun (http://java.sun.com) i jako wartość inicjującą ustala rozmiar okna na 400x75 pikseli. Całe okno wyrównuje zaś do środka poziomej długości ekranu.

Do apletu mogą zostać wysłane parametry wejściowe, które są interpretowane przez metodę języka Java o nazwie getParameter(). Do tego celu służy deklaracja <PARAM> wraz ze swoimi atrybutami NAME (nazwa zmiennej) oraz VALUE (wartość). W powyższym przykładzie wysyłana jest zmienna z przypisaną nazwą text, która ustala ciąg znaków, który ma być wyświetlany przez aplet (na przykład: „To jest przeglądarka apletów").

Jeśli strona zawierająca wywołania języka Java jest oglądana przez przeglądarkę nie posiadającą możliwości obsługi apletów, element <PARAM>, jak również inne etykiety znajdujące się wewnątrz sekcji apletu są ignorowane. Jedynym wyjątkiem jest sekwencja <BLOCKQUOTE>...</BLOCKQUOTE>, która w przypadku niemożności uruchomienia apletów wyświetla zawarty w niej tekst (jest on ignorowany w sytuacji odwrotnej).

Pozostałe atrybuty elementu <APPLET> są już właściwie znane. ALT, WIDTH, HEIGHT, ALIGN, VSPACE, HSPACE powodują takie samo działanie jak w przypadku elementu <IMG>, przybierając identyczne wartości. Trochę inne znaczenie ma atrybut NAME, określający identyfikator danego apletu. Z jego pomocą każdy program w języku Java może się porozumiewać z innymi, używając nazw podanych jako wartość tego atrybutu. Ostatni, opcjonalny parametr to CODEBASE, ustalający domyślną ścieżkę dostępu do katalogu, do którego będą mogły się odwoływać poszczególne aplety (porównaj element <BASE>).

Aplety języka Java w dokumentach HTML


Wskazówki przydatne przy tworzeniu dokumentów

W tym ustępie podamy kilka dość ważnych porad, dzięki którym samodzielne tworzenie stron WWW może okazać się znacznie prostsze.
W większości przypadków informacje zawarte w dokumentach HTML dotyczą różnych instytucji, osób lub projektów badawczych. Powinny one dać możliwość ustosunkowania się czytelnika wobec przedstawionych problemów oraz, poprzez zastosowanie połączeń hipertekstowych, ułatwić dostęp do innych, poszukiwanych danych i informacji. Aby osiągnąć opisany wyżej cel, należy się podporządkować następującym wskazówkom:

* Każdy serwer posiada swoją reprezentacyjną stronę główną (home page). Jest ona automatycznie wyświetlana, gdy użytkownik jako URL poda adres komputera bez dodatkowych katalogów. Taka strona powinna być krótka i zawierać niewiele obrazków o małych rozmiarach natomiast dużo odwołań do innych dokumentów (na przykład stron głównych) lub tzw. plików indeksowych. Ma to tę zaletę, iż czytelnik może się szybko zdecydować, czy chce zostać na określonym serwerze, czy też, znudzony jego zawartością, zapragnie przejść na zupełnie inny serwer. Należy zawsze pamiętać, że czytelnik szybko się zniechęci, gdy ładowanie strony będzie trwało zbyt długo. Kończy się to często tym, że przerywa on transmisję i przegląda niekompletnie załadowane strony.


Programy pomocne w konwertowaniu dokumentów

Do tej pory omawialiśmy, w jaki sposób dokumenty HTML mogą być tworzone ręcznie. Do tego celu potrzebny jest jedynie edytor, który będzie w stanie zapamiętywać teksty w postaci kodu ANSI. Istnieje również cała masa dokumentów, które zostały stworzone za pomocą innych edytorów lub narzędzi. Najprostsze z nich to programy optymalizacyjne, czyli takie, które przetwarzają dokument HTML napisany „na brudno" i jako wynik dają hierarchicznie podzieloną stronę.

Większość konwerterów można znaleźć na przykład pod adresem iamwww.uniebe.ch/~scg/Src/Scripts/. Można stamtąd również ściągnąć kilka skryptów, które ułatwiają znacznie pracę w sieci. Nie będziemy się tu zajmować opisem instalacji poszczególnych programów, ponieważ informacje na ten temat zamieszczone są na odpowiednich stronach WWW. Wszystkie opisane w zeszycie konwertery zostały umieszczone na dołączonym do zeszytu CD-ROM-ie w katalogu \utility\www\html\.


LaTex2HTML

Szczególnie w środowiskach naukowych rozpowszechniły się edytory TeX oraz LaTeX. Sam proces edytowania dokumentów oraz składnia komend formatujących we wspomnianych programach teksty były bardzo podobne do języka HTML. Tak jak dokumenty WWW, tak i teksty w programie LaTeX pisane są wyłącznie w kodzie ANSI wraz z odpowiednio oznaczonymi poleceniami. Cały dokument jest później interpretowany przez program oraz odpowiednio przedstawiany na ekranie.

Za pomocą programu tex2html możliwe jest tłumaczenie tekstów napisanych za pomocą LaTeXa na format HTML. Składa się on z wielu skryptów konwertujących, które w dość prosty sposób zamieniają polecenia LaTeXa na etykiety HTML. Można go ściągnąć z adresu cbl.leeds.ac.uk/nicos/tex2html/doc/latex2html.html. Narzędzie to należy do programów typu public domain. Na dołączonym CD znajduje się kopia pakietu latex2html oraz EmTeX.


Word na HTML

Drugim bardzo użytecznym programem konwertującym jest rtf2html. Pozwala on na tłumaczenie tekstów zapisanych w formacie RTF (Rich Text Format) na dokumenty HTML. Wiele profesjonalnych edytorów tekstowych, jak na przykład Word, AmiPro, jest w stanie eksportować dokumenty do formatu RTF. Konwerter rtf2html jest również powszechnie udostępniany.


WordPerfect na HTML

Również dla tego edytora istnieje specjalny konwerter. Jest to program o nazwie wp2html, który został napisany przez Michaela Richardsona (mcr@ccs.carleton.ca) i jest darmowo udostępniany w sieci.


Troff na HTML

Wielu użytkowników systemu UNIX z pewnością doceniło już zalety pakietu makr o nazwie Troff. Oscar Nierstrasz (oscar@cui.uni-ge.ch) opracował program, który umożliwia tłumaczenie wszystkich najważniejszych makropoleceń.


PostScript na HTML

W sieci Internet wiele dokumentów udostępnianych jest jako pliki postscriptowe. Dzięki programowi konwertującemu ps2html w prosty sposób można je przekształcać na format HTML. Nawet odwołania, także stosowane w dokumencie postcriptowym, są tłumaczone prawidłowo. Ponieważ większość edytorów tekstu ma możliwość nagrywania zbiorów w formacie postscriptu, dokument HTML można stworzyć praktycznie z prawie każdego pliku.


Edytory HTML

Powyżej wymienione zostały programy, które tłumaczą gotowe dokumenty na format HTML. Gdy ktoś zechce pisać od razu w języku HTML, może użyć dowolnego edytora tekstowego. Inną, zwykle o wiele dogodniejszą opcją jest sięgnięcie po edytor HTML. Gdy jest się przyzwyczajonym do edytorów pracujących w technice WYSIWYG (ang. What You See Is What You Get), od razu nasuwa się pomysł korzystania z podglądu dokumentu HTML w jego rzeczywistej postaci. Bardzo pomocne byłoby, gdybyśmy już podczas pisania dokumentu wiedzieli jak będzie on później wyglądał na ekranie. Optymalnym rozwiązaniem jest również to, by użytkownik mógł względnie niewiele wiedzieć o składni tego języka podczas pracy z edytorem.

Zadaniem edytorów HTML, obok bezpośredniej pomocy w samym tworzeniu stron, jest również zapewnienie bezbłędnej składni. Wprawdzie każdy dokument jest odpowiednio kontrolowany przez przeglądarkę, lecz odnalezienie i usunięcie samego błędu jest o wiele bardziej skomplikowane. Poniżej przedstawiamy kilka edytorów, które zostały umieszczone na dołączonym CD-ROM-ie.


HoTMetaL

Edytor znany pod taką nazwą dostępny jest w sieci w dwóch wersjach. Pierwsza to komercyjny HoTMetaL Pro 2.0 (195 USD), który umożliwia m.in. tworzenie stron w standardzie HTML 3.0 (wraz z rozszerzeniami Netscape’a), a także odczyt plików tekstowych w formatach: Word, WordPerfect oraz AmiPro i automatyczną konwersję na dokument HTML. Swobodnie rozpowszechniana wersja HoTMetaL Free 2.0 jest trochę uboższa, lecz podobnie jak „Pro" obsługuje ostatnio wprowadzone do HTML 3.0 nowości, wykorzystuje technikę WYSIWYG do prezentowania tabel oraz ma dość bogato rozbudowany interfejs. Edytor ten można uruchamiać zarówno w środowisku Unix/X-Windows, jak i Microsoft Windows.
Program pewnie prowadzi użytkownika podczas pracy i uniemożliwia wprowadzanie błędnej składni. HoTMetaL przedstawia w oknie edycyjnym tekst wraz ogranicznikami komend. Te ostatnie są reprezentowane przez specjalne graficzne symbole, przez co łatwe do odróznienia w zwykłym tekście. Podczas wprowadzania nowego elementu (na przykład kotwicy) otwierają się odpowiednie menu i prezentowane są wszystkie atrybuty danego elementu. Dość pomocną właściwością tego edytora jest fakt, że teksty wyświetlane są w takiej postaci, w jakiej będą prezentowane w przeglądarce. Do każdego elementu przydzielona jest określona czcionka i wielkość. W ten sposób nagłówki będą wyświetlane przy użyciu czcionki dużej, a odwołania będą przybierały kolor niebieski. Duży plus stanowi również fakt, że znaki narodowe mogą być wpisywane bezpośrednio z klawiatury, a na ekranie będą wypisywane automatycznie przypisane do nich kody HTML. HoTMetaL, który pojawił się dopiero w 1994 roku, był jednym z pierwszych, spełniających normy standardu SGML.

HoTMetaL 2.0 w wersji „Free" dla MS-Windows


HTMLed

W przeciwieństwie do poprzedniego narzędzia, będącego właściwie przeglądarką, HTMLed wspomaga wyłącznie wstawianie elementów HTML do dokumentu. Edytor ten szczególnie nadaje się do przetwarzania gotowych już tekstów. Aby zmienić charakter lub właściwość danego fragmentu tekstu, wystarczy zaznaczyć go w normalny sposób i za pomocą odpowiedniego przycisku z listy wybrać odpowiedni element. Z przodu i z tyłu zaznaczonego fragmentu edytor wstawia odpowiednie ograniczniki.
Wadą tego produktu jest to, że nie został on wyposażony nawet w najprostrzy moduł korekty składni. Błędy w komendach wpisywane przez użytkownika są zatem dopuszczalne. Zaletą natomiast jest dostępność okna ze wszystkimi znakami specjalnymi. W ten prosty sposób mogą być wprowadzane dowolne symbole.

Edytor HTMLed umożliwia korzystanie z wielu graficznych menu narzędzi, zawierających najczęściej używane polecenia.


Kenn Nesbitt’s WebEdit

Bardzo wygodnym edytorem jest również WebEdit. W wersji shareware obsługuje on pełny standard HTML 2.0 oraz najnowsze komendy HTML 3.0. Podczas wprowadzania danego elementu otwierane jest menu, pozwalające na wprowadzenie dodatkowych, charakteryzujących go atrybutów. W specjalnym oknie każdy dokument można przeglądać w jego rzeczywistej postaci przy użyciu opcji View | Display Preview.
Bardzo ciekawą funkcją jest możliwość wygenerowania kompletnej, szablonowej strony. Na koniec wystarczy zastąpić odpowiednie miejsca w tekście swoją, własną treścią.

Edytor WebEdit 1.4b w oknie Windows 95


MS-Internet-Assistant

Użytkowników przyzwyczajonych do pracy z edytorem Microsoft Word powinien zainteres ować ciekawy dodatek, który umożliwia tworzenie i przeglądanie dokumentów HTML. Niestety, współpracuje on wyłącznie Wordem w wersji angielskiej, niemieckiej i francuskiej (i to tylko 6.0!). Instaluje on dwa szablony oraz nową dynamiczną bibliotekę DLL. Ta ostatnia zawiera funkcje, umożliwiające dostęp do sterowników sieciowych, szablonów dokumentu, filtrów, a także makr.
Szablon dokumentu webview.dot zawiera wszystkie funkcje oraz makra, pozwalające na czytanie dokumentów WWW bezpośrednio w oknie Worda. Oznacza to, że sam edytor może służyć jako przeglądarka. W górnej części ekranu od razu zauważa się dodatkową listwę z przyciskami oraz kilka nowych opcji w menu. Za pomocą webview.dot nie można jednak pisać dokumentów. Do tego celu potrzebny jest drugi szablon o nazwie html.dot.

Oferuje on wszystkie funkcje standardu HTML 2.0 w sposób zgodny z zatwierdzonym. Można zatem w normalny sposób edytować dokument, korzystając wyłącznie z obiektów szablonu html.dot. Ograniczenie to ma jednak pewną zaletę, ponieważ nie ma wtedy możliwości wprowadzenia błędów (na przykład niedozwolonej etykiety).

W menu pomocy html.dot dostarcza prawdziwej kolekcji opcji. Dzięki nim praca z MS-Internet-Assistant przy tworzeniu dokumentów możliwa jest bez bardzo wyrafinowanych umiejętności. Do najczęściej używanych elementów dołączono szereg, dobrze dobranych przykładów.

Podsumowanie

Można się długo sprzeczać na temat, który sposób tworzenia dokumentów HTML jest najlepszy. Jedni zapaleńcy, pracujący w systemie UNIX nie odstąpią na krok od swego ulubionego edytora vi, pisząc wszystkie dokumenty „z palca", inni zachwalają interaktywne edytory HTML i tworzą strony WWW również za pomoca myszki, jeszcze inni używają ulubionych edytorów (nawet Notatnika z Windows). Każdy więc musi zdecydować sam, który ze sposobów najbardziej mu odpowiada.
Pomocnym jednak może się okazać praktycznie każdy program. Edytory HTML pomagają w przydzielaniu elementom ich atrybutów, konwertery zaś zwalniają z obowiązku poznania języka HTML. Najprostsze zaś edytory tekstowe nadają się doskonale do szybkich przeróbek. Te pierwsze jednak, do pełnego wykorzystania wszystkich opcji, zawsze wymagają przynajmniej pobieżnej znajomości języka. Pewnym złotym środkiem może być MS-Internet-Assistant. Tutaj, z niewielkimi wyjątkami, można prawie nic nie wiedzieć o samym języku HTML.