| 
  • If you are citizen of an European Union member nation, you may not use this service unless you are at least 16 years old.

  • You already know Dokkio is an AI-powered assistant to organize & manage your digital files & messages. Very soon, Dokkio will support Outlook as well as One Drive. Check it out today!

View
 

SGML

Page history last edited by PBworks 16 years, 4 months ago

 

SGML

 

Standard Generalized Markup Language

 

SGML vart godkjent som ISO-standard i 1986, fordi ein såg behov for ei standardisering av kodesystem.

 

SGML er strengt tala ikkje eit kodesystem, men eit sett av reglar for utforming av kodesystem, ein metagrammatikk for kodesystem.

 

Eit SGMLdokument består av SGML Declaration, Document Type Definition (DTD) og Document Instance.

 

SGML Declaration

 

Document Type Definition (DTD)

-         Er ei dokumentmal

-         definerar ein klasse/type dokument

-         inneheld reglar om kva element eit dokument kan innehalda og korleis dei kan kombinerast

-         fungerar som kvalitetssikring, teksten må vera gyldig i følgje DTDen

 

Document Instance

”Sjølve” dokumentet, der teksten er.

 

Mekanismar i SGML

Det er ein innleiande dokumenttype-deklarasjon (DOCTYPE) som seier kva type tekst det er og viser til DTDen.

Merkinga deler teksten i element som er merka med startmerke og sluttmerke (tags). Desse merka vert åtskilte frå teksten med reserverte teikn, markørar (ofte < > ).

Eit merke (tag) består av opningsmarkør (open delimiter, < …>), generisk identifikator (ordnar i elementtype), eventuelt attributt og attributtverdi og sluttmarkør (close delimiter </ … > )

Det går an å ha tomme element, som markerar punkt i teksten. Då har ein berre eit merke (ein tag). Døme: <pb> for sideskifte.

Ein nyttar gjerne entitetar for å erstatta spesielle teikn som ikkje er ein del av dei 128 fyrste teikna i 8-bitsystemet (256 teikn til saman, fyrste halvpart felles). Døme: å = å.

 

Fordelar med SGML

SGML er eit forsøk på ein standard.

Teiknsettet er avgrensa og kontrollert, noko som gjera at dokument kan overførast mellom to program som nytta SGML utan tap og feil.

Element vert markert i følgje ein veldefinert formalisme (det er faste reglar for korleis ein skal markera element – med start- og sluttmerke, som skil seg frå teksten med marørar.)

SGML merkar den underliggande strukturen (analytisk) uavhengig av det visuelle. Det visuelle kjem i presentasjonen ved hjelp av style sheets.

Det støttar ein enkel datastruktur, som gjer det mogleg å laga dokumenttre (liknande trea, med rota øverst, ein nyttar i språkstudiar). Desse trea gjer det lett å finna fram i teksten og dermed undersøkja den.

SGML gir moglegheit for god kontroll av kodinga. Eit dokument må vera gyldig i følgje DTDen for å bli godkjent.

SGML er og fleksibelt, sidan det ikkje er eit eige kodesystem, men ein syntaks for utforming av kodesystem. Ein kan laga eller endra DTDen sjølv.

 

Ulemper ved SGML

SGML er eit komplisert system, med mykje spesialiserte reglar, merke osv.

Dokument koda i SGML kan sjeldan parsast (lesast av programvare) utan tilgang til DTDen. Dette er fordi SGML tillet tomme merke og til og med utelating av merke. Dette gjer det vanskeleg for ein parser å lesa dokumentet utan å ha DTDen for å samanlikna med. Døme: sluttmerket </ …. > kan vera tomt </>. Då er det vanskeleg for praseren å vita kva element det avsluttar.

 

Viktig å hugsa med SGML

SGML tillett ikkje overlapping. Dokumentet må altså vera hierarkisk ordna.

Alle dokument må ha ein DTD, og alle dokumentinstansar må vera gyldige i følgje denne.

 

Kjelde: C. Huitfeldt, forelesingar 28/8 og 29/8

            C. Huitfeldt, Tekster og tekstkoding – kap. 1  

Comments (0)

You don't have permission to comment on this page.