IT-Universitetet i København
 
  Tilbage Kursusoversigt
Kursusbeskrivelse
Kursusnavn (dansk):Avanceret Digital Teksthåndtering (XML til håndtering indhold) (kl. 16.00-21.30) 
Kursusnavn (engelsk):Advanced Digital Text modelling 
Semester:Efterår 2002 
Udbydes under:cand. it, softwareudvikling (swu) 
Omfang i ECTS:7,50 
Kursussprog:Dansk 
Kursushjemmeside:https://learnit.itu.dk 
Min. antal deltagere:
Forventet antal deltagere:20 
Maks. antal deltagere:40 
Formelle forudsætninger: 

Kurset henvender sig til studerende med interesse for digitale teksters indhold og struktur, f.eks. informationsmedarbejdere, net-journalister
og bibliotekarer og andre, der interesserer sig for håndtering af digital information.



  • Den studerende skal være fortrolig med at anvende en browser og hente
    information på Internettet



  • Den studerende skal være fortrolig med grundlæggende HTML og
    selv kunne skrive HTML-tags i en teksteditor. Det er en fordel, hvis den
    studerende har forstået de basale principper for opmærkningssprog
    (Markup Language)



  • Det er en fordel men ikke et krav, at den studerende har grundlæggende
    programmeringserfaringer på niveau med kurserne 'Grundlæggende
    programmering' eller 'Databasestøttet webpublicering'



  • Det er en fordel men ikke et krav, at den studerende kender til tekstgenrer,
    kommunikation og formidling"


Studerende, der ikke kan programmere eller som ikke har forstået
basale principper for opmærkningssprog, må forvente at bruge
mere tid på at gennemføre de praktiske øvelser.

 
Læringsmål:

Kurset skal gøre de studerende i stand til at anvende teknologier
med henblik på konstruktion af avancerede tekstformer til digitale
medier. Kurset giver de studerende indblik i teknologiernes anvendelsesmuligheder
i relation til forskellige teksttyper, samt viden om anvendelsen af sprogteknologi
i applikationer og produkter, som f.eks. opslagsværker,
termbaser, søgemaskiner og dialogsystemer mellem menneske og maskine.

Efter gennemførelse af kurset skal den studerende kunne:



  • forklare sammenhængen mellem SGML, HTML og XML



  • udarbejde og anvende en DTD til validering af XML



  • analysere, modificere og validere eksisterende XML-opmærket data
    og redegøre for sammenhængen mellem valideret XML og velformet
    XML



  • udarbejde valideret og velformet XML



  • udarbejde XSL til transformering fra XML til HTML



  • udpege eksempler på relevant anvendelse af opmærkningssprog



  • analysere og modellere tekst på baggrund af teksttype, målgruppe
    og anvendelse



Den studerende vil desuden opnå grundlæggende kendskab til
andre teknologier og standarder som f.eks. XTM (topic maps).

 
Fagligt indhold:

SGML og XML er standardiserede opmærkningssprog, som anvendes til avanceret teksthåndtering. Opmærkningen med SGML og XML kan rumme sofistikeret information om teksten og give teksten andre og mere 'intelligente' egenskaber, end f.eks. HTML-præsentationstags skaber grundlag for. For at tekster kan anvendes i professionelle applikationer som f.eks. avancerede søgemaskiner og dialogsystemer mellem menneske og maskine, er det nødvendigt at eksplicitere og opmærke relevant sproglig viden om teksten. En sådan viden opmærkes i teksten, f.eks. med XML-tags. Kurset giver teoretisk og praktisk indblik i modellering af sådanne 'intelligente' tekster.



  • De studerende skal gennem praktiske øvelser analysere og modificere data opmærket i XML, udarbejde valideret og velformet XML og desuden tilføje oplysninger om layout til XML-filer ved tranformation til HTML med brug af XSL



  • De studerende vil gennem undervisning og litteratur stifte bekendtskab
    med grundbegreberne i SGML, XML, HTML og XSL. Desuden vil beslægtede
    teknologier blive gennemgået. Herunder XTM (topic maps), der anvendes
    til at beskrive typen af viden repræsenteret i informationsressourcer
    og kombinerer ideer fra traditionel indeksering af bøger med ideer
    fra videnrepræsentationsteorier.



  • Strukturering og opmærkning af tekster vil tage udgangspunkt i teksternes
    indhold og funktion og i den forbindelse tages højde for f.eks.
    teksttype, omfang, genrer, målgruppe og medium. Der undervises og
    læses litteratur i begrænset omfang indenfor dette område



  • SGML og XML anvendes bl.a. til at strukturere og repræsentere information
    og til håndtering af natursprog, således at noget af den sproglig
    viden, som ligger implicit i tekster, ekspliciteres for at kunne anvendes i
    applikationer såsom søgemaskiner og dialogsystemer mellem
    systemagenter og mennesker. De studerende vil stifte bekendtskab med forskellige
    anvendelser af sprogteknologi, f.eks. dialogsystemer, opslagsværker
    og leksikografiske ressourcer baseret på SGML eller XML.



 
Læringsaktiviteter:

 


  • forelæsning 2-3 timer om ugen
  • øvelser 3 timer om ugen
  • 2 obligatoriske gruppeopgaver
  • præsentation af forskellige sprogteknologiske applikationer baseret på SGML eller XML - evt. med besøg af professionelle udviklere og brugere

 
Eksamensform og -beskrivelse:X. experimental examination form (7-scale; external exam), 13-skala, Intern censur

 


  • godkendelse af de 2 obligatoriske gruppeopgaver (bestået/ikke bestået)
  • skriftlig eksamen af 4 timers varighed. Alle skriftlige hjælpemidler er tilladt.
    13 skala - ekstern censur


Det er en forudsætning for at gå til eksamen, at begge de obligatoriske opgaver er bestået. Afleveringsfrist for første gruppeopgave fremgår af kursets semesterplan, der udleveres på kurset. Sidste gruppeopgave afleveres senest fredag d. 22. november 2002 kl. 12.00.

 
Litteratur udover forskningsartikler: 

Den væsentligste litteratur vil kunne findes på Internettet. Litteraturliste vil fremgå af kursets semesterplan, der udleveres på kurset.