IT-Universitetet i København
 
  Tilbage Kursusoversigt
Kursusbeskrivelse
Kursusnavn (dansk):Avanceret digital teksthåndtering (XML til håndtering af indhold) (kl. 16.00-21.30) 
Kursusnavn (engelsk):Avanced Digital Text Modelling (XML) (16:00-21:30) 
Semester:Forår 2003 
Udbydes under:cand. it, softwareudvikling (swu) 
Omfang i ECTS:7,50 
Kursussprog:Dansk 
Kursushjemmeside:https://learnit.itu.dk 
Min. antal deltagere:
Forventet antal deltagere:30 
Maks. antal deltagere:40 
Formelle forudsætninger:

Kurset henvender sig til studerende med interesse for digitale teksters indhold og struktur, f.eks. informationsmedarbejdere, net-journalister
og bibliotekarer og andre, der interesserer sig for håndtering af digital information.



  • Den studerende skal være fortrolig med at anvende en browser og hente
    information på Internettet



  • Den studerende skal være fortrolig med grundlæggende HTML og
    selv kunne skrive HTML-tags i en teksteditor. Det er en fordel, hvis den
    studerende har forstået de basale principper for opmærkningssprog
    (Markup Language)



  • Det er en fordel men ikke et krav, at den studerende har grundlæggende
    programmeringserfaringer på niveau med kurserne \'Grundlæggende
    programmering\' eller \'Databasestøttet webpublicering\'



  • Det er en fordel men ikke et krav, at den studerende kender til tekstgenrer,
    kommunikation og formidling\"


Studerende, der ikke kan programmere eller som ikke har forstået
basale principper for opmærkningssprog, må forvente at bruge
mere tid på at gennemføre de praktiske øvelser. 
Læringsmål:

Kurset skal gøre de studerende i stand til at anvende teknologier
med henblik på konstruktion af avancerede tekstformer til digitale
medier. Kurset giver de studerende indblik i teknologiernes anvendelsesmuligheder
i relation til forskellige teksttyper, samt viden om anvendelsen af sprogteknologi
i applikationer og produkter, som f.eks. opslagsværker,
termbaser, søgemaskiner og dialogsystemer mellem menneske og maskine.

Efter gennemførelse af kurset skal den studerende kunne:



  • forklare sammenhængen mellem SGML, HTML og XML



  • udarbejde og anvende en DTD til validering af XML



  • analysere, modificere og validere eksisterende XML-opmærket data
    og redegøre for sammenhængen mellem valideret XML og velformet
    XML



  • udarbejde valideret og velformet XML



  • udarbejde XSL til transformering fra XML til HTML

  • anvende XPath-udtryk og -funktioner
  • have kendskab til XLinks og XPointers


  • udpege eksempler på relevant anvendelse af opmærkningssprog



  • analysere og modellere tekst på baggrund af teksttype, målgruppe
    og anvendelse



Den studerende vil desuden opnå grundlæggende kendskab til andre XML-baserede teknologier og standarder som f.eks. XTM (Topic Maps). 
Fagligt indhold:

SGML og XML er standardiserede opmærkningssprog, som anvendes til avanceret teksthåndtering. Opmærkningen med SGML og XML kan rumme sofistikeret information om teksten og give teksten andre og mere \'intelligente\' egenskaber, end f.eks. HTML-præsentationstags skaber grundlag for. For at tekster kan anvendes i professionelle applikationer som f.eks. avancerede søgemaskiner og dialogsystemer mellem menneske og maskine, er det nødvendigt at eksplicitere og opmærke relevant sproglig viden om teksten. En sådan viden opmærkes i teksten, f.eks. med XML-tags. Kurset giver teoretisk og praktisk indblik i modellering af sådanne \'intelligente\' tekster.



  • De studerende skal gennem praktiske øvelser analysere og modificere data opmærket i XML, udarbejde valideret og velformet XML og desuden tilføje oplysninger om layout til XML-filer ved tranformation til HTML med brug af XSL



  • De studerende vil gennem undervisning og litteratur stifte bekendtskab
    med grundbegreberne i SGML, XML, HTML og XSL, XPath, XLinks, XPointers. Desuden vil beslægtede
    teknologier blive gennemgået. Herunder XTM (Topic Maps), der anvendes
    til at beskrive typen af viden repræsenteret i informationsressourcer
    og kombinerer ideer fra traditionel indeksering af bøger med ideer
    fra videnrepræsentationsteorier.



  • Strukturering og opmærkning af tekster vil tage udgangspunkt i teksternes
    indhold og funktion og i den forbindelse tages højde for f.eks.
    teksttype, omfang, genrer, målgruppe og medium. Der undervises og
    læses litteratur i begrænset omfang indenfor dette område



  • SGML og XML anvendes bl.a. til at strukturere og repræsentere information
    og til håndtering af natursprog, således at noget af den sproglig
    viden, som ligger implicit i tekster, ekspliciteres for at kunne anvendes i
    applikationer såsom søgemaskiner og dialogsystemer mellem systemagenter og mennesker. De studerende vil stifte bekendtskab med forskellige
    anvendelser af sprogteknologi, f.eks. dialogsystemer, opslagsværker
    og leksikografiske ressourcer baseret på SGML eller XML.

 
Læringsaktiviteter:


  • forelæsning 2-3 timer om ugen
  • øvelser 3 timer om ugen
  • 2 obligatoriske gruppeopgaver
  • præsentation af forskellige sprogteknologiske applikationer baseret på SGML eller XML - evt. med besøg af professionelle udviklere og brugere
 
Eksamensform og -beskrivelse:X. experimental examination form (7-scale; external exam), 13-skala, Ekstern censur


  • godkendelse af de 2 obligatoriske gruppeopgaver
  • skriftlig eksamen af 4 timers varighed. Alle skriftlige hjælpemidler er tilladt.
    13 skala - ekstern censur


Det er en forudsætning for at gå til eksamen, at begge de obligatoriske opgaver er godkendt af underviseren. Afleveringsfrist for de to gruppeopgaver fremgår af kursets semesterplan, der udleveres på kurset.  
Litteratur udover forskningsartikler:

Elliotte Rusty Harold & W. Scott Means. XML in a Nutshell - A desktop Quick Reference, second edition. O'Reilly. ISBN 0-596-00292-0.


Artikler der vil kunne findes på Internettet. Litteraturliste med disse vil fremgå af kursets semesterplan, der udleveres på kurset.