IT-Universitetet i København
 
  Tilbage Kursusoversigt
Kursusbeskrivelse
Kursusnavn (dansk):Grundlæggende XML og XML-baserede teknologier til tekstmodellering (kl. 17.00-21.00) 
Kursusnavn (engelsk):Basic XML and Text Modelling Technologies (17:00-21:00) 
Semester:Efterår 2004 
Udbydes under:cand.it., design, kommunikation og medier (dkm) 
Omfang i ECTS:7,50 
Kursussprog:Dansk 
Kursushjemmeside:https://learnit.itu.dk 
Min. antal deltagere:
Forventet antal deltagere:10 
Maks. antal deltagere:40 
Formelle forudsætninger:Kurset henvender sig til studerende med interesse for digitale teksters indhold og struktur, f.eks. informationsmedarbejdere, net-journalister, bibliotekarer og andre, der interesserer sig for modellering af digital information.



  • Den studerende skal være fortrolig med at anvende en browser og hente information på Internettet
  • Den studerende skal være fortrolig med grundlæggende HTML og selv kunne skrive HTML-tags i en teksteditor. Det er en fordel, hvis den studerende har forstået de basale principper for opmærkningssprog (Markup Language)
  • Det er en fordel men ikke et krav, at den studerende kender til tekstgenrer, kommunikation og formidling på niveau med kurset ¿Tekstformidling på Internet¿
  • Det er en fordel men ikke et krav, at den studerende har grundlæggende programmeringserfaringer på niveau med kurserne \'Grundlæggende programmering\' eller \'Databasestøttet webpublicering\'

    Studerende, der ikke kan programmere eller som ikke har forstået basale principper for opmærkningssprog, må forvente at bruge mere tid på at gennemføre de praktiske øvelser. 

Læringsmål:Kurset skal gøre de studerende i stand til at anvende XML-baserede teknologier med henblik på opmærkning af tekster med indholdsbaserede metadata. Kurset giver de studerende indblik i teknologiernes anvendelsesmuligheder i relation til forskellige teksttyper, applikationer og produkter, som f.eks. opslagsværker, ordbaser, søgemaskiner, Semantisk Web.




Efter gennemførelse af kurset skal den studerende kunne:


  • forklare sammenhængen mellem SGML, HTML og XML
  • udarbejde og anvende en DTD eller et XML-skema til modellering af data, samt validering af XML
  • analysere, modificere og validere eksisterende XML-opmærkede data og redegøre for sammenhængen mellem valideret XML og velformet XML
  • udarbejde valideret og velformet XML
  • udarbejde XSL og XSL-FO til transformering fra XML til HTML eller andre formater
  • anvende XPath-udtryk og -funktioner
  • have kendskab til XLinks og XPointers
  • udpege eksempler på relevant anvendelse af opmærkningssprog
  • analysere og modellere tekst på baggrund af teksttype, målgruppe og anvendelse
  • kende til XML-baserede standarder til beskrivelse og modellering af tekstuelt indhold, såsom Dublin Core, Ressource Description Framework (RDF), Topic Maps (XTM), Ontology Web Language (OWL) 
Fagligt indhold:SGML og XML er standardiserede opmærkningssprog, som bl.a. anvendes til opmærking af tekstdata med indholdbaserede metadata. Opmærkningen med SGML og XML kan rumme sofistikeret information om teksten og give teksten andre og mere \'intelligente\' egenskaber, end f.eks. HTML-præsentationstags skaber grundlag for. For at tekster kan anvendes i professionelle applikationer som f.eks. avancerede søgemaskiner og dialogsystemer mellem menneske og maskine, er det nødvendigt at eksplicitere og opmærke relevant sproglig viden om teksten, f.eks. med XML-tags. Kurset giver teoretisk og praktisk indblik i modellering af sådanne \'intelligente\' tekster, samt af data som er nødvendige til automatisk at behandle tekster.

  • De studerende skal gennem praktiske øvelser analysere og modificere data opmærket i XML, udarbejde valideret og velformet XML og desuden tilføje oplysninger om layout til XML-filer ved tranformation til HTML eller andre formater ved at bruge XSL og XSL-FO
  • De studerende vil gennem undervisning og litteratur stifte bekendtskab med grundbegreberne i SGML, XML, HTML og XSL, XPath, XLinks, XPointers. Desuden vil XML-baserede standarder til modellering af tekster blive gennemgået, såsom Dublin Core, Ressource Description Framework (RDF), Topic Maps (XTM) og Ontology Web Language (OWL) der anvendes til at beskrive relevant viden om eller repræsenteret i informationsressourcer.
  • Strukturering og opmærkning af tekster vil tage udgangspunkt i teksternes indhold og funktion og i den forbindelse tages højde for f.eks. teksttype, omfang, genrer, målgruppe og medium. Der undervises og læses litteratur i begrænset omfang indenfor dette område



    SGML og XML anvendes bl.a. til at strukturere og repræsentere information og til håndtering af natursprog, således at noget af den sproglig viden, som ligger implicit i tekster, ekspliciteres for at kunne anvendes i applikationer såsom søgemaskiner og dialogsystemer mellem systemagenter og mennesker. De studerende vil stifte bekendtskab med forskellige anvendelser af sprogteknologi, f.eks. dialogsystemer, opslagsværker og leksikografiske ressourcer baseret på SGML eller XML. 

Læringsaktiviteter:


  • forelæsning 2-3 timer om ugen
  • øvelser 3 timer om ugen
  • 2 obligatoriske opgaver
  • præsentation af forskellige sprogteknologiske projekter eller applikationer baseret på SGML eller XML





OBS! Kurset finder IKKE sted på KU, humaniora. MEN I STEDET på ITU, Rued Langgaards Vej.



Forelæsning 17.00 - 19.00. Øvelser 19.00 - 21.00 

Eksamensform og -beskrivelse:X. experimental examination form (7-scale; external exam), 13-skala, Intern censur


  • godkendelse af 2 obligatoriske opgaver
  • skriftlig eksamen af 4 timers varighed. Alle skriftlige hjælpemidler er tilladt. 13 skala - intern censur  
Litteratur udover forskningsartikler:Elliotte Rusty Harold & W. Scott Means. XML in a Nutshell - A desktop Quick Reference, second edition. O\'Reilly. ISBN 0-596-00292-0.



  • Artikler der vil kunne findes på Internettet. Litteraturliste med disse vil fremgå af kursets semesterplan, der udleveres på kurset. 
  •