IT-Universitetet i København
 
  Tilbage Kursusoversigt
Kursusbeskrivelse
Kursusnavn (dansk):Programmering af søgemaskiner, (aflyst F2002 kursus) 
Kursusnavn (engelsk):Programming search engines 
Semester:Efterår 2001 
Udbydes under:cand. it, softwareudvikling (swu) 
Omfang i ECTS:7,50 
Kursussprog:Dansk 
Kursushjemmeside:https://learnit.itu.dk 
Min. antal deltagere:10 
Forventet antal deltagere:
Maks. antal deltagere:50 
Formelle forudsætninger:Grundlæggende programmering på IT-C eller
tilsvarende erfaring med programmering i Java.
 
Læringsmål:Målet med kurset er at give deltagerne praktisk erfaring med implementation af de grundlæggende datastrukturer, der er en del af internet-søgemaskiner. Kurset vil give deltageren fortrolighed med:


  • den underliggende maskinrepræsentation
    af objekter, referencer, arrays og listestrukturer i Java.


  • algoritmisk analyse af de basale komponenter af indekseringssoftwares tid- og pladsforbrug.


  • de grundlæggende algoritmiske teknikker til behandling og håndtering af
    store datamængder.


 
Fagligt indhold:Kurset introducerer deltagerne for de grundlæggende
datastrukturteknikker til effektiv indeksering og behandling af store
datamængder. Kurset er herefter tilrettelagt, så deltagerne som del af
et projektforløb selv implementerer en mindre internetsøgemaskine med anvendelse af
disse teknikker. Dette projekt videreføres så individuelt, hvor der
kan ske inddragelse af mere avancerede problemstillinger såsom
fler-dimensionelle søgeforespørglser, parsing, distribueret
dataindsamling etc., afhængig af den enkelte deltagers faglige
forudsætninger og interesser. Blandt de teknikker og emner, der vil
være en del af det fælles program er:


  • Analyse af tid-og pladsforbruget for referencer, objekter, lister,
    arrays m.v. i Java.


  • Effektive teknikker til opbygning af ordbøger, herunder hashtabeller
    og sorterede lister.


  • Præfikssøgning, binær søgning og sortering.


  • Inverterede lister og andre pladskompressionsteknikker.




Kurset har tidligere været afholdt som et intensivt 4-ugers
projektforløb. Dette projektforløb gennemføres igen i december 2001,
hvor mere information om det faglige indhold kan ses på følgende
hjemmeside:
http://www.it-c.dk/research/algorithms/Kurser/SoegeProjekt/2001DECEMBER/

 
Læringsaktiviteter:

Projekt


I projektet indgår fem seminarer på onsdage kl. 16.00-21.30. Seminarerne er fælles for alle studerende og gennemføres: 6. februar, 13. februar, 6. marts, 3. april og 25. april 2002. Ud over disse seminarer, kan de studerende i de enkelte projektgrupper mødes efter behov. Mellem seminarer og projektgruppemøder foregår vejledning og kommunikation elektronisk.

 
Eksamensform og -beskrivelse:X. experimental examination form (7-scale; external exam), 13-skala, Intern censur

Projektet afsluttes med en rapport (max 15 sider), som danner udgangspunkt for den mundtlige eksamen. Alle skriftlige hjælpemidler er tilladte ved eksamen. Der vil ikke blive givet speciel forberedelsestid før eksamen. Ved karaktergivningen medvirker en ekstern censor. Der gives karakter efter 13-skalaen.



Rapporten skal afleveres senest den 3. maj. 2002 kl. 12.00 i Studieadministrationen.
 

Litteratur udover forskningsartikler:Udleverede noter