Kursusnavn (dansk): | Programmering af søgemaskiner, (aflyst F2002 kursus) |
Kursusnavn (engelsk): | Programming search engines |
Semester: | Efterår 2001 |
Udbydes under: | cand. it, softwareudvikling (swu) |
Omfang i ECTS: | 7,50 |
Kursussprog: | Dansk |
Kursushjemmeside: | https://learnit.itu.dk |
Min. antal deltagere: | 10 |
Forventet antal deltagere: | 0 |
Maks. antal deltagere: | 50 |
Formelle forudsætninger: | Grundlæggende programmering på IT-C eller tilsvarende erfaring med programmering i Java. |
Læringsmål: | Målet med kurset er at give deltagerne praktisk erfaring med implementation af de grundlæggende datastrukturer, der er en del af internet-søgemaskiner. Kurset vil give deltageren fortrolighed med:
- den underliggende maskinrepræsentation
af objekter, referencer, arrays og listestrukturer i Java.
- algoritmisk analyse af de basale komponenter af indekseringssoftwares tid- og pladsforbrug.
- de grundlæggende algoritmiske teknikker til behandling og håndtering af
store datamængder.
|
Fagligt indhold: | Kurset introducerer deltagerne for de grundlæggende datastrukturteknikker til effektiv indeksering og behandling af store datamængder. Kurset er herefter tilrettelagt, så deltagerne som del af et projektforløb selv implementerer en mindre internetsøgemaskine med anvendelse af disse teknikker. Dette projekt videreføres så individuelt, hvor der kan ske inddragelse af mere avancerede problemstillinger såsom fler-dimensionelle søgeforespørglser, parsing, distribueret dataindsamling etc., afhængig af den enkelte deltagers faglige forudsætninger og interesser. Blandt de teknikker og emner, der vil være en del af det fælles program er:
- Analyse af tid-og pladsforbruget for referencer, objekter, lister,
arrays m.v. i Java.
- Effektive teknikker til opbygning af ordbøger, herunder hashtabeller
og sorterede lister.
- Præfikssøgning, binær søgning og sortering.
- Inverterede lister og andre pladskompressionsteknikker.
Kurset har tidligere været afholdt som et intensivt 4-ugers projektforløb. Dette projektforløb gennemføres igen i december 2001, hvor mere information om det faglige indhold kan ses på følgende hjemmeside: http://www.it-c.dk/research/algorithms/Kurser/SoegeProjekt/2001DECEMBER/
|
Læringsaktiviteter: | Projekt I projektet indgår fem seminarer på onsdage kl. 16.00-21.30. Seminarerne er fælles for alle studerende og gennemføres: 6. februar, 13. februar, 6. marts, 3. april og 25. april 2002. Ud over disse seminarer, kan de studerende i de enkelte projektgrupper mødes efter behov. Mellem seminarer og projektgruppemøder foregår vejledning og kommunikation elektronisk.
|
Eksamensform og -beskrivelse: | X. experimental examination form (7-scale; external exam), 13-skala, Intern censur Projektet afsluttes med en rapport (max 15 sider), som danner udgangspunkt for den mundtlige eksamen. Alle skriftlige hjælpemidler er tilladte ved eksamen. Der vil ikke blive givet speciel forberedelsestid før eksamen. Ved karaktergivningen medvirker en ekstern censor. Der gives karakter efter 13-skalaen.
Rapporten skal afleveres senest den 3. maj. 2002 kl. 12.00 i Studieadministrationen.
|
Litteratur udover forskningsartikler: | Udleverede noter |
| |