Vak: Praktijkopdracht thema 11 credits: 6
- Vakcode
- BFVH4THM11
- Naam
- Praktijkopdracht thema 11
- Studiejaar
- 2019-2020
- ECTS credits
- 6
- Taal
- Nederlands
- Coördinator
- T.A. Wassenaar
- Werkvormen
-
- Practicum / Training
- Toetsen
-
- Praktijkopdracht - Overige toetsing
Leeruitkomsten
- Samenstellen relevante datasets, opschonen en sorteren ervan
- Kunnen kiezen tussen verschillende veel gebruikte dataminingtechnologieen
- Opzetten trainings- en testomgevingen
- Analyse van grote datasets
- Wetenschappelijke poster maken
- Zelfstandig uitvoeren onderzoek
Inhoud
Tijdens dit thema wordt voor het eerst kennis gemaakt met dataminingtoepassingen en -analyses. Veel biologische datasets zijn of te groot, of bevatten te veel ruis (of beide), om in een oogopslag de biologische vraag erachter te kunnen
oplossen. Bijvoorbeeld "hoe veel multi-drug transporters vindt ik in dit metagenomics sample uit het ziekenhuis" (belangrijk voor antibiotica-resistentie). Door gebruik te maken van machine learning technieken kan in een grote, complexe dataset gezocht worden naar een grootste gemene deler, een "idee" van een eiwit ipv een specifiek eiwit uit een specifiek organisme (dat zou een klus voor Blast zijn). Tijdens dit practicum wordt een openliggende onderzoeksvraag gesteld en een dataset erbij gezocht (of andersom), uit de onderzoeksportfolio van ALIFE of een ander onderzoeksinstituut. Er wordt onderzocht of, en zo ja welke, machine learning technieken de gestelde vraag kunnen beantwoorden. Deze worden vervolgens geïmplementeerd en geëvalueerd op test datasets en uiteindelijk op de complete dataset indien mogelijk. Dit practicum is deel 1 van een 2 kwartaals-specialisatie; in deel 2 worden de gekozen technieken geparalleliseerd om de hele dataset te kunnen verwerken en de onderszoeksvraag te beantwoorden.
Literatuur:
Data Mining
Practical Machine Learning Tools and Techniques with Java Implementations
IAN H. Witten & Eibe Frank, ISBN: 1558605525
Theorie uit de module Advanced Datamining Blackboard course thema 11
oplossen. Bijvoorbeeld "hoe veel multi-drug transporters vindt ik in dit metagenomics sample uit het ziekenhuis" (belangrijk voor antibiotica-resistentie). Door gebruik te maken van machine learning technieken kan in een grote, complexe dataset gezocht worden naar een grootste gemene deler, een "idee" van een eiwit ipv een specifiek eiwit uit een specifiek organisme (dat zou een klus voor Blast zijn). Tijdens dit practicum wordt een openliggende onderzoeksvraag gesteld en een dataset erbij gezocht (of andersom), uit de onderzoeksportfolio van ALIFE of een ander onderzoeksinstituut. Er wordt onderzocht of, en zo ja welke, machine learning technieken de gestelde vraag kunnen beantwoorden. Deze worden vervolgens geïmplementeerd en geëvalueerd op test datasets en uiteindelijk op de complete dataset indien mogelijk. Dit practicum is deel 1 van een 2 kwartaals-specialisatie; in deel 2 worden de gekozen technieken geparalleliseerd om de hele dataset te kunnen verwerken en de onderszoeksvraag te beantwoorden.
Literatuur:
Data Mining
Practical Machine Learning Tools and Techniques with Java Implementations
IAN H. Witten & Eibe Frank, ISBN: 1558605525
Theorie uit de module Advanced Datamining Blackboard course thema 11
Opgenomen in opleiding(en)
School(s)
- Instituut voor Life Science & Technology