Strojové učení a Bioinformatika
Data:
Pro projekt byla použita medicínská data, konkrétněji mezi atributy patřily:
- základní údaje o pacientech (věk, pohlaví)
- rychlost metabolizace indikační látky (=MR)
- genotyp pacienta (varianty dvou alel ovlivňujících rychlost metabolizace
- dotazník charakterizující vedlejší příznaky po podání léčiva
- rychlost metabolizace indikační látky po podání léčiva
Cíle:
- Bylo žjištěno, že po podání sledovaného léčiva se rychlost metabolizace velmi často sníží:
- predikovat změnu MR vyvolanou léčbou
- zjistit, které atributy jsou pro tuto predikci stěžejní a které irelevantní
- Měření MR není triviální:
- predikovat MR (přirozené i modifikované vlivem léčby)
- zjistit, které atributy jsou pro tuto predikci stěžejní a které irelevantní
- zjistit další netriviální vztahy skryté v datech
Řešení:
Projekt byl rozdělen do tří celků:
- Předzpracování:
- převést data do formátu .arff
- převést genotyp na atributy
- různými způsoby diskretizovat MR
- Výběr vhodných agoritmů pro jednotlivé predikce:
- nalézt optimální algoritmus (podle přesnosti)
Novinky:
[11/07/2009]
Spuštěny webové stránky
[26/06/2009]
Výpočet statistické významnosti výsledků
[22/05/2009]
Výběr optimálního algoritmu
[20/04/2009]
Předzpracování dat
Související odkazy:
WekaStránky předmětu