Metody eksploracji danych 1300-Inf11MED-SD
Laboratorium (LAB)
Semestr zimowy 2019/20
Informacje o zajęciach (wspólne dla wszystkich grup)
Liczba godzin: | 15 | ||
Limit miejsc: | (brak limitu) | ||
Zaliczenie: | Zaliczenie na ocenę | ||
Rygory zaliczenia zajęć: | zaliczenie na ocenę |
||
Literatura uzupelniająca: | 1. Rojek I.: Zastosowania metod sztucznej inteligencji w projektowaniu i nadzorowaniu procesów technologicznych obróbki skrawaniem, Bydgoszcz, UKW, 2017 2. Larose D., Odkrywanie wiedzy z danych. Wprowadzenie do eksploracji danych, PWN 2006 3. Krawiec K., Stefanowski J., Uczenie maszynowe i sieci neuronowe, Poznań, Wydaw. Politechniki Poznańskiej, 2004. 4. Cichosz P., Systemy uczące się, Warszawa, WNT, 2000 5. https://searchsqlserver.techtarget.com/definition/data-mining |
||
Metody dydaktyczne: | ćwiczenia laboratoryjne |
||
Metody dydaktyczne - inne: | prezentacja przykładu, objaśnienie, praca samodzielna z komputerem |
||
Literatura: |
1. Morzy T., Eksploracja danych: metody i algorytmy, PWN, 2018 2. Osowski S., Metody i narzędzia eksploracji danych , BTC, 2013 3. Larose D., Metody i modele eksploracji danych, PWN 2008 |
||
Efekty uczenia się: |
U1, U2, U3 |
||
Metody i kryteria oceniania: |
W zakresie laboratoriów efekty kształcenia przedstawione wyżej weryfikowane są na podstawie oceny bieżącego postępu realizacji zadań problemowych. Ocena końcowa w zakresie laboratoriów polega na weryfikowaniu założonych efektów kształcenia poprzez ocenę wiedzy i umiejętności wykazanych podczas wykonywania zadań problemowych oraz sprawdzianu zaliczeniowego. Sprawdzian składa się z 5 zadań problemowych, za które można uzyskać łącznie 20pkt. Zaliczenie na ocenę 3.0 wymaga uzyskania 50% maksymalnej liczby punktów. |
||
Zakres tematów: |
Program laboratorium obejmuje następujące zagadnienia: Wstępne przygotowanie danych do procesów eksploracji danych: dyskretyzacja, normalizacja, zastępowanie wartości brakujących, wyznaczanie i eliminacja wartości odstających na przykładach środowisk Statsoft Statistica DataMiner, Weka. Wstępne przetwarzanie atrybutów. Ocena ważności atrybutów, metody ważenia atrybutów, test chi-kwadrat, ważenie atrybutów za pomocą entropii. Odkrywanie reguł asocjacyjnych i ich algorytmy. Algorytmy znajdowania zbiorów częstych i asocjacji. Wprowadzenie do problemów klasyfikacji, podział zbioru danych na zbiór uczący i testujący. Klasyfikatory regułowe, proste klasyfikatory drzewiaste, metody indukcji drzew decyzyjnych, miary oceny jakości podziału zbioru: indeks Giniego, entropia, Information Gain. Naiwny klasyfikator Bayesa. Metody oceny i testowania klasyfikatorów, wielokryterialna ocena nauczonych modeli. Miary w ocenie jakości modeli. Uczenie klasyfikatorów przy pomocy macierzy kosztów. Rodzina algorytmów SVM. Eksperymenty numeryczne z wybranymi metodami opartymi na podobieństwie oraz z metodami selekcji i generacji prototypów. Zapoznanie z różnymi popularnymi środowiskami służącymi do analizy danych. |
Grupy zajęciowe
Grupa | Termin(y) | Prowadzący |
Miejsca ![]() |
Akcje |
---|---|---|---|---|
1 |
co drugi poniedziałek (parzyste), 15:30 - 17:00,
sala 106 (PS) |
Izabela Rojek | 15/15 |
szczegóły![]() |
Wszystkie zajęcia odbywają się w budynku: Budynek przy ulicy M. Kopernika |
Właścicielem praw autorskich jest Uniwersytet Kazimierza Wielkiego w Bydgoszczy.