Adatbányászati
technikák
2013 tavasz
Eredmények: második zh, első
zh,
pótzhk,
pótpótzhk
(a
pótpótzhk megtekinthetők előzetes
egyeztetés után)
Előadás:
Előadók: Csima
Judit (csima at cs.bme.hu) és Pintér Márta
(marti at cs.bme.hu)
Előadás:
minden hétfő 8:30-10:00
QBF10, páratlan heteken
csütörtökön 10.30- 12.00 is, QBF11
Labor
Laborvezetők: Csima Judit és
Bagyinszki Bence (bagyibence at gmail.com)
Labor: csütörtökön 8:30-10:00, R4J,
01-es kurzus páratlan heteken, 02-es kurzus páros
heteken
Tankönyv
Pang-Ning Tan, Michael Steinbach,
Vipin Kumar: Introduction to Data Mining (könyv
és slide-ok)
http://www-users.cs.umn.edu/~kumar/dmbook/index.php
Bodon Ferenc:
Adatbányászati algoritmusok, BME
Számítástudományi és
Információelmélet tanszék.
Budapest, 2007, Online
jegyzet
Előadásfóliák :
Órák
helye, ideje, követelmények
A Kumar-könyv eredeti fóliáinál a
ppt és pdf verzió a könyv weboldalán
található teljes változatot tartalmazza.
A ZH anyaga az, ami az előadáson elhangzott. Ezt
leginkább az alábbi órai fóliák
(odp) adják vissza (bár az órán
időnként sokkal több magyarázat és
példa hangzott el, mint ami ezeken a
fóliákon van és volt néhány
rövid új rész is, ami a fóliákon
egyáltalán nem szerepel.)
Órai
fóliák
Bevezetés
Attribútum
és adattípusok, preprocesszálás,
hasonlósági mértékek
Data exploration
(statisztikai jellemzők, ábrázolás, OLAP)
Egy érdekes előadás
arról, hogy hogyan lehet adatokat ábrázolni
Asszociációs
szabályok
Osztályozás
első rész
Osztályozás
második rész
Klaszterezés
első rész
Klaszterezés
második rész
Gyakorló feladatok a 2. zhra itt
és itt,
a megoldott feladatok ezekből kerültek ki, de fontosak az
órán alhangzott megjegyzések!
Eredeti fóliák:
Bevezetés: ppt
és pdf
Attribútum és adattípusok,
preprocesszálás, hasonlósági
mértékek: ppt
és pdf
Data exploration (statisztikai jellemzők,
ábrázolás, OLAP): ppt
és pdf
Asszociációs szabályok alapfogalmak,
alapvető algoritmusok: ppt
és pdf
Laborhoz anyagok:
Első rész (R):
rstudio letölthető
innen
A labor
csoportbeosztása itt
megtekinthető
Az R története,
főbb jellemzői
Osztályok,
alapfüggvények, kiválasztás
Az első labor feladatai a páratlan és a páros heti csoportnak
Help, szövegszerkesztő,
beolvasás
Függvények
A második labor feladatai a páratlan és páros heti csoportnak
A második laborhoz letöltendő adatfile
Grafika
Demo R file a
grafikához
A grafikához javasolt feladatok a páratlan és páros heti csoportnak
Beadandó házi R-ből: feladatkitűzés és a
két adatfile: specdata.zip
és korhaz.zip
Második
rész (Weka, Java):
Weka 3.6 letölthető innen
Eclipse IDE for Java developers letölthető
innen
Bevezető JAVA előadás fóliái
Első gyakorlat anyagai: feladatok
és megoldások
Beadandó házi feladatkitűzése
Követelmények
Két ZH az előadás
idejében (március 18. és május 6.),
mindkettő 35 pontot ér, mindkettőn legalább 14
pontot el kell érni.
Legalább az egyik ZHnak elsőre
sikerülnie kell, a másik pótolható a
pótZHval május 13-án. Utolsó
pótlási alkalom a pótlási
héten.
A laboron két beadandó
házi van, mindkettő 15 pontot ér. A házik
ellenőrzése az utolsó laboron történik.
A laboron az első hat alkalomból
legalább ötön részt kell venni.
Összesen 100 pont szerezhető, 40
ponttól elégséges, 55-től közepes,
70-tól jó, 85-től jeles a
félévközi jegy.