Adatbányászati technikák
2013 tavasz



 

Eredmények: második zhelső zh,  pótzhk,    pótpótzhk
(a pótpótzhk megtekinthetők előzetes egyeztetés után)
                  
Előadás:


          Előadók: Csima Judit (csima at cs.bme.hu)  és Pintér Márta (marti at cs.bme.hu)
          Előadás
: minden hétfő 8:30-10:00  QBF10, páratlan heteken csütörtökön 10.30- 12.00 is, QBF11
         

Labor


Laborvezetők: Csima Judit és Bagyinszki Bence (bagyibence at gmail.com)
Labor:  csütörtökön 8:30-10:00, R4J, 01-es kurzus páratlan heteken, 02-es kurzus páros heteken


Tankönyv

        Pang-Ning Tan, Michael Steinbach, Vipin Kumar:  Introduction to Data Mining (könyv és slide-ok) http://www-users.cs.umn.edu/~kumar/dmbook/index.php

          Bodon Ferenc: Adatbányászati algoritmusok, BME Számítástudományi és Információelmélet tanszék. Budapest, 2007, Online jegyzet



Előadásfóliák
:                
   
  Órák helye, ideje, követelmények

  A Kumar-könyv eredeti fóliáinál a ppt és pdf verzió a könyv weboldalán található teljes változatot tartalmazza. 
  A ZH anyaga az, ami az előadáson elhangzott. Ezt leginkább az alábbi órai fóliák (odp) adják vissza (bár az órán időnként sokkal több magyarázat  és példa  hangzott el, mint ami ezeken a fóliákon van és volt néhány rövid új rész is, ami a fóliákon egyáltalán nem szerepel.)

  Órai fóliák 
  
   Bevezetés
   Attribútum és adattípusok, preprocesszálás, hasonlósági mértékek
   Data exploration (statisztikai jellemzők, ábrázolás, OLAP)
   Egy érdekes előadás arról, hogy hogyan lehet adatokat ábrázolni
   Asszociációs szabályok
   Osztályozás első rész
   Osztályozás második rész
   Klaszterezés első rész
   Klaszterezés második rész
   Gyakorló feladatok a 2. zhra  itt  és  itt, a megoldott feladatok ezekből kerültek ki, de fontosak az órán alhangzott megjegyzések!
 

   
  Eredeti fóliák:
   
  Bevezetés: ppt  és  pdf
  Attribútum és adattípusok, preprocesszálás, hasonlósági mértékek: ppt és  pdf
  Data exploration (statisztikai jellemzők, ábrázolás, OLAP): ppt és pdf
  Asszociációs szabályok alapfogalmak, alapvető algoritmusok:  ppt és pdf


Laborhoz anyagok:

  Első rész (R): 
 
  rstudio letölthető  innen

 
A labor csoportbeosztása  itt megtekinthető

   Az R története, főbb jellemzői
   Osztályok, alapfüggvények, kiválasztás
   Az első labor feladatai  a  páratlan és a páros heti csoportnak

   Help, szövegszerkesztő, beolvasás
   Függvények
   A második  labor feladatai a páratlan  és páros heti csoportnak
   A második laborhoz letöltendő adatfile

   Grafika
   Demo R file a grafikához
   A grafikához javasolt feladatok a páratlan  és páros heti csoportnak

   Beadandó házi R-ből: feladatkitűzés és a két adatfile: specdata.zip és korhaz.zip

   Második rész (Weka, Java):
 
   Weka 3.6 letölthető innen
  
   Eclipse IDE for Java developers letölthető innen

   Bevezető JAVA előadás fóliái

   Első gyakorlat anyagai: feladatok és megoldások

   Beadandó házi feladatkitűzése

Követelmények

      Két ZH az előadás idejében (március 18. és május 6.), mindkettő 35 pontot ér, mindkettőn  legalább 14 pontot el kell érni.
      Legalább az egyik ZHnak elsőre sikerülnie kell, a másik pótolható a pótZHval május 13-án. Utolsó pótlási alkalom a pótlási héten.

     A laboron két beadandó házi van, mindkettő 15 pontot ér. A házik ellenőrzése az utolsó laboron történik.
   
     A laboron az első hat alkalomból legalább ötön részt kell venni.
   
     Összesen 100 pont szerezhető, 40 ponttól elégséges, 55-től közepes, 70-tól jó, 85-től jeles a félévközi jegy.