Adatbányászati technikák házi feladat

Katona Gyula (kiskat@cs.bme.hu), Tóth Ágnes (tothagi@cs.bme.hu)

2. rész



Az adatok egy bankból származnak, 1000 ügyféltől 30 különböző adatot gyűjtöttek be, valamint feljegyezték, hogy az adott ügyfél rendben visszafizette-e a felvett kölcsönt. A feladatunk, hogy az ügyfelekről ismert információk alapján minél jobban előrejelezzük, hogy egy új jelentkezőnek adjunk-e hitelt vagy sem. Adatfájl: german.csv, a változók jelentését tartalmazó fájl: german.txt.
  1. Találjunk minél jobb osztályozást a J48 algoritmus segítségével. (változók kiválasztása, normalizálás, paraméterek beállítása)
  2. Oldjuk meg a feladatot NaiveBayes vagy BayesNet algoritmus segítségével.
  3. Használjuk a MultiLayerPerceptron vagy az SMO algoritmust.
  4. Építsünk valamelyik fenti feladat megoldására KnowledgeFlow-t.
Beadandó a szükséges lépések összefoglalása és az eredmények.
A végső határidő az utolsó labor, de bármikor előtte is be lehet adni, akár a laboron, akár e-mailben. Számítsatok arra is, hogy esetlegesen szóban ellenőrizzük, hogy a munkát tényleg magatok csináltátok.