Adatbányászati technikák házi feladat
2. rész
Az adatok egy bankból származnak, 1000 ügyféltől 30 különböző adatot gyűjtöttek be, valamint feljegyezték, hogy az adott ügyfél rendben visszafizette-e a felvett kölcsönt. A feladatunk, hogy az ügyfelekről ismert információk alapján minél jobban előrejelezzük, hogy egy új jelentkezőnek adjunk-e hitelt vagy sem. Adatfájl: german.csv, a változók jelentését tartalmazó fájl: german.txt.
- Találjunk minél jobb osztályozást a J48 algoritmus segítségével. (változók kiválasztása, normalizálás, paraméterek beállítása)
- Oldjuk meg a feladatot NaiveBayes vagy BayesNet algoritmus segítségével.
- Használjuk a MultiLayerPerceptron vagy az SMO algoritmust.
- Építsünk valamelyik fenti feladat megoldására KnowledgeFlow-t.
Beadandó a szükséges lépések összefoglalása és az eredmények.
A végső határidő az utolsó labor, de bármikor előtte is be lehet adni, akár a laboron, akár e-mailben. Számítsatok arra is, hogy esetlegesen szóban ellenőrizzük, hogy a munkát tényleg magatok csináltátok.