Számítástudományi és Információelméleti Tanszék
Témakiírás
Adatbázis modellek kombinatorikus problémái
A relációs adatmodell manapság a legelterjedtebb a kereskedelmi használatban. Alapegysége a relációs tábla, ahol az oszlopok felelnek meg a tárolt adatok típusainak, a sorok pedig az egyedi rekordoknak. Vizsgálataink során ezt egy mátrixszal reprezentáljuk.
- Legyen A az attribútumok (oszlopok) egy halmaza, b pedig egy attribútum. Azt mondjuk, hogy b funkcionálisan függ A-tól, ha nincsen két olyan sora a mátrixnak, amelyek megegyeznek A-ban, de különböznek b-ben. Azt mondjuk, hogy attribútumok egy halmaza kulcs, ha minden oszlop funkcionálisan függ tôle. Armstrong tétele szerint minden F függõségi rendszerhez létezik egy olyan adatbázis (mátrix), hogy abban pontosan azok a függõségek teljesülnek, amelyek F logikai következményei. Ezeket nevezzük Armstrong-adatbázisoknak. Az egyes függõségi rendszerekhez tartozó Armstrong-adatbázisok minimális méretének ismerete fontos adatbányászati szempontokból. Ugyanakkor a függõségi rendszer, illetve kulcsrendszer bonyolultságának is egy mértéke. A funkcionális függõségek ekvivalensek az attribútum halmazon értelmezett lezárási operátorokkal, lezárásokkal. Érdekes probléma az ismertebb lezárások vizsgálata. Ugyanakkor a minimális kulcsok rendszere Sperner-rendszer (nincs benne két halmaz, A és B, úgy, hogy egyikük tartalmazná a másikat). Itt a felmerülõ problémák a kombinatorika extremális halmazrendszerek szakterületével közösek. A kutatási téma tehát az Armstrong adatbázis-mátrix sorai száma és a kulcsrendszer, illetve lezárás bonyolultsága közti összefüggések vizsgálata, alsó és felsô becslések, konstrukciók keresése. Elsõsorban matematikai jellegû kérdések és megoldási módszerek várhatóak.
- A funkcionális függôségeket többféleképpen lehet általánosítani: elágazó függôségek, illetve fuzzy funkcionális függôségek. Azt mondjuk, hogy egy b attribútum (p,q)-függ egy A attribútum halmaztól, ha nincs az adatbázis-mátrixban q+1 olyan sor, melyek b-ben csupa különböző értéket vesznek fel, ugyanakkor az A-beli oszlopokban pedig legfeljebb p különbözőt. Itt a funkcionális függőségekhez hasonló kérdések vethetők fel, bár lezárások már nem ekvivalensek a (p,q)-függőséggel, ha q > p. A fuzzy funkcionális függőség általános formáját Chen és társai definiálták lehetőségi eloszlások és Fuzzy implikációs operátorok segítségével. Ezen két új kutatási terület irodalmának áttanulmányozása, majd a kiválsztott nyitott problémákon való közös gondolkodás.
- Az adatbázis tekinthetô igaz relációs kalkulus állítások halmazának (lásd Datalog). Igen fontos problémakör a "view update", azaz ha olyan update utasítás érkezik, amelyik nem egy bázis táblára vonatkozik, hanem egy (esetleg több) táblából leszármaztatottra. Hogyan kell,( lehet, értelmes ) a bázis táblákat módosítani, hogy a hatás a kívánt update legyen? Az erre vonatkozó irodalom tanulmányozása, új, hatékony algoritmusok keresése.
Az XML és az objektum alapú adatbázis modellek elterjedésével ezek elméleti
alapjainak tisztázása is szükségszerűvé vált. Különös tekintettel az XML alapú
adatbázisok integritási feltételeinek, iletve redundacia csökkentésének,
normalizálásának tanulmányozására. Ennek fontos eszköze az az egymásba
ágyazott attribútum (nested attribute) modell, melyben különböző
konstruktorok segítségével rekurzívan definiálhatunk adatstruktúrákat. Itt a
hagyományos relációs modell attribútum halmazán értelmezett Boole-algebra helyét
egy Brouwer-algebra veszi
át. Alapvető kérdések az Armstrong példányok létezésének vizsgálata
különböző függőségi rendszerek esetén, illetve a redundancia csökkentő normál
formák megtalálása, felbontási algoritmusok tervezése. Fontos a különböző
modellekben definiált integritási feltételek, függőségek összehasonlító
elemzése.
Szükséges nyelvtudás: angol
Dr. Sali Attila
egyetemi docens
31-61
sali@renyi.hu