Számítástudományi és Információelméleti Tanszék

 

Témakiírás

Adatbázis modellek kombinatorikus problémái

A relációs adatmodell manapság a legelterjedtebb a kereskedelmi használatban. Alapegysége a relációs tábla, ahol az oszlopok felelnek meg a tárolt adatok típusainak, a sorok pedig az egyedi rekordoknak. Vizsgálataink során ezt egy mátrixszal reprezentáljuk.

  1. Legyen A az attribútumok (oszlopok) egy halmaza, b pedig egy attribútum. Azt mondjuk, hogy b funkcionálisan függ A-tól, ha nincsen két olyan sora a mátrixnak, amelyek megegyeznek A-ban, de különböznek b-ben. Azt mondjuk, hogy attribútumok egy halmaza kulcs, ha minden oszlop funkcionálisan függ tôle.  Armstrong tétele szerint minden F függõségi rendszerhez létezik egy olyan adatbázis (mátrix), hogy abban pontosan azok a függõségek teljesülnek, amelyek F logikai következményei. Ezeket nevezzük Armstrong-adatbázisoknak. Az egyes függõségi rendszerekhez tartozó Armstrong-adatbázisok minimális méretének ismerete fontos adatbányászati szempontokból. Ugyanakkor a függõségi rendszer, illetve kulcsrendszer bonyolultságának is egy mértéke.  A funkcionális függõségek ekvivalensek az attribútum halmazon értelmezett lezárási operátorokkal, lezárásokkal. Érdekes probléma az ismertebb lezárások vizsgálata. Ugyanakkor a minimális kulcsok rendszere Sperner-rendszer (nincs benne két halmaz, A és B, úgy, hogy egyikük tartalmazná a másikat). Itt a felmerülõ problémák a kombinatorika  extremális halmazrendszerek szakterületével közösek. A kutatási téma tehát az Armstrong adatbázis-mátrix sorai száma és a kulcsrendszer, illetve lezárás bonyolultsága közti összefüggések vizsgálata, alsó és felsô becslések, konstrukciók keresése. Elsõsorban matematikai jellegû kérdések és megoldási módszerek várhatóak.
  2. A funkcionális függôségeket többféleképpen lehet általánosítani: elágazó függôségek, illetve fuzzy funkcionális függôségek. Azt mondjuk, hogy egy b attribútum (p,q)-függ egy A attribútum halmaztól, ha nincs az adatbázis-mátrixban q+1 olyan sor, melyek b-ben csupa különböző értéket vesznek fel, ugyanakkor az A-beli oszlopokban pedig legfeljebb p különbözőt. Itt a funkcionális függőségekhez hasonló kérdések vethetők fel, bár lezárások már nem ekvivalensek a (p,q)-függőséggel, ha q > p. A fuzzy funkcionális függőség általános formáját Chen és társai definiálták lehetőségi eloszlások és Fuzzy implikációs operátorok segítségével. Ezen két új kutatási terület irodalmának áttanulmányozása, majd a kiválsztott nyitott problémákon való közös gondolkodás.
  3. Az adatbázis tekinthetô igaz relációs kalkulus állítások halmazának (lásd Datalog). Igen fontos problémakör a "view update", azaz ha olyan update utasítás érkezik, amelyik nem egy bázis táblára vonatkozik, hanem egy (esetleg több) táblából leszármaztatottra. Hogyan kell,( lehet, értelmes ) a bázis táblákat módosítani, hogy a hatás a kívánt update legyen? Az erre vonatkozó irodalom tanulmányozása, új, hatékony algoritmusok keresése.
Az XML és az objektum alapú adatbázis modellek elterjedésével ezek elméleti alapjainak tisztázása is szükségszerűvé vált. Különös tekintettel az XML alapú adatbázisok integritási feltételeinek, iletve redundacia csökkentésének, normalizálásának tanulmányozására. Ennek fontos eszköze az az egymásba ágyazott attribútum (nested attribute) modell, melyben különböző konstruktorok segítségével rekurzívan definiálhatunk adatstruktúrákat. Itt a hagyományos relációs modell attribútum halmazán értelmezett Boole-algebra helyét egy Brouwer-algebra veszi át. Alapvető kérdések az Armstrong példányok létezésének vizsgálata különböző függőségi rendszerek esetén, illetve a redundancia csökkentő normál formák megtalálása, felbontási algoritmusok tervezése. Fontos a különböző modellekben definiált integritási feltételek, függőségek összehasonlító elemzése.

Szükséges nyelvtudás: angol

Dr. Sali Attila
egyetemi docens
31-61
sali@renyi.hu