4

10. alszekció a helyezések megjelölésével

Webtechnológiák

I. helyezett: Benkő Borbála Katalin – Katona Tamás – Varga Péter András

Magyar nyelvű szövegek megértése információkinyerési célokkal

Budapesti Műszaki és Gazdaságtudományi Egyetem

Témavezetők: dr. Dobrowiecki Tadeusz, Mészáros Tamás

Az interneten az elektronikus formában megjelenő tudás mennyisége rohamosan nő. Ez számos, egyre nehezebben megkerülhető problémát vet fel, mert a mennyiség túllépte az emberi feldolgozó-képesség határait. Az általános szöveges információ gépi megértése – főleg egy olyan összetett nyelv esetén, mint a magyar – nagyon nehéz és igen tudásintenzív feladat, melynek megoldása még gyerekcipőben jár. Ha a hatalmas mennyiségű adat teljesen gépi kezeléséről egyelőre le is kell mondani, a feldolgozásához bizonyos segítséget lehet nyújtani alkalmas előfeldolgozással, szűréssel és hatékony tartalom szerinti kereséssel. Jogosan merül fel mind az intelligens keresés, mind a tartalom szerinti előszűrés feladata.

Szerencsére számos szakterületen a tömegesen megjelenő szövegek (gazdasági, politikai hírek, kórházi zárójelentések stb.) igen rövidek és tematikusan „egyhangúak”. Ez a korlátozott kontextus lehetőséget teremt hatékony feldolgozás kidolgozására. A keresésre már most léteznek meglehetősen jó megoldások. Javításuk főleg tárgyterület-specifikus vonatkozásban képzelhető el, ahol a keresésbe a tárgyterületről szerzett háttértudás beépítésével várhatunk javulást. A szöveg tartalom szerinti előszűrésénél szó lehet automatikus kategorizálásról vagy tartalom szerinti kivonatolásról egyaránt, sőt, akár a „megértett” szöveg alapján történő egyszerű következtetésről is.

A szöveges információtömeg menedzselését végző rendszereket leginkább három szempont szerint lehet jellemezni: milyen típusú keresőkérdéseket tud kezelni a rendszer, hogy nyeri ki a forrásdokumentumok információtartalmát, és mit kezd a kinyert információval. A dolgozatban bemutatott rendszer mindhárom téren új módszereket alkalmaz.

Az elméleti eredmények illusztrálására implementáltuk a rendszer egyszerűsített változatát. A rendszer demonstrálja, az ontológiával támogatott, nyelvtani struktúrából kinyert információ hogyan használható a hírek azonosítására és rendszerezésére. TDK-dolgozatunk bemutatja a gépesített szövegmegértés elméleti alapjait is.

II. helyezett: Gábor Bálint – Palotai Zsolt

Adaptív linkkiemelő internetes böngészéshez

Eötvös Loránd Tudományegyetem

Témavezető: dr. Lőrincz András

Napjaink leggazdagabb információforrása a világháló. Használhatóságát azonban nehezíti, hogy épp az óriási mérete miatt az új információk felkutatása igen nehéz feladat. A nagy keresőrendszerek ebben csak korlátozottan segíthetnek, mivel indexelési ciklusuk legalább egy hónap. A mesterséges intelligencia módszerei viszont lehetőséget nyújthatnak az új oldalak gyorsabb megtalálására. Az általunk javasolt módszer a böngészés közben elérhető linkek közül kiemel (kiszínez) néhányat. A kiemelés alapját a felhasználó korábbi linkválasztásai adják.

Olyan módszer kidolgozására törekedtünk, amely kapocsként működhet az emberi és a gépi intelligencia között. Módszerünk elemei a következők: szövegosztályozókat fejlesztettünk ki, amelyek egy adott dokumentumról eldöntik, hogy adott osztályhoz tartozik-e vagy sem. Az előre betanított osztályozókhoz gyorsan adaptálódó lineáris súlyok tartoznak. Ezeket a súlyokat változtatjuk a felhasználó lépései alapján, különböző módszerekkel. Feltételeztük, hogy a felhasználó célja a keresés során változhat, de mindig közelítőleg jól leírható az osztályozók súlyozott együttesével. Kérdésünk az volt, hogy – a szomszédos dokumentumok letöltése, ezek értékének megbecslése és a felhasználó lépései alapján tanulva – milyen gyorsan és milyen pontosan becsülhető a dokumentumok értéke. Háromféle adaptációs eljárást használtunk a súlyok állítására: (i) megerősítéses tanulást (RL), (ii) csúszóablakos technikát és (iii) értékbecslés-hiba által modulált csúszóablakos technikát (VEMW). Tesztjeink során a felhasználót egy modellel helyettesítettük. Első lépésben az internetet is modelleztük, majd a legjobb algoritmussal, modellfelhasználót használva, internetes teszteket is végeztünk.

A leghatékonyabbnak a VEMW algoritmus bizonyult. Az internetes tesztek alapján a VEMW technika képes a felhasználó céljának hatékony közelítésére, általában 5-10 lépés után, esetenként azonban már 2 lépés után is. A felhasználómodellel végzett tesztek eredményei alapján – a jövőben – érdemes „élesben” is kipróbálni a módszert, például keresők oldalainak sorba rendezésére.

A kutatást a European Office of Aerospace Research and Development, Air Force Office of Scientific Research, Air Force Research Laboratory finanszírozta.

különdíj: Lukácsy Gergely

Intelligens lekérdezés és következtetés a weben

Budapesti Műszaki és Gazdaságtudományi Egyetem

Témavezetők: Benkő Tamás, dr. Szeredi Péter

TDK-dolgozatomban egy olyan szoftver tervezésére és kivitelezésére vállalkoztam, amely napjaink legdinamikusabban fejlődő területéhez, az internethez és azon belül is az internet szemantikai oldalának kiaknázásához kíván valami újat hozzátenni.

Az interneten fellelhető óriási adatmennyiség miatt már a kezdetektől felmerült a keresőgépek iránti igény. Ezek azonban, egyre kevésbé elfogadható módon, minden intelligencia nélküli szintaktikus keresést és indexelést végeznek a neten. Esélyük sincsen olyan kérdések megválaszolására, mint például „Keresek egy olyan videoanyagot, melyben látható egy Ferrari F50-es sportkocsi” vagy „kérek olyan .NET-re írt forráskódokat, amik valamilyen szövegszerkesztőt valósítanak meg”.

A W3C RDF (Resource Description Framework) nevű szabványának célja a hiányzó szemantika megragadása és internetbe „pumpálása”. A szabvány sokszor megújult, sőt már meg is fogalmazták az utóddal kapcsolatos elvárásokat és célokat. Bár az elméleti alapok megvannak, mindeddig kevés olyan eszköz készült, amely képes az RDF-adatforrásokat intelligens módon feldolgozni.

Munkám során ezért egy olyan szoftvert fejlesztettem ki, amely alkalmas RDF-adatforrások hatékony lekérdezésére. Teszi ezt egy saját, új felfogású lekérdező nyelv segítségével, melyhez lekérdezés-optimalizálót is implementáltam. A program beépíthető más alkalmazásokba, ehhez egy könnyen használható interfészt kínál, többféle felületet (konzol, grafikus) nyújt a felhasználónak, valamint részletes metainformációkat szolgáltat az adatforrásról. Képes továbbá az adatokon intelligens következtetést végezni, valamint alkalmas az RDF-adatforrások konzisztenciájának sokrétű vizsgálatára. Ez utóbbi két dolog egyedülálló a már létező RDF-lekérdezők körében.

Dolgozatomban először bemutatom a fejlesztés környezetét: felvázolom az RDF felépítését és nyelvi konstrukcióit, összehasonlítom más leíró nyelvekkel valamint kifejtem, hogy miként járulhat hozzá az RDF a szemantikus web elképzelés megvalósulásához. Ezután térek át a kifejlesztett lekérdező nyelv bemutatására, ismertetem a következtető gép működését, valamint az elkészült szoftver képességeit, felépítését és fejlesztési lehetőségeit. A dolgozat tesztekkel és érvekkel támasztja alá a program létjogosultságát, valamint bemutatja elhelyezkedését a hasonló próbálkozások – elég szűkös – körében.

Novák György – Pári Csaba

Internetes böngésző fejlesztése a mobil OO‑világban

Debreceni Egyetem

Témavezető: Bátfai Norbert

Az általunk elkészített rendszer képessé teszi a Java nyelven írt kódok futtatására alkalmas mobiltelefonokat HTML-oldalak megjelenítésére, valamint az interneten való böngészésre. A célunk az volt a rendszer kifejlesztésénél, hogy lehetővé tegyük a „javaképes” mobiltelefonok tulajdonosai számára, hogy az asztali számítógépeknél megszokotthoz hasonló módon tudjanak az interneten lévő HTML-oldalak között böngészni. Ezzel összekapcsoljuk a jól megszokott információforrást és a mindenkihez egyre közelebb álló, mindig kéznél lévő eszközöket.

A HTML-oldalak elemei a készülékekbe épített J2ME saját eszközeivel nem jeleníthetők meg, így az oldalt olyan formára kell hoznunk, amelyet már képes a készülék megjeleníteni. Ezen feladat megoldásaként adódó technikák közül mi azt választottuk, hogy a HTML-kód alapján egy szerveren elkészítjük az oldal képét, majd ezt a képet átküldjük a mobilkészüléknek, és ott megjelenítjük.

A felhasználó mobilkészülékén egy MIDlet fut, amely tartja a kapcsolatot a felhasználóval, el tudja kérni egy szervlettől egy adott oldal képét, és ezt a képet meg tudja jeleníteni. Ha a felhasználó meg kíván tekinteni egy HTML-oldalt, akkor megadja annak URL-jét a MIDlet-nek, amely felépít egy HTTP-kapcsolatot a szervlettel, és átadja neki az előbb kapott URL-t.

A szervlet az URL által hivatkozott HTML-kód alapján elkészít egy oldalt, azaz létrehozza annak képét, melyet egy böngészőben is látnánk. Ezután a szervlet az elkészített kép egy részét átküldi a mobilkészüléknek a HTTP-kérés válaszaként.

A felhasználó természetesen kérheti az oldal más részének, vagy az oldalon található valamely link által hivatkozott dokumentum megjelenítését is. Ekkor a MIDlet az előzőekhez hasonlóan kapcsolódik a szervlethez, majd elkéri attól a megfelelő oldal(részlet) képét, és megjeleníti azt.

A rendszer tehát képessé tesz minket, hogy Java nyelven írt alkalmazásokat futtatni képes készülékek segítségével elérjük az interneten található jól megszokott HTML-oldalakat. A rendszer részei azonban jól felhasználhatóak más alkalmazásokban is, hiszen sokszor szükség lehet arra, hogy egy HTML-oldal képét előállítsuk, vagy egy mobilkészüléken a kijelzőnél nagyobb méretű képet, vagy szöveget tudjunk görgetni.

Lantos Zoltán

Az internet használatának bevezetése a műszaki vizsgázatatás és a környezetvédelmi felülvizsgálat területére

Gábor Dénes Főiskola

Témavezető: Gál József

TDK-munkám egy jelenleg futó, államilag előírt és elfogadott, azonban erősen idejétmúlt rendszer alapjait kérdőjelezi meg. A XXI. században az informatika elért egy olyan fejlettségi szintre, hogy viszonylag olcsón, nagy előnyök kihasználására lehetünk képesek alkalmazásával, feltéve, ha nem félünk élni a technika adta lehetőségekkel. Jelenleg egy műszaki vizsgálóállomáson dolgozom ügyintézőként, így betekintésem van a rendszer folyamataiba, adott esetben a hiányosságaiba, melyek kiküszöbölésére szeretnék válaszokat keresni.

Mint általában mindenhol a világon, az informatika használatának előtérbe helyezésével költség és időmegtakarítást, valamint biztonságosabb, kevesebb hibalehetőséggel dolgozó rendszer kiépítését szeretném megvalósítani.

A problémák kiküszöbölésére sem új gépek, sem új szoftverek használatára nem kerülne sor, a jelenleg alkalmazott technológia bővítésével megoldható, mind a környezetvédelmi felülvizsgálat, mind a műszaki vizsgáztatás esetén. Ezen két tevékenység ráadásul ugyanazt az adatbázisrendszert használná.

Két hálózat kiépítésére kerülne sor: egy belső hálózatra, amely a belső folyamatokat kötné össze és egy külső hálózatra, amely a vizsgáló állomásokat kapcsolná rá az okmányirodák és a Közlekedési Felügyelet adatbázisára, illetve egy saját adatbázissal.

Az okmányirodák adatbázisa lenne a kezdő lépés. A jármű összes információja lekérdezhető lenne, elég lenne csak a rendszám egyszeri begépelése, a többi információ automatikusan lekérdezhetővé válna. A saját adatbázis tartalmazná a gyártó vagy a jogszabály által meghatározott füstölési értékeket (melyeket most egy könyvből kell kikeresni) és az adott járműtípushoz kapcsolódó fék-jelleggörbéket. Majd a vizsgálat eredménye azonnal a Közlekedési Felügyelet adatbázisába juthatna, biztonságosan, perceken belül.

III. helyezett: Mandusitz Sándor – Palotai Zsolt

Versengő barangolók egyedfejlődése

Eötvös Loránd Tudományegyetem – Budapesti Műszaki és Gazdaságtudományi Egyetem

Témavezető: dr. Lőrincz András

Az elmúlt években az élet igen sok területén az információ birtoklása helyett, a hangsúly az új információk minél gyorsabb megszerzésére tevődött át. Gondoljunk például a tőzsdére, ahol egy váratlan katasztrófa teljesen megváltoztathatja az árfolyamokat. Aki előbb jut az értékes információhoz, az behozhatatlan előnyre tehet szert a versenytársakkal szemben. Mára az interneten alapuló szolgáltatásokon keresztül (WWW, email, hírcsoportok) lehet elérni az új információk döntő többségét. Mivel az internet hatalmas információ-tárház, így az összes friss információ is még feldolgozhatatlan a számunkra. Ezért szükség van tematikus szűrésre is. A tárolt adat hatalmas mennyisége miatt a kézi keresés nehézkes, a létező keresők, pedig nem képesek a legújabb információkat indexelni, általában (legalább) 1 hónapot késnek. Utoljára, de nem utolsósorban, mi mint felhasználók, munkánkat minimálisra szeretnénk csökkenteni.

Az a tapasztalat, hogy az interneten a barangolók csapdákba esnek, egy idő után ugyanazon területet járják be. Elméleti alátámasztást nyert ez a tapasztalat, miután az internet skálamentes kisvilág struktúrájára fény derült az elmúlt két-három év során.

Internetes kísérletek segítségével – a CNN oldalain megjelenő friss információk keresésével – megmutatjuk, hogy evolúciós nyomás alatt álló rendszerünk gyors kooperációt (feladatmegosztást/kompartmentalizációt) eredményez, és minimumra csökkenti a barangoló törzs egyedei közötti redundanciát.

A dolgozatban bemutatott evolúciós eszközöket (is) alkalmazó algoritmus egy fejlesztés alatt álló elosztott információgyűjtő és információ-feldolgozó rendszernek része. A teljes rendszer elosztott szerverekből áll és a szerverek rendelkeznek barangolókkal. Több felhasználó esetén több témaspecifikus keresés is kialakítható. Könnyen belátható, hogy a friss információra vonatkozó „témaspecifikus keresés” jelenthet speciális számítási és sávszélességi kapacitás segítségével kiszámolható friss információt is, mivel nincs elméleti különbség a mások által, vagy a saját magunk által létrehozott friss információ „megkeresése” illetve „kiszámítása” között. Így az algoritmus számítások adaptív elosztására is képes, amelyet a jövőben kívánunk majd demonstrálni.

különdíj: Tóth Ildikó Éva

Dinamikus WAP-oldalak tervezése és megvalósítása

Budapesti Műszaki Főiskola

Témavezető: dr. Kutor László

A GSM korában a kapcsolási díjak miatt luxusnak számított „wapolni”. Az átalánydíj, illetve a GPRS lehetővé teszi a WAP szélesebb körben való elterjedését.

A Java illetve a PHP térhódítása miatt a statikus WAP-oldalak mellett egyre nagyobb szerepet kapnak a dinamikus tartalomszolgáltatások. A projekt célja egy ilyen dinamikus WAP-alkalmazás tervezéséhez és gyakorlati alkalmazásához való ismeretek tanulmányozása.

A dolgozat áttekinti a dinamikus WAP-szolgáltatás technikai hátterét, és a gyakorlatát.

Konkrét feladatként a PHP és az Oracle alkalmazásával egy olyan menetjegy-ellenőrző rendszert valósít meg, amely a szerveren tárolt adatbázisból tud lekérni jegyadatokat, illetve a keresésnek megfelelő eredményeket listázza. A program a későbbiekben egy olyan rendszer részévé válhat, melyben az utas a menetjegyét mobiltelefonnal veheti meg, illetve a jegyellenőr akár a vonaton a menetjegy mellőzésével ellenőrizheti a viteldíj kifizetését.

Tamás Andor

PHP-vel és MySQL-el előállított dinamikus weboldalak

Pécsi Tudományegyetem

Témavezető: Tukora Balázs

A mai korban az internet szerepe jelentősen felértékelődött. Nincs az életnek, munkának olyan területe, amely közvetett vagy közvetlen formában ne kapcsolódna a hálózatokhoz, és ezen belül az internethez. Régebben a weblapszerkesztés lényegesen kevesebb lehetőséget nyújtott a fejlesztőknek, így a felhasználóknak is. Még nem olyan régen a weboldalak csak tájékoztató, illetve bemutatkozó adatokat tartalmazhattak, manapság adatbázissal összekötve szinte mindent meg lehet oldani. A PHP nyelv támogatja a MySQL-adatbázisokat, így lehetővé teszi azt, hogy egy olyan komplex szolgáltatásokat nyújtó portált, áruházat stb. lehessen létrehozni, amely teljes mértékben naprakész, egyszerűen nyomon követhető, karban tartható, frissíthető, emellett pedig rendkívül pontos.

Előadásom célja, hogy jelenleg is futó projekteken keresztül bemutassam, miként lehet felhasználni a PHP-t és a MySQL-t a mai internetes tartalomfejlesztésben. A projektek bemutatásán kívül ki szeretnék térni a fejlesztés során felmerülő nehézségekre, azok megoldására, valamint ismertetni azokat az új irányokat, amik a jövőben várhatóak az internetes tartalmak és megoldások fejlesztésében.

Farkas Gábor

Tartalomszolgáltató keretrendszer dinamikus weblapok segítségével – TRiNiTY wEB

Pécsi Tudományegyetem

Témavezető: Béres Csaba Zoltán

Mikor felvételt nyertem az egykori Janus Pannonius Tudományegyetem számítástechnika-technika szakára, még nem tudtam, hogy milyen technikai és egyéb hátterek adottak a tanszéken. Lassanként körvonalazódtak az ezzel kapcsolatos kérdésekre adandó válaszok. Hamarosan nyilvánvalóvá vált számomra, hogy nagy szükség lenne egy olyan hallgatói szerverre és weboldalra, amely képes olyanfokú segítséget nyújtani a hallgatók számára, ami eddig hiányzott, ellenben már más tanszékeken, karokon megtalálható volt hasonló. Értem ezalatt a tanárok által, elektronikus formában közzétett híreket, információkat, hírlevelet, fórumot, ahol a tanárok és diákok közösen meg tudják beszélni kérdéseiket, problémáikat, gondolataikat. Tudja tartani a kapcsolatot mindenki a tanszékkel távolról is. Ne csak úgy tudjon értesülni a friss információkról, hogy ezért fizikailag el kelljen „látogatnia” az egyetemre. Manapság, amikor az internet korát éljük, elengedhetetlen feltétele a tanszékeknek és egyben az egyetemnek egy ilyen oldal. Arról nem is beszélve, hogy napjainkban egyre népszerűbbek a külföldi ösztöndíjas pályázatok, és ha ezt valaki megnyeri, akkor bizony a külföldi tanulmányai során egy ilyen oldal hiányában nem igazán tud értesülni a tanszéki és egyéb hírekről.

Ezért gondoltam, hogy elkészítem ezt a bizonyos oldalt. A megalkotásnál a következő szempontok alapján próbáltam elindulni: felépítése legyen komplex, dinamikus, ugyanakkor kezelése legyen egyszerű, mindenki számára érthető. Természetesen esztétikus és lényegre törő. Elkészítéséhez Linux rendszert vettem alapul, fejlesztőkörnyezetnek PHP4-et, az adatbázis-kezeléshez MySQL-t választottam. (Ezek a feltétek az általam üzemeltetett és karbantartott szerveren adottak is voltak.) Ezen választásaim egyik fő oka, hogy a felsorolt szoftverek mind ingyenesek, valamint a kívánt célnak tökéletesen eleget tesznek, a feladat egyértelműen megoldható rajtuk.

Fekete Gábor

Hallgatóadminisztráció hatékonyabbá tétele HTML bázisú segédlettel

Gábor Dénes Főiskola

Témavezetők: Gál József, Líbor Tamás

TDK-dolgozatomban bemutatom a beiratkozáskor esedékes hallgatói adminisztráció jelenlegi folyamatát néhány mondatban, hallgatói szemszögből.

A korábban rögzített adatok redundanciájára szeretném a figyelmet felhívni, illetve arra a helyzetre, hogy a különböző űrlapokat félévről félévre kézzel ki kell tölteni. A tévesztés lehetősége nagy, az adminisztrációs procedúra feleslegesen hosszú ideig tart.

Szeretnék egy javaslatot megfogalmazni, leprogramozottan bemutatni, hogyan lehetne gyorsítani, hatékonyabbá tenni ezt a munkát. Bemutatom a HTML-oldalon keresztüli hatékony adatbeviteli megoldást. Ehhez saját fejlesztésű programot készítettem.

A dolgozat további részében is javaslatok sorát fogalmazom meg.