ARTKLIKK_PILLAR_GOP111 0464
2015.09.30

                                                                                                                                                  

 

Felhasználó viselkedés nyomon követésével támogatott szöveg elemzésen alapuló online webes ajánló rendszer kutatás-fejlesztése.

2014. január 1-én az ArtKlikk Kft. és a PILLAR EURÓPA Nonprofit Kft. közösen megkezdte a Felhasználó viselkedés nyomon követésével támogatott szöveg elemzésen alapuló online webes ajánló rendszer kutatás-fejlesztése című projektjét, amelyre az Új Széchenyi Terv keretein belül közösen 250 300 000 Ft vissza nem térítendő támogatást nyertek. A projekt az Európai Regionális Fejlesztési Alap társfinanszírozásával valósul meg.

Napjainkban a az interneten vagy a vállalati intraneteken elérhető szöveges dokumentumok olyan mennyiségben és ütemben keletkeznek, hogy azok hatékony szűrése, feldolgozása, vagy akár a releváns dokumentumok megtalálása túlnő a jelenleg megszokott keresőmotorok képességein. Az utóbbi években a fenti okból jelentős lendületet vett a természetes nyelvű szövegek gépi feldolgozását célzó algoritmusok kifejlesztése. Maga a tudományág – az NLP (natural language processing) – számos gyakorlatba átültetett eredménnyel büszkélkedhet, kezdve pl. az ügyfélszolgálatra érkező bejelentések feldolgozásán, a tőzsdei hírek elemzésén keresztül a beszélt nyelvet feldolgozó Siri iPhone alkalmazásig.

K+F projektünk célja egy olyan online példaalkalmazás létrehozása volt, amely az aktuális hírek NLP feldolgozásával megállapítja azok tárgyát, témakörét, a szerző témához/tárgyhoz való viszonyát és ez alapján az olvasó megadott preferenciájának megfelelő hírcsokrot állít össze. Ahhoz, hogy az olvasó preferenciát dinamikusan követhessük, szintén NLP eszközökkel elemezzük azokat a cikkeket, amelyeket az olvasó olvas, ill. azokkal egyetért (pl. facebook like). Ezek alapján tudunk dinamikus olvasói preferencia profilt előállítani.

A projekt során megvizsgáltuk a példaalkalmazás kifejlesztéséhez szükséges NLP eszközkészletet (NER, kulcsszó detekció, POS tagging, szentiment detekció), kiválasztottuk a konkrét algoritmikus megoldásokat, és kifejlesztettük az algoritmus prototípusokat.

A fenti eredményekre alapozva megtörtént a megadott funkciók kiszolgálását végző rendszer tervezése, ill. ez alapján a szerver keretrendszer kifejlesztése, amelyen belül az alap szemantikai algoritmusok futnak. Szintén a fenti részfeladatok során kifejlesztett algoritmus prototípusok alapján lefejlesztésre került azok rendszerbe integrálható változata.

Az algoritmusok böngésző extension (plug-in) formájában is elérhetők a felhasználók számára. Így a felhasználó közvetlenül a böngészőjéből végezheti az éppen megnyitott HTML weboldal szöveges tartalmának NLP feldolgozását, a feldolgozás eredményeinek grafikus megjelenítését.

Az algoritmusfejlesztés és a tesztelés/validálás eredményeinek figyelembevételével megtörtént optimalizálást követően kifejlesztésre kerültek a példaalkalmazás funkciók: a kiegyensúlyozott hírszolgáltatás, és az olvasói szokások elemzése.

 

ArtKlikk Kereskedelmi és Szolgáltató Kft.
Cím: 1025 Budapest, Szépvölgyi út 34.
E-mail: info@artklikk.com
Honlap: www.artklikk.hu
 


Vissza