Jump to content
PirateClub.hu

Új Magyar Keresőmotor Turkál A Mélyweben


Clark
 Share

Recommended Posts

Időről időre megjelennek a magyar piacon is olyan keresőmotorok, melyek megpróbálják kicsiben produkálni a Google sikerét. Persze a Google a helyi kezdeményezéseknek is kedvét szegte, miután a keresőinterfészt a világ számtalan nyelvére lefordította – az albántól a magyaron át a zuluig. Nem mindenki tartja lejátszott meccsnek a keresőmotorok versenyét. A napokban indult PolyMeta.hu csak elsőre hallásra tűnik a hazai polimetakrilátok virtuális közintézményének. Bizony itt egy okos metakereső lakik.

 

Bár a Google egy adott keresőszóra akár sokmillió találatot is kidob, a felhasználó számára ennek jelentős része "vaktalálat". A PolyMeta bár kevesebb, de - megalkotói reményei szerint - relevánsabb találatot kínál az olvasónak, ráadásul a Morphologicnak köszönhetően a magyar nyelv sajátosságaira is tekintettel van.

 

Nyelvi sajátosságok

 

Mi történik, ha a Google magyar interfészén az "egér" szóra keresünk rá? Azt láthatjuk, hogy bár releváns találatokat kapunk az első oldalon, de az adott szó egyéb nyelvi formáira nincs tekintettel a keresés. Vagyis például olyan szöveghelyeket nem találunk a találati oldalakon, melyekben az "egerek" vagy mondjuk az "egérrel" kifejezések szerepelnének.

 

A PolyMeta viszont ezt a feladatot jól teljesíti. A Morphologic fejlett nyelvi elemzőtechnológiájának köszönhetően tekintettel van egy szó különböző nyelvi alakjaira, így lehetséges, hogy miközben az "egér" szóra kerestünk rá, az első találatok közt mindjárt az "egerek" kifejezéssel találkozunk.

 

polymetaeger.JPG

 

Releváns találatok

 

Relevancia (vagyis témahűség) szempontjából mindkét keresőben érkeznek olyan találatok, melyek értéktelenek a felhasználó számára. De mindkét esetben – az első pár találati oldalt nézve – nem jellemző a tömeges "mellékeresés".

 

Rövid közvélemény-kutatást készítettünk ismeretségi körünkben. Egyik kolléga azt mondja, nem zavarja annyira, hogy a Google ikszedik találati oldala már inkább irreleváns találatokkal van tele, mert általában az első pár találati oldalon megtalálja, amit keres. IT-mérnök barátunk viszont azt mondta, hogy igenis zavaróak az irreleváns találatok, ennek ellenére alapvetően a Google-on keres, sőt, nagyobb részt angolul, így természetesen az sem zavarja, hogy a Google nem ismeri fel a magyar keresőkifejezések ragozott alakjait.

 

Keresés a mélyweben

 

relevanica mellett fontosnak szoktuk tekinteni, hogy milyen mély az adott adatbázis merítése. A keresők többsége ugyanis crawlereket használ, ám ezek a keresőrobotok csak az úgynevezett "felszíni webet" monitorozzák és indexelik, a "rejtett webet" vagyis a mélywebet nem. Egyes becslések szerint a mélyweb ezerszer több adatot tartalmaz, mint az a felszíni web. (Lásd még a keretest.)

 

Jóföldi Endre, a PolyMeta tartalmi felelőse többek közt azért tartja jobbnak a PolyMetát sok más keresőnél, mert ez a keresőmotor - legalább részben - a mélywebet is monitorozza. Ez azt eredményezheti, hogy akár olyan magyar nyelvű weboldalakon megjelenő tartalmakra is rátalálhatunk, melyeket más, hagyományos keresőkben nem biztos, hogy megtalálunk.

 

A PolyMeta vezetői persze azt nem kívánták megmondani, hogy milyen logika szerint állapítják meg egy találatról, hogy releváns-e. Annyit azért elárultak, hogy felhasználják azt az információt, hogy az általuk előállított Tartalomjegyzékben szereplő legfontosabb fogalmak „mely találatokban fordulnak elő”. És azt is hangsúlyozták, hogy – lévén metakeresőről beszélünk – a hagyományos keresőkkel ellentétben ők nem saját crawlert használnak, hanem más keresők eredményeit összesítik és dolgozzák fel.

 

Hol van a mélyweb?

 

Ha egy keresőrobot (crawler) elér egy weboldalt, a nyitóoldalon található szövegeket, valamint azokat az aloldalakat "tapogatja végig", melyekre hivatkoznak a nyitóoldalon, tehát jellemzően például a "kapcsolat" vagy "impresszum" aloldalakat. Viszont nem képesek keresni olyan adatbázisban, mely a weboldalon csak keresőmezőből érhető el. Ugyanis a keresőrobot nem képes arra, hogy szisztematikusan szavakat írjon be a weboldal keresőjébe, hogy így kinyerje az adatbázisban rejtőző aloldalakat. Jellemzően a mélywebben maradnak a multimédia tartalmak vagy a regisztrációval elérhető webes tartalmak is.

 

Felhasználói élmény

 

A PolyMetának van néhány olyan előnye, mely vonzóvá teheti a magyar netezők körében. Az egyik, hogy - a Google-lal ellenétben - a magyar online média híranyagai közt is kereshetünk. A másik, ami a felhasználó számára egyértelműen szimpatikus lehet, az a bal hasábban található "Tartalomjegyzék" névre keresztelt ágrajz, mely segít a felhasználónak tematizálni a relevánsnak gondolt találatokat.

 

A keresőmotorok használatakor persze nem csak a gyorsaság és pontosság számít, hanem a felhasználói élmény is. A két kereső közül mindenképpen a Google mondható letisztultabbnak. A betűméretek és színek megválasztása az amerikai kereső esetében barátságosabbnak tűnik, a találatok szellősebben jelennek meg az oldalon, nem tolakodik túlzottan sok információ a felhasználó felé. A PolyMeta színvilágában harsányabb, a betűk színei és méretei mintha nem követnének letisztult logikát, a találatok közti éles vörös csíkok pedig kifejezetten zavarják az összképet, akárcsak a túl sok szín és betűméret egyidejű használata.

 

A PolyMeta esetében az is zavaros, hogy a füleknél miért került egy hierarchiai szintre a "Web" és a "Hírek" mellé az "Egészség" és a "Receptek". (Ha egészség témakörben akarunk híreket keresni, vajon a Hírek vagy az Egészség füllel járunk-e jobban?)

 

polymetausability.JPG

Melyik a letisztultabb: a felső vagy az alsó?

 

Kis magyar vágyálmok

 

A toxikológiától a metakeresőig

 

A PolyMetát a K-Prog fejleszti, mely korábban egy toxikológiai metakeresőt készített. A National Library of Medicine kutatója, Dr. Doszkocs Tamás kereste meg a céget, hogy készítsenek számukra egy metakeresőt. Ebből a projektből készült el a ToxSeek. A K-Prog ezt követően összeállt a Morphologic-kal, hogy létrehozzák az általánosabb, mindenki számára hasznos metakeresőt, a PolyMetát. Az architekturális fejlesztést Kása Károly végezte, míg a tartalmi fejlesztésért Jóföldi Endre volt a felelős. A PolyMeta tudományos források keresésére jelenleg is működik a Debreceni Egyetem intranetjén. A PolyMetáról hiányzik néhány, ma már alapvetőnek mondható funkció. Így például hasznos lenne, ha a keresőszavakra rss-csatornákat hozhatnánk létre - miként a Google News vagy a Yahoo News esetében -, vagy ha a találati oldalakra értelemszerű linkkel hivatkozhatnánk (pl. polymeta.hu/keres=egerek). Zavaró, hogy a PolyMeta egyáltalán nem perszonalizálható, vagyis hiába akarnánk mondjuk egyetlen weboldalra szűkíteni a találatok körét, vagy kihagyni a találatok elejéről a wikipediás szócikkeket, nincs rá lehetőségünk.

 

Mindent egybevetve a PolyMeta azok számára lehet vonzó alternatíva, akik kizárólag a magyar nyelvű webtartalmak közt akarnak mélykeresni, sok releváns találattal. Úgy tudjuk, rövidesen lesz külön fül a magyar és a teljes web keresésére, és a PolyMeta részéről van fogadókészség arra is, hogy a felületet a felhasználói visszajelzések figyelembevételével alakítsák. Talán még a mi álmunk is teljesül, és például külön a magyar blogoszférára szűkítve is kereshetünk majd, egyszer.

 

Forrás:index.hu

Link to comment
Share on other sites

Join the conversation

You can post now and register later. If you have an account, sign in now to post with your account.
Note: Your post will require moderator approval before it will be visible.

Guest
Unfortunately, your content contains terms that we do not allow. Please edit your content to remove the highlighted words below.
Hozzászólás a témához...

×   Pasted as rich text.   Paste as plain text instead

  Only 75 emoji are allowed.

×   Your link has been automatically embedded.   Display as a link instead

×   Your previous content has been restored.   Clear editor

×   You cannot paste images directly. Upload or insert images from URL.

 Share

  • Jelenleg olvassa   0 members

    • No registered users viewing this page.
×
×
  • Create New...