ÚJ IRÁNYZATOK A MŰSZER ÉS MÉRÉSTECHNIKÁBAN
 

Az Internet egy mérnök szemével I. rész

 

Korunkat a tudományos műszaki forradalom korának szokás nevezni. Ennek részeként zajlik napjainkban az információs forradalom. A rohamos fejlődés eredményeképpen az informatika abba a fázisba lépett, amelyre jellemző, hogy a gazdaságban és a mindennapi életben egyaránt lehetetlen a számítógépek alkalmazása nélkül boldogulni. Ma már nyilvánvaló, hogy senki sem tudja magát kivonni az Internet hatása alól. Az egyes szakmák képviselői más és más célból, különböző módszereket használva tájékozódnak, vagy tájékoztatnak az Internet-en. Még egy szűk réteg, a mérnöktársadalom is igen eltérő igényekkel fordul az Internet szolgáltatásai felé. Egy fejlesztő/tervező mérnök új építőelemek adatait vagy ötletadó megoldásokat keres a Web-en, míg egy termékeladással foglalkozó mérnök/üzletkötő saját honlap készítésével könnyítheti meg legjobban munkáját. Mindkét esetre igaz, hogy a hatékony Internet-használathoz ismerni kell bizonyos részleteket az Internet müködéséről, és ezek a részletek általában nehezen elérhetők. Az Internethez számtalan szakma kapcsolódik - pl. a távbeszélő- vagy kábel-TV szolgáltatók - és ezek érdeke éppenséggel nem az, hogy a felhasználók hatékonyan, gyorsan dolgozzanak a világhálón.

Az Internet legáltalánosabb használata az, amikor információt, adatot keresünk rajta. A különböző Internet-szolgáltatások együttesen használatával dolgozhatunk a leghatékonyabban. Lássunk erre egy példát! Tételezzük fel, hogy egy szabvány szerinti mérést kell elvégeznünk és a szabvány leírásában egy számunkra ismeretlen műszer szerepel, amelynek típusszámát a gyártó megnevezése nélkül adják meg. A típusszámot beírva egy keresőgép ablakába jó esély van arra, hogy az első találati oldalon megjelenjen a műszert gyártó cég honlapja. Azt megnyitva általában találunk egy rövid ismertetőt a műszerről, ha ez nem elég számunkra, akkor elektronikus levélen (E-levélen) keresztül kérhetünk bővebb információt. Erre jó esetben néhány óra alatt megérkezhet a válasz, amely egy DOC, vagy PDP kiterjesztésű Adobe Acrobat fájlban tartalmazza a műszer részletes leírását (1. ábra). Mindent összevetve egy délelőtt elegendő ahhoz, hogy részletes leírást kapjunk a műszerről. Néhány évvel ezelőtt a fenti szakmai probléma csaknem megoldhatatlan lett volna, illetve annak megoldása heteket vett volna igénybe.  

1. ábra. Műszerleírás továbbítása az Internet E-mail szolgáltatásával

 Az Internet hihetetlen ütemben növekvő, központi szervezés nélküli igen vegyes adatokat kezelő hálózat, amelyhez bárki vagy bármely szervezet csatlakozhat. A legtöbben a levelezési szolgáltatásokat használják, de egyre többen keresnek szakmai vagy közérdekű ismereteket, felvilágosítást az Internet fájlszerverein, újságcsoportjaiban is. Sokan a szabad információközlés alapköveként emlegetik az Internet-et és ebben sok igazság van. Vannak viszont árnyoldalai is az Internet-nek és erről sem szabad megfeledkeznünk. Jó tudnunk mi van a háttérben, ha bosszankodunk az Internet használatakor, ha lassú a keresés, ha sikertelenül keresünk adatokat a Web-en, vagy olyan e-levél (E-mail) üzenetet kapunk, amelyre a legkevésbé sem vágyunk. Ezekkel a kérdésekkel foglalkozunk a cikkben.

 

Web oldalak

A Web úgynevezett helyekből (website-okból) áll, amiket egy-egy cég, intézmény, társadalmi szervezet vagy magánember tart fenn. A fenntartó céljai határozzák meg a “hely” arculatát, tartalmát, formáját, hogy mit tesznek elérhetővé és milyen bontásban. Vannak igen hasznos adatokat tartalmazó értékes információ-források és vannak szép számban jól bevezetett és erőszakosan hírdetett helyek, ahol csak vesztegeti idejét az odalátogató. A Web oldalakat általában a HTML (HyperText Markup Language) nyelven írták. Ez a nyelv a következő lehetőségeket biztosítja a felhasználó számára: 

·        állandóan elérhető, számítógépen tárolt iratok létrehozása, címekkel, szöveggel, táblázatokkal, fotókkal stb.,

·        ismeretek lekérése  beültetett (hypertext) kapcsolatokon (linkeken) keresztül,

·        űrlapok (form-ok) használata, távoli számítógépek által nyújtott szolgáltatások igénybevételére, mint például információ keresése, termékek megrendelése stb.,

·        képjelenetek (videoklipek), zene/hang és más alkalmazások csatolása az oldalakhoz.

A HTML csomag a szövegen kívül tartalmaz formázóutasításokat (HTML-tag-eket), valamint megjelenítendő képelemekre történő hivatkozásokat is. Ezek a HTML formázóutasítások befolyásolják az oldalak megjelenítését, kapcsolatait. Ezeket az utasításokat a böngészőprogram értelmezi és hajtjavégre. A HTML utasítások köre állandóan bővül, a nyelv fejlődik. A szabványosítás csak lassan követi a fejlődést. Ezért nem minden böngészőprogram tudja a HTML utasítások mindegyikét értelmezni. Egy böngésző, ha számára értelmetlen utasítással találkozik, akkor kihagyja, így nem okoznak problémát az újabb keletű - még szabványosítatlan - utasítások a régebbi kiadású Web böngészőknek sem. A HTML csomagot a fejléc elemek vezetik be, itt szokásos megadni, a keresők számára az oldalcímet,  a készítő nevét, a létrehozó programot, rövid tartalmat stb. A fejlécutasításokra jellemző, hogy a böngésző ablakban nem jelennek meg.

A HTML nyelv fejlesztése ma is folyik, és minden újabb változat megjelenésével tovább nő a bonyolultsága: egyre összetettebb oldalak megjelenítésére alkalmas. A DHTML (Dynamic Hypertext Markup Language) a HTML kiterjesztése olyan új elemekkel, melyek a Web-oldalak tartalmának mozgalmasabbá tételét szolgálják (pl. mozgó feliratok, ábrák), így nincs szükség a lassabb Java vagy ActiveX programokra. A DHTML-t a régebbi Web böngésző programok nem támogatják.

A HTML szövegben, az aláhúzott kék színű szavakra kattintva az egérrel, átugorhatunk egy másik témára, vagy helyre, ami az adott szóhoz kötődik. A Web-en egy mutató (link) akár egy másik gépen levő fájl-ra is mutathat, így a felhasználó a mutatók láncolatát követve tetszőleges sorrendben barangolhat a hálózati információforrások között (2. ábra). Gyakran a kapcsolati pont nem egy aláhúzott szó, hanem egy kép. Az egérmutatót (pointer) a képernyőn a kapcsolati felületre mozgatva megnézhetjük, hogy hová lehet az adott helyről kerülni. Ilyenkor az egérmutató alakja megváltozik, egy mutató kéz lesz belőle. Ekkor a képernyő alján látható állapotsorból megtudhatjuk, hogy csak egy másik fájl kerül beolvasásra erről a szerverről, vagy átlépünk a Föld egy másik pontján levő gépre. Fontos fogalom ezzel kapcsolatban az URL (Uniform Resource Locator), amelyet az Interneten lévő különbözõ információforrások típusának és helyének egyedi megjelölésére használnak. Az URL tulajdonképpen egy fájl Internet címe. Az URL cím két részbõl áll: elsõ része a használt protokoll típusára utal (pl. news:// vagy ftp://), második része pedig a szolgáltatás pontos címe a hálózaton (kiszolgáló-név és az elérési útvonal); a Web-böngészés során az URL megadásával lehet elérni az egyes forrásokat az Interneten. Az URL hivatkozásokat tartalmazó hivatkozások (hiperlinkek) gyors elavulása az Internet egyik nagy problémája.  

2. ábra. Témakövetés hiperlink kapcsolattal különböző Web-lapokon

Sok esetben a hivatkozások mögött E-levél címek vannak, ezt szintén az állapotsorból olvashatjuk le. Ha ezekre kattintunk, akkor a saját levelezőprogramunk indul el, így levelet tudunk írni a megadott címre. A címzett adott, csak a levél tárgyát és szövegét kell beírni. Hangállományokat is letölthetünk a Web-ről wav, mid, mod stb. formátumban, és lehetőség van filmek megtekintésére is. A rádióhallgatást a Real Audio segédprogram teszi lehetővé - mint ez a nevéből is kitűnik - valós időben. Ezt a programot ma már megkapjuk a böngészőnkkel együtt.

 

A böngésző programok

Az Interneten az információ megjelenési formája sokféle lehet, írott szöveg, program, hang, kép, melynek forrása bárhol lehet a világon. A megjelenítés, az oldalak megtekintése a Web böngésző-, vagy felhasználó (kliens) programokkal történik, amilyen például a Netscape Navigator, az Internet Explorer, vagy a Mosaic. Ezek a fogadják a keresőkérdéseket, megteremtik az összeköttetést a kiszolgáló programokkal és ezeknek a válaszát megfelelő formában közvetítik a felhasználónak. Általánosságban elmondható, hogy a böngészők használata igen egyszerű, beállításuk viszont koránt sem az.  

A World Wide Web (WWW vagy Web) a kiszolgáló/felhasználó (szerver/kliens)elv alapján működik. Ez azt jelenti, hogy ha a Web-et használjuk, akkor tulajdonképpen két programot veszünk igénybe. A kiszolgáló program azon a számítógépes rendszeren fut, amelyik az elérni kívánt információt biztosítja. A felhasználó program, a böngésző jeleníti meg képernyőnkön az információkat, fogadja a billentyűvel és az egérrel végrehajtott műveleteket, valamint visszakeresi az igényelt információt a kiszolgálón. A Web-en történő keresések során a háttérben több különböző kiszolgáló kezeli igényeinket. Ha valamelyik irat hozzáférhetetlenné válik, akkor ennek egyik oka az lehet, hogy egy olyan kiszolgálóval próbáltuk meg fölvenni a kapcsolatot amelyik éppen nem üzemel.

A böngésző Web oldalakat jelenít meg, amelyeket a http (HyperText Transfer Protocoll) eljáráson alapuló kiszolgáló/felhasználó kapcsolaton keresztül kap. Ez a kapcsolat mindig a felhasználó (a böngésző) kezdeményezésére jön létre. Az oldal letöltésének és megjelenítésének folyamata a következő:

·        A böngésző megszólítja a Web kiszolgálót és egy TCP/IP adatátviteli csatornát hoz létre a böngésző és a kiszolgáló között.

·        A csatornán keresztül elküld egy http kérést a kiszolgálónak, amelyben meghatározza, hogy melyik oldalt szeretné letölteni.

·        A kiszolgáló értelmezi a kérést, előszedi az oldalt, vagy képet és egy http válaszban leküldi a böngészőnek. 

 

A böngészőbe kerülő  oldalak formátuma többnyire HTML, és lehetnek benne képek, amelyeket a bögésző külön vesz át és tárol, majd a HTML oldal-hoz tartozó utasítások szerint jelenít meg az oldalon. Ez lehetővé teszi, hogy a képeket könnyen elmentsük saját célra. 

Gyakran előfordul, hogy egy terjedelmes anyag, akár egy egész könyv teljes anyaga felkerül a Web-re. Ha a teljes anyagot végig akarjuk nézni, akkor ez sok lap letöltesét jelenti, ami hosszadalmas lehet. Az is előfordulhat, hogy többször kell ilyen terjedelmes iratban, vagy adatbázisban keresgélni. Ilyenkor - ha az terjedelmi szempontból megoldható - célszerű letölteni az oldalakat a saját gépünk merevlemezére.  Ebben segitenek az un. off-line web browser-ek, amelyek a letöltést gyorsan és önmüködően elvégzik, a hivatkozásokat helyi hivatkozásra cserelik stb. Egy jó off-line browser például a "WebStripper", ami ingyen letölthető a http://www.solentsoftware.com/webstripper/ címről. A helyi (off-line) böngészéskor azonban gondolni kell arra, hogy a letöltés általában csak egy adott oldalra terjed ki, annak kapcsolataira nem.

Az Internetre jellemző, hogy a felhasználó számára egyszerűnek tűnő műveletek mögött igen bonyolult technikai megoldások vannak. A legjobb példa erre magának az információátvitelnek a megoldása. A TCP/IP alapu rendszerben a küldendő információt un. datagrammokra tördelik, amelyeket aztán a hálózat egymástól teljesen különállóként kezel. A datagramm adatok együttese, amely egy egyszerű üzenetként kerül továbbításra. Az Internet hálózati protokollokat úgy tervezték, hogy a küldő és a vevő képes a datagramm méretet egyeztetni. A TCP kapcsolat felépítésekor mindkét oldal közli a másikkal az általa kezelhetõ maximális méretet, majd a továbbiakban a kisebbiket használják. A datagrammok egymástól függetlenül, egyesével indulnak útjukra. Az adatcsomagok esetleg több tucat hálózaton is keresztülmehetnek mielőtt a célállomásra érkeznének. Az ezt megvalósító útvonal-választás láthatatlan a felhasználó számára, abból mindössze egy Internet címet kell, hogy ismerjen. Minden datagrammnak van egy sorszáma, amely a vevő oldalt arról biztosítja, hogy minden adatot helyes sorrendben kapjon meg, és ne veszítsen el egyet se a datagrammok közül. A datagrammok átvitele közben a hálózaton semmi nem utal arra, hogy közöttük bármiféle kapcsolat is létezne; előfordulhat, hogy egy a sorrendben eredetileg hátrább álló megelőz egy előtte állót. A datagrammnak a rendeltetési helyre való megérkezését a vevő egy nyugtával hozza a küldő oldal tudomására. Ez a szám a datagramm TCP fejlécében egy nyugta mezőben jelenik meg. Az is lehetséges, hogy a hálózaton valahol hiba keletkezik és néhány datagramm nem érkezik meg a rendeltetési helyére. Amennyiben a küldő oldal egy adott időn belül nem kap nyugtát, akkor újból elküldi az adatot. Ez a látszólag bonyolúlt adatátviteli módszer a gyakorlatban igen jól bevált, ezt az Internet elterjedtsége fényesen bizonyítja.

 

Ha lassú a hálózat  

Felmérések szerint az Internet felhasználóinak mintegy 60%-a az adatátvitel lassúságát tartja a legzavaróbb problémának. Valóban a Web használata során gyakran alig győzzük kivárni, amíg a kért oldal megjelenik a képernyőnkön. A lassúság egyik oka lehet, hogy a Web-lap készítésekor nem gondoltak a letöltés szempontjaira, telezsúfolták azt képekkel, hátterekkel. Egy-egy gazdagon díszített színes oldal letöltése igen nagy mennyiségű adat átvitelét igényli.

A lassúság másik oka a nem megfelelő adatátviteli sebesség. Számítógépünk digitális jeleit az analóg távbeszélő-hálózatokon való átvitelhez át- és visszaalakító eszköz, ún. modem (MOdulator-DEModulator) alakítja át. A modemek sebességét bit/s-ban (bps) mérik, ez az egy másodperc alatt átvitt bitek száma. Rövid jelölésére használják az ezres előtaggal pl: 56 Kbps vagy csak 56 K-s. A modemek sebességének jellemzésére a velük elérhető legnagyobb átviteli sebesség értékét használjuk. A modemünk megfelelő átviteli sebessége, azonban még önmagában nem biztosíték arra, hogy gyors lesz az Internet kapcsolatunk. Az, hogy egy modemmel milyen gyorsan tudunk adatokat forgalmazni, függ a mi modemünktől, a vonal másik oldalán lévő modemtől, és az átviteli közeg (távbeszélővonal) minőségétől. Egy kis számolás. Pl. egy 33.6 K-s modem egy perc alatt 33600 bitet visz át. A modem sebessége bit/s-ban van megadva, a letöltés sebességét pedig Kbájt/s-ban számoljuk. Mivel 1 bájt=8 bit, de egy bájt átviteléhez kb. 11 bitre van szükség, mert van startbit, stopbit, meg paritásbit. Ez egy perc alatt 60x33.600=2.016.000 bit, azaz kb. 180 000 bájt vagyis 180 Kbájt. Ha Internetezni szeretnénk és a távbeszélővonalunk modern digitális központra csatlakozik, akkor mindenképpen 56 K-s modemet érdemes beszerezni. Abban az esetben, ha a távbeszélővonal minősége nem megfelelő, felvilágosítást kell kérni a helyi távbeszélő-szolgáltatótól, az esetleg jobb vonal bevezetéséről. Ha birtokunkban van az 56 K-s modem és elkezdjük a használatát, ne várjuk, hogy a kapcsolódási sebesség 56 K lesz. Ez általában 42...48 K között szokott változni. Ha a modemünk 56 K-s és a vonalunk rossz minőségű az adatátvitel kisebb sebességű lesz, pl: 33.6 K vagy akár 14.4 K. 

Egy további nyilvánvaló oka a lassúságnak, hogy csúcsidőben igen sokan használják a hálózatot, és a hazai távközlési vonalak átviteli kapacitása erősen korlátozott. A letöltés megkönnyítésére az internetszolgáltatók kisegítő feladatokat ellátó un. proxy kiszolgálót alkalmaznak, a forgalmat a nagyvilággal azon keresztül bonyolítják le. Ha egy előfizető letölt valamit, vagy csak egyszerűen böngészik egy Web-címen mondjuk távol Amerikában vagy Ausztráliában, akkor a szolgáltató rendszere azt letölti a proxy kiszolgáló merevlemezére. Ha valamelyik más előfizető néhány perccel később ugyanezt keresi, akkor már nem kell Amerikából, Ausztráliából stb. letölteni, mert az ott van helyben a kiszolgálón. A népszerű és gyakran látogatott helyek így sokkal gyorsabban elérhetőek. Ezáltal csökken a szolgáltató adatforgalma is a külvilág felé, ami neki költséget, a felhasználónak pedig időt (így szintén költséget) takarít meg. A proxy kiszolgáló többnyire földrajzilag valahol a felhasználó közelében van.

Ennek a megoldásnak, az átmeneti, vagy helyi tároló (cache), használatának előnyei és hátrányai vannak. 

Előnyök:

·        A Web oldalak elérése gyorsabbá válik, mivel elemzések szerint legalább minden ötödik letöltendő oldal már megtalálható az átmeneti tárolóban. Ezek, mivel az eredeti forrás nagy távolságra van, és nemzetközi vonalakon érhető csak el, sokkal gyorsabban érkeznek a helyi tárolóból. A többi adat esetében a letöltés sebessége ugyanakkora, mint átmeneti tároló használata nélkül. A proxy kiszolgáló működéséből adódó késleltetés ugyanis olyan kicsi hogy nem érzékelhető.

·        Csökken a belföldi és nemzetközi Internet vonalak túlterheltsége. Nagyon sok adat, ugyanis ahelyett hogy minden hozzáféréskor áthaladna ezeken a vonalakon, csak egyszer okoz forgalmat. A vonalak terheltségének csökkenése egyébként azt is jelenti, hogy a nem tárolt adatok elérése is gyorsulni fog!

·        A csökkent forgalommal ráadásul költségmegtakarítás érhető el. 

A helyi tároló használatának hátránya, hogy esetenként egy-egy WWW oldalnak nem a legfrissebb változatát kapjuk meg, hanem egy régebbit. Ez akkor fordulhat elő, ha az eredeti adatokat megváltoztatták azóta, amióta az az átmeneti tárba kerültek. Mivel az átmeneti tárak általában egy napig tárolják a HTML szövegeket majd szükség szerint újra frissítik, ez elsősorban a napi gyakorisággal változó oldalak esetén okozhat problémát. Sok fontos oldalt frissítenek naponta, így ez több felhasználót érinthet. Ha felmerülhet, hogy nem a legfrissebb változatot látjuk, és el akarjuk érni az érvényes oldal letöltését, a böngésző Frissítés (Reload) funkciójával ezt bármikor megtehetjük.

A proxy kiszolgálóknak emellett fontos biztonsági feladataik is vannak, tűzfalként szűrési feladatokat látnak el. Az Internet-es szóhasználatban a tűzfal olyan program vagy egység, amely a számítógép és az Internet között helyezkedik el, és a ki-be áramló adatcsomagokat megadott szabályok szerint szűri. Ennek az a célja, hogy megakadályozza az illetéktelenek behatolását példáúl egy belső vállalati hálózatba, illetve a belső hálózat felhasználóit korlátozza a munkájukkal nem kapcsolatos, egyéb tevékenységtől (tiltja az xxx-es oldalakat stb.). A manapság elterjedt trójai programok és más rossz szándékú üzenetek ellen ajánlatos még az otthoni számítógépekre is tűzfalprogramot telepíteni, abban az esetben, ha a gépet internetezésre is használjuk. Ha csak levelezésre használjuk, akkor felesleges, mert az alatt a pár perc alatt, amíg a levelek lejönnek, nem tud megtalálni, rákapcsolódni és a gépünkben kárt okozni senki, legalábbis nagyon kevés rá az esélye. Általában tűzfalon keresztül kapcsolódnak az Internet-hez a cégeken belüli un. Intranet hálózatok. Intranetnek akkor nevezzük a helyi hálózatot, amennyiben az Internet adatátviteli szabványt (TCP/IP) használja, és a helyi kiszolgálók Internetes adatközlő szolgáltatásokat (E-levél, www) nyújtanak.

A tűzfal program telepítésekor meg kell adnunk, hogy milyen típusú csomagokat, milyen programoktól, milyen címekre engedhet át, és melyeket nem. Ha olyan csomag jön, vagy megy, amire nem vonatkozik még szabály, akkor a tűzfal rákérdez, hogy ezzel most mit csináljon. Ilyen esetben egyedileg dönthetünk az adott csomag sorsáról (elfogadjuk vagy sem), de beállíthatjuk azt is, hogy mi történjen, ha később hasonló csomag érkezik. A hálózat sebességét észrevehetően nem befolyásolja a tűzfal beiktatása, mert "csak" annyit tesz, hogy pár tucat szabályból álló táblázatból kikeresi, hogy melyiknek felel meg a csomag, és ez alapján dönt a sorsáról. Ez pedig egy mai PC-nek nem túl nagy feladat.

 

Az Internet biztonsága

Az Internet egy igen szabad világ: különböző szervezetek, cégek, magánszemélyek nagyszámú szabadon elérhető programot, adatot tesznek elérhetővé honlapjaikon. Máig sincs az egész Internetre nézve kötelező felhasználási elv és biztonsági politika. Az ismeretközlés szabadságának az ára, hogy az Internetre felkerülő ismeretekért senki sem felel, hogy ez jó vagy sem, arra nem lehet egyértelmű választ adni. Az esetek túlnyomó többségében a felhasználó megbízik a kapott adatokban. Sajnos ennek a bizalomnak néha nincs alapja. Az elmúlt időszakban Internet-en hólabdaszerűen terjedő vírusok számítógépek százezreiben tették tönkre az adatokat.

Egy másik veszélye az Internet-nek az, hogy nagyon sokan nem rendeltetés szerint, vagy éppenséggel rosszhiszeműen használják az Internet-en elérhető adatainkat. A Web-en történő keresés a névtelenség látszatát kelti. A felhasználók jó része nem tudja, hogy könnyen legyűjthetők személyes adataik a hálóról. Nemcsak a hírcsoportokban leírt üzeneteket lehet könnyűszerrel katalógusba szedni, és nemcsak azt lehet kideríteni, hogy milyen Web-helyeket látogattunk rendszeresen, hanem elektronikus postánktól vásárlásainkig és banki ügyleteinkig minden tevékenységünk ki van szolgáltatva a rossz szándékú leselkedőknek. Az Internet egyre inkább az elektronikus adatvadászok paradicsomává válik. Ma már számtalan hely van, ahol temérdek telefonszámot és címet lehet kigyűjteni, másutt biztosítási számok, és jogosítványadatok tengerében keresgélhet az érdeklődő. Még a nyilvános hálózatokon zajló pénzügyi ügyletek sem teljesen védettek. Ennek oka részben a helyeket fenntartó cégek gyenge biztonsági rendszere, részben pedig az ügyfelek gondatlansága. Szerencsére vannak bizonyos eszközök, például titkosítás és a névtelenítő (anonim) postai közvetítő (remailer), amelyekkel a lehető legkevesebbre  csökkenthetjük annak veszélyét, hogy belelássanak személyes adatainkba. Megakadályozhatjuk azzal is, hogy a hálón való böngészés során nyomokat hagyjunk magunk után, ha névtelenítő helyeken (pl.  http://www.anonymizer.com) keresztül pásztázzuk a hálót (3. ábra). Ha ellátogatunk erre a helyre, figyelemfelkeltő meglepetésként megtekinthetjük adatainkat, amelyekhez bárki hozzáférhet az Internet-en keresztül. 

 

3. ábra. Névtelenítő hely honlapja

 

A cookie-k  

Nem minden Internet felhasználó tudja, hogy az adatok mellett néha másféle fájlok is kerülnek a gépébe, anélkül, hogy kérné azokat. Ezek a http üzenetek fejlécében rejtőznek, ahol sok járulékos adat foglalhat helyet. Adatkéréskor a böngésző általában elküldi a saját típusát, változat számát, és hogy milyen operációs rendszeren fut, így a kiszolgálók pontosan érzékelik, hogy ki használ Netscape Navigator, ki Internet Explorer vagy éppen valamilyen más böngészőt, és ezt felhasználva például különböző módon küldhetik el ugyanazt az adatcsomagot a különböző böngészőknek, kihasználva azok egyedi tulajdonságait. A http válasz fejlécében a kiszolgáló olyan adatokat küldhet, amelyek az oldal megjelenítését, tárolását, illetve a proxy kiszolgálókon keresztüli továbbítását vezérlik. Küldhet a fejlécben olyan állapot azonosító adatokat, amelyeket a böngésző a legközelebbi http kérés fejlécében visszaküldhet. Ezeket a rövid kódsorozatokat nevezik sütinek vagy bitsütinek, angolul cookie-nak. A cookie-k adatokat helyeznek el a felhasználó saját merevlemezén. Ezt a háttérben teszik, legtöbbször anélkül, hogy tudnánk róla. A felhasználók többsége csak azért tud egyáltalán a cookie-k létezéséről, mert bizonyos beállításban a Web böngésző programok engedélyt kérnek a cookie-k vételéhez (elfogadásához). A cookie egy szöveges, txt kiterjesztésű állomány, amely semmi különleges védelem alatt nem áll, a felhasználó minden következmény nélkül letörölheti azt. A cookie-nak van egy másik lényeges tulajdonsága: a lejárat ideje. Ezen idő után a böngésző nem foglalkozik tovább vele, úgy tekinti, mintha nem létezne.

A cookie elsősorban piacszervezési eszköz, amely arra szolgál, hogy a meglátogatott Web-helyek tulajdonosai felmérjék, milyen gyakran keressük fel a helyüket, és mit csinálunk ott. A látogatók felkérhetők nyilvántartásra (regisztrációra) és így adatbázis építhető fel a várható ügyfelekből. A cookie-ban tárolhatnak, pl. nyilvántartási adatokat (így nem kell azt mindig begépelnünk), eltárolhatják, hogy milyen nyelven olvassuk az oldalakat, hányszor jártunk az adott helyen stb.  A cookie-k képzik a vásárlókártyák alapját is az elektronikus kereskedelemben. A cookie-k adatokat adnak át minden egyes látogatáskor, így ebből kiderül a látogató érdeklődési köre, amit rossz esetben egy harmadik fél arra használhat fel, hogy célzott hirdetést küldjön. Mivel egyre jobban előtérbe kerül a személyi adatok védelme az Interneten, nem meglepő, hogy sokan nem szeretik a cookie-kat.

Mint már említettük böngészőnkben beállíthatjuk, hogy az hogyan fogadja a cookie-kat. Teljesen elutasíthatjuk őket, valamint lehetőség van minden egyes cookie átvétele előtt egy megerősítő kérdés feltételére, hogy az adott cookie létrehozását (vagy módosítását) engedélyezzük-e (4. ábra). Ha egy Web-helyen személyes adatokat kérnek tőlünk, megadhatunk hamis adatokat is. Így lemaradunk ugyan a különféle kedvezményekről, amelyekkel a helyek kecsegtetnek bennünket, de magánéletünk és személyiségi jogaink védelme ennyit feltétlenül megér.  

4. ábra. Cookie-k ellenőrzését beállító menű az Internet Explorer böngészőben

Napról napra többen használják a világhálót és ezzel együtt rohamosan nő a rendszeren áthaladó személyes adatok mennyisége. Sajnos az elektronikus társalgókban és hírcsoportokban magántitok egyszerűen nem létezik. Valahányszor feladunk egy postai üzenetet, felkeresünk egy Web-helyet, üzenetet küldünk egy hírcsoportnak vagy vásárlásra használjuk az Internetet, kellő óvintézkedések híján kiszolgáltatjuk magunkat a figyelő szemeknek. Közzétett üzeneteinket nemcsak a címzettek olvashatják, hanem bárki, aki hónapok vagy évek múlva előkeresi őket egy engedély nélkül készített adatbázisból. Az olyan helyek, mint például a DejaNews vagy akár az Alta Vista, lehetővé teszik az az Internet-en adatokat vadászóknak, hogy név alapján adatainkat, tevékenységünkkel kapcsolatos ismereteket egybegyűjtsék. Személyazonosságunkat azért is érdemes titokban tartani, mert így az elektronikus postán érkező vásárlási ajánlatok tömegétől is megmenekülhetünk. Szerencsére több módszer is van arra, hogy eltitkoljuk a kilétünket, például a már említett postai közvetítőt (remailert) kell használnunk, amely elfedi az elektronikus üzenet fejlécét, így a feladó neve és címe gyakorlatilag kideríthetetlenné válik. Ha valaki választ küld a kódolt címre, ténylegesen a postai közvetítőhöz juttatja el üzenetét, amely minden küldeményt továbbít hozzánk.

 

Keresőgépek

Az Interneten hatalmas mennyiségű adat és ismeret érhető el, kevés kivétellel ingyen. Nem könnyű viszont hozzáférni a szükséges adatokhoz, ugyanis az Internet kötetlen szerveződése révén nincs központi adatbázis. A felhasználónak ezért az egyik legfontosabb kérdés az, hogy milyen könnyen találja meg a számára szükséges szolgáltatást, címet, ismeretet.

Az Internet legfontosabb és legnépszerűbb szolgáltatásai közé tartoznak világszerte a keresőgépek, amelyek lehetővé teszik, hogy a világhálón megjelenő legkülönbözőbb oldalak között megtaláljuk azokat, amelyekre valóban szükségünk van, amelyek valóban érdekelnek bennünket az immár szinte beláthatatlan információtengerben. Az amerikai  GVU (Graphic, Visualization, & Usability Center) felmérése szerint a Web használók mintegy 85%-a használja a keresőgépek szolgáltatásait. A felmérés arra is rámutatott, hogy a jelenleg működő keresőgépeknek sok hiányosságuk van, kívánnivalót hagy maga után az adatok érvényessége (aktualitása), és nem megfelelő a lefedett terület sem.

A keresők fenntartását hírdetésekből oldják meg. A keresők igen alkalmas helyek hírdetés-csíkok (banner-ek) elhelyezésére. Egy keresőkérdés akár több ezer találatot is eredményezhet így sok oldal egyszerűen elkallódik a hasonló tartalmú oldalak rengetegében. Különleges módszerek léteznek arra, hogy a keresőprogramok egy adott Web-oldalt a találati lista első elemei között tüntessenek fel, ahol jó esély van rá, hogy a fogyasztó betér oda. Az egyes címek kiemelt kezelése külön bevételi forrást jelent a keresőprogramok üzemeltetőinek.


Magyar keresők

AltaVizsla. A MATÁV Rt. és a Digital Magyarország Kft. együttműködése eredményeként 1998 májusában megindult AltaVizsla magyar nyelvű kezelőfelülettel, a magyar nyelvű tartalmakra összpontosítva segíti az Internet-en való eligazodást. Az AltaVizsla 1999. júliusától egyesült a MATÁVnet legfontosabb Internet-es tartalomszolgáltatásával, az [origo]-val. Ezzel nemcsak a megszokott keresésre nyílik lehetőség. 24 órás hírszolgáltatás és téma szerinti ugrópontok segítenek azoknak, akik szavak és kifejezések helyett inkább az egyes témákhoz tartozó Web-oldalakat keresik az Internet-en.

A World Wide Web-en a http://www.origo.hu címen elérhető AltaVizsla az erre a célra készített szoftverek segítségével rendszeresen "átolvassa"  a World Wide Web magyar tartományának (.hu domain) teljes egészét. A szolgáltatás naponta új tárgymutatót (indexet) készít, tehát a szó szoros értelmében naprakész, s lehetőséget ad arra, hogy nyomon kövessük a magyar oldalak változásait, bővülését. Az AltaVizsla tárgymutatatója már a szolgáltatás indulásakor több mint kétszer annyi oldalt tartalmazott, mint az amerikai AltaVista magyar jegyzéke. Ide kivánkozik az a személyes megjegyzés, hogy az Alta Vistán találhatunk olyan magyar anyagot, amely nem található meg magyar keresőkkel.

Az AltaVizslán lehetőség van egyszerű és összetett, logikai elemekből felépített keresések végrehajtására, a már megkezdett keresések szűkítésére, bővítésére, kiegészítésére ugyanúgy, mint a különböző ismerethordozókra (képek, hangok) való keresésre. Több szó megadása eseten a keresőprogram önmüködően ÉS műveletet feltételez. Ez azt jelenti, hogy csak olyan lapok fognak találatként megjelenni, amelyeken az összes keresendő szó szerepel.

A felhasználók lehetőséget kapnak arra is, hogy saját oldalaikra felhívják az AltaVizsla figyelmét az "URL hozzáadása" művelet segítségével, valamint a honlapok fenntartói rákereshetnek arra is: hány más oldalról mutatnak kapcsolók a saját oldalaikra. Saját tapasztalat szerint jó néhány nap esetlég hét is eltelik a figyelem felhívástól, amíg honlapunkat feldolgozza a kereső.


HuDir. A megújult HuDir-ral (http://www.hudir.hu) kétféleképpen kereshetünk. Az egyik változat a hagyományos keresés szavak, illetve kifejezések alapján. Az ehhez tartozó beviteli mezőt és a keresést indító gombot a HuDir valamennyi képernyőjén megtalálható. A másik változat, a tárgykörönkénti keresés kiindulási pontjai a HuDir nyitóképernyőjén láthatók. Ez a keresési mód lényegében olyan, mint egy fa szerkezete: elágazások segítségével kereshetünk rajta. Ha kiválasztottuk a megfelelő kiinduló "faágat", a következő képernyő bal oldalán megtaláljuk a további elágazásait és azokat az Internet-es helyeket is, amelyek megfelelnek annak az elágazási pontnak. Ha ezekre a mutatókra, amelyek a képernyő nagyobb részét elfoglalják, rákattintunk, közvetlenül is elérhetjük a számunkra érdekes Internet-es honlapokat. Ha az mutatók száma meghaladja a húszat, akkor több, egymást követő lapra kerülnek. Ha az adott elágazáshoz tartozó mutatógyűjteményben nem találjuk a számunkra érdekes honlapot, a baloldali tárgykörlistából választhatjuk ki a megfelelő "al-tárgykört", így a faszerkezet további elágazásaihoz juthatunk el.

Heuréka. A Heuréka (http://www.heureka.hu) is a magyar Web-en keres. Megpróbál összegyűjteni minden magyarországi, illetve magyar vonatkozású iratot, és önmüködően, rendszeres időközönként adatbázisába dolgozza az új oldalakat. Az adatbázis állandóan bővül. Természetesen előfordulhat, hogy egyes oldalak kimaradnak az adatbázisból, vagy nem a legújabb változatuk szerepel abban. Ez laponként erősen változó lehet, sok tényező befolyásolja. Az is előfordulhat, hogy ugyanazt a lapot nem egyenletes időközökben keresi fel a Heuréka. Átlagosan 2-3 hetenként látogat el a leszedőrobot egy-egy Web-lapra. Vannak azonban olyan oldalak is, amelyeket a Heuréka naponta frissít - ezek között keresünk, amikor a "friss" adatbázist választjuk ki.

A Heuréka keresőrendszerrel jelenleg két csoportban kereshetünk:

·        A magyar lapok csoport kijelölésével a viszonylag ritkán változó lapok között kereshetünk,

·        A friss lapok  kiválasztásával a naponta frissülő oldalakon kereshetünk.

Kereshetünk egyszerre mindkét csoportban is, ilyenkor jelöljük ki mindkét kapcsolómezőt. Ez egyben az alapbeállítás is. Például, ha a napilapok friss hírei között szeretnénk megkeresni azokat az oldalakat, amelyek tartalmaznak művelődés kezdetű szavakat, akkor válasszuk a friss lapokat, és írjuk be a művelődés* kereső-kifejezést! 

 

A keresőgépek összehasonlítása

1984-ben, amikor az Internet még gyerekcipőben járt, a Lycos keresőgép adatbázisa összesen 54 000 weboldalt jegyzett. 2000-ben a BrightPlanet (http://www.brightplanet.com) elemzése szerint mintegy 550 milliárd (!) honlap érhető el az Internet-en, amely az eddigi becsléseket jócskán meghaladja. A tanulmány azt is megállapította, hogy a világháló korántsem annyira egységes, mint amilyennek látszik; a látogatók nagy része jól meghatározható csomópontokba tömörül. Azok a weboldalak, amelyek a csomópontot, a magot alkotják, csupán a teljes hálózat 30 százalékát képviselik. Ezek azok az oldalak, amelyek a világháló bármely pontjáról elérhetőek, és rengeteg más weboldalra lehet a segítségükkel eljutni. Zömében a nagy hírszolgáltatók, keresők és népszerű, gazdag tartalommal rendelkező weboldalak tartoznak ehhez körhöz. Az Internet egyes részei között kevés kapcsolatot találtak a kutatók, a sűrűn keresett oldalakon kívül rengeteg kapcsolat nélküli magányos sziget úszik az információs űrben, amelyek nem mutatnak sehova, és rájuk sem hivatkozik igazán senki.

A keresőgépek többsége  az egész hálón keres (pl. AltaVista, Yahoo!), kisebbik része adott országra vagy meghatározott nyelvre korlátozza a gyűjtőkörét (pl. AltaVizsla, HuDir). Egy részük egyetemes, azaz minden fajta és mindenféle tartalmú HTML-oldal a gyűjtőkörükbe tartozik, másik részük csak adott tartalmú, vagy adott típusú HTML-lapokkal foglalkoznak. Egyes keresők a gyorsaságukkal, mások a keresési eszközök gazdagságával, megint mások a feldolgozott állomány nagyságával tűnnek ki. Tárgyszerűség szempontjából vannak megbízhatóbbak és kevésbé megbízhatóak. Gyakran jelennek meg elemzések a hálón, melyekből tájékozódni lehet a különböző keresők hatékonyságáról, de még nem alakultak ki megbízható tudományos módszerek az értékelésre  (5. és 6. ábrák).  

5. ábra. A legnagyobb keresőgépek indexelt laptartománya, millió lapra. Röviditések: AV=AltaVista, FAST=FAST, NL=Northern Light, GG=Google, EX=Excite, INK=Inktomi, Go=Go (Infoseek), LY=Lycos (2000.júniusi állapot)

6. ábra. A legnagyobb keresőgépek tartománya a Web becsült teljes lapállományának százalékában (2000.júniusi állapot)

Az ismeretek keresése és osztályozása szempontjából a keresőszolgáltatások két fő típusa alakult ki: a tárgymutatót készítő (indexelő) szolgáltatások és az Internet-katalógusok. Külön csoportba tartozik az egyik kifinomultabb keresőgép a Google, amely azokat a lapokat keresi, amelyeket az adott témában a legtöbben használnak. Ez a kereső minden hónapban megvizsgálja a Web-lapokat, hogy frissítse könyvtárszolgáltatását, és a legfrissebb, legtartalmasabb honlapok legyenek ott. A vállalat legutóbbi keresésén 200 millió honlapot regisztrált. A Google 1998 szeptemberében alakult meg, a cég 90 embert foglalkoztat.

A keresőgépek elsődlegesen mindig a Web-lap címet értékelik, majd ezt követően a megadott kulcsszavakat (keywords), a megadott leírást (description) és legvégül az oldal szövegében előforduló szavakat. A HTML nyelv az úgynevezett címkékkel („tag")-ekkel mondja a böngészőnek, hogy mit és hogyan jelenítsen meg. A "tag"-ek a HTML iratokban szereplő, azok szerkezetét és megjelenését jelölő címkék. Minden címke < > karakterek közé van zárva.  Többségükhöz egy / karakterrel kezdődő lezáró tag is tartozik, amely az illető utasítás érvényességi határát jelzi a megjelenítést végző Web-böngésző számára. Ha a böngésző bizonyos címkét észlel, akkor azt értelmezi majd az utasításnak megfelelően megjeleníti.

A kereső szolgáltatások teljesítménye és találat oldalaik tartalma nagymértékben különbözik egymástól, ami a felhasználót arra ösztönzi, hogy a lehető legnagyobb lefedés érdekében az un. meta-keresőszolgáltatásokhoz (metasearch engines) forduljon. Ezekkel egyszerre több  keresőszolgáltatásban lehet keresni anélkül, hogy a felhasználónak az egyes szolgáltatásokkal külön foglalkoznia kellene. 

 

Fontosabb általános célú kereső gépek a világhálón

GOOGLE-típusú keresők 
Google http://www.google.com/
FastSearch                     http://www.ussc.alltheWeb.com/
Kulcsszavas keresők 
Infoseek                         http://www.go.com/
Excite                            http://www.excite.com/
Lycos           http://www.lycos.com/
AOL NetFind                http://www.nami.org/search.htm
HotBot                          http://hotbot.lycos.com/
LookSmart                    http://www.looksmart.com/
Northern Light             http://www.northernlight.com/
AltaVista http://www.altavista.com/
Tárgy-katalógusok
Yahoo                           http://dir.yahoo.com/
WebCrawler                 http://www.Webcrawler.com/
EINet Galaxy                http://galaxy.einet.net/
Magellan                       http://magellan.excite.com/
NetGuide                      http://www.netguide.com/
Mining Company http://www.miningco.com/
Metakeresők
All4OneSearchMachine http://www.all4one.com/
DogPile                                     http://www.dogpile.com/
Highway61                                http://www.highway61.com/
HuskySearch                             http://huskysearch.cs.washington.edu/
Inference Find http://www.infind.com/
MetaCrawler http://www.metacrawler.com/index.HTML
SavvySearch                             http://www.savvysearch.com/search
Ask Jeeves! http://www.ask.com/

 

Miért nem adnak megfelelő eredményeket a kereső gépek?

Ha valaki sokat használja a keresőgépeket azt tapasztalja, hogy bizonyos esetekben meglepően jó eredményt adnak, máskor szinte értéktelen a keresés eredménye még akkor is, ha a keresési feltétel megfelelő volt. Két alapvető probléma szokott előfordulni: a túl sok találat (high recall) és a hasznos oldalak hiánya (low precision). A keresőgépeket üzemeltető cégek az előbbit nem tekintik igazi hibának, hiszen egész üzleti célkitűzésük a teljes körű lefedettség hirdetésén alapul. Az amerikai kormány által létrehozott informatikai munkacsoport (WGGIN) megállapításai alapján a Web keresések eredménytelensége az alábbi fő okokra vezethető vissza:

·        A keresőgépek az egyes címeken lévő lapoknak csak egy részét - a felső két-három szintet - vizsgálják, pedig gyakran a fontos iratok az olcsóbb szinteken találhatók.

·        A keresőgépek, különösen a legnagyobbak szabálytalan időközökben látogatják újra a címeket, ezért sok esetben elavult adatokat adnak ki.

·        Értékes adatok kerülnek ki a keresésből, mert azokat nem HTML alakban vitték fel a Web-re (pl. ábrák, adatbázisok, vagy PDF fájlok formájában).

·        A keresőgépek nem odavágó, vagy lényegtelen oldalakat adnak ki, mert nem tudják megkülönböztetni a jellemző és jelentéktelen szavakat az iratokban.

A két utóbbi probléma nemcsak a keresés eljárásmódjával kapcsolatos, hanem az adatok felvitelét a honlapok készítését is érinti. A metaadatok használata lényegesen javítana ezen a helyzeten. A metaadatokkal rendszerezett formában írható le a Web-lapok adattartalma és ez nagymértékben megkönnyíti, biztosabbá teszi azok elérését az érdeklődők számára. A <META> tagot a böngésző alapállapotban nem jeleníti meg, csak ha belépünk Forrás (Page Source) menüpontba. Sajnos ma még a keresőgépek sem használják ki az új metaadat-szabvány kínálta lehetőségeket és ezért a Web-lapok készítői sem fektetnek be munkát a részletes kódolásba. Úgy is mondhatnánk, hogy a "tojás vagy tyúk" helyzet állt elő.

Összefoglalóan elmondhatjuk, hogy a keresőszolgáltatások találatai rendkívül vegyes minőségűek lehetnek. Gyakori, hogy már nincs is mögöttük élő tartalomszolgáltatás, sokszor ugyanannak a HTML-oldal különböző időpontokból származó változata jelenik meg, és a találatok túlnyomó többsége sok esetben érdektelen a felhasználó számára, mivel a tárgymutatóban szereplő szó nem a HTML-lap valódi tartalmát képviseli. Ennek egyik oka, hogy a kereskedelmi tartalomszolgáltatók HTML-oldalaik címfejébe olyan kifejezéseket is elhelyeznek, melyek valójában nem igazán jellemzik a lapjukat, de amelyekről tudják, hogy a gyakran keresettek közé tartoznak. Így a kereső különlegesen értékes találatként értékeli, és a találati listán a legelső helyeken jeleníti meg azokat. Ez nem más, mint egyszerű félrevezetés. A fő baj mindebben az, hogy felhasználó értetlenül áll az ilyen találatok előtt és saját magát okolja a rossz keresési feltétel megadás miatt.

 

*   *   *

Az Internet nem azonos a World Wide Web-el. Míg az Internet egy számítógépes hálózat összefoglaló neve, addig a World Wide Web sok más alkalmazás közül az egyik - igaz, a legnagyobb mértékben elterjedt - alkalmazása ennek a hálózatnak. A cikksorozat következő részében a többi Internet-alkalmazásról szeretnénk írni.  

Radnai Rudolf

Irodalom

1. Ungváry Rudolf: A tartalom szerinti információkeresés az Interneten. I. Indexelőszolgáltatások c. cikkéből. Tudományos és Műszaki Tájékoztatás 47. évf., 1. sz., 2000. 3-19.

2. Numbers, Numbers -- But What Do They Mean?The SearchEngine ReportMarch 3, 2000

3. Steve Lawrence and C. Lee Giles: Accessibility of information on the Web, Nature, Vol. 400, pp. 107-109, 1999.

4. [DC2] A user guide for simple Dublin Core: draft version 5.1. July, 1998. http://128.253.70.110/DC5/UserGuide5.html

5. Iannella, R.: An idiot's guide to the resource description framework. DSTC, November, 1998. http://www.dstc.edu.au/RDU/reports/RDF-Idiot/

6. LaVen] Dublin Core and Z39.50., OCLC, February,1998. http://cypress.dev.oclc.org/

7.  MetaWeb Project Analysis of Metadata Creation Tools. June, 1998. http://www.dstc.edu.au/RDU/MetaWeb/

8. Search Engine Watch. Search Engine Feature Company. 1998. http://searchenginewatch.com/webmasters/features.html

9. Füstös János: World Wide Web, Szak kiadó Kft., Bicske 1996 

10. Galántai Zoltán, Komáromy Gábor: Web Page saját kezűleg, Virgil kiadó Bt., 1997

11. Miklós Viktor: Web lap szerkesztés mindenkinek, Cesare&Cserő Bt., 1996

12. Kris Jamsa, Suleiman Lalani, Steve Weakley: A Web programozása, Kossuth kiadó 1997

 

 

A laprendszer készítője: UFE Bt.