ÚJ IRÁNYZATOK A MŰSZER ÉS MÉRÉSTECHNIKÁBAN |
Az Internet egy mérnök szemével I. rész
Korunkat a tudományos műszaki forradalom korának szokás nevezni. Ennek részeként zajlik napjainkban az információs forradalom. A rohamos fejlődés eredményeképpen az informatika abba a fázisba lépett, amelyre jellemző, hogy a gazdaságban és a mindennapi életben egyaránt lehetetlen a számítógépek alkalmazása nélkül boldogulni. Ma már nyilvánvaló, hogy senki sem tudja magát kivonni az Internet hatása alól. Az egyes szakmák képviselői más és más célból, különböző módszereket használva tájékozódnak, vagy tájékoztatnak az Internet-en. Még egy szűk réteg, a mérnöktársadalom is igen eltérő igényekkel fordul az Internet szolgáltatásai felé. Egy fejlesztő/tervező mérnök új építőelemek adatait vagy ötletadó megoldásokat keres a Web-en, míg egy termékeladással foglalkozó mérnök/üzletkötő saját honlap készítésével könnyítheti meg legjobban munkáját. Mindkét esetre igaz, hogy a hatékony Internet-használathoz ismerni kell bizonyos részleteket az Internet müködéséről, és ezek a részletek általában nehezen elérhetők. Az Internethez számtalan szakma kapcsolódik - pl. a távbeszélő- vagy kábel-TV szolgáltatók - és ezek érdeke éppenséggel nem az, hogy a felhasználók hatékonyan, gyorsan dolgozzanak a világhálón.
Az
Internet legáltalánosabb használata az, amikor információt, adatot keresünk
rajta. A különböző Internet-szolgáltatások együttesen használatával
dolgozhatunk a leghatékonyabban. Lássunk erre egy példát! Tételezzük fel,
hogy egy szabvány szerinti mérést kell elvégeznünk és a szabvány leírásában
egy számunkra ismeretlen műszer szerepel, amelynek típusszámát a gyártó
megnevezése nélkül adják meg. A típusszámot beírva egy keresőgép
ablakába jó esély van arra, hogy az első találati oldalon megjelenjen a
műszert gyártó cég honlapja. Azt megnyitva általában találunk egy rövid
ismertetőt a műszerről, ha ez nem elég számunkra, akkor
elektronikus levélen (E-levélen) keresztül kérhetünk bővebb információt.
Erre jó esetben néhány óra alatt megérkezhet a válasz, amely egy DOC, vagy
PDP kiterjesztésű Adobe Acrobat fájlban tartalmazza a műszer részletes
leírását (1. ábra). Mindent összevetve egy délelőtt elegendő
ahhoz, hogy részletes leírást kapjunk a műszerről. Néhány évvel
ezelőtt a fenti szakmai probléma csaknem megoldhatatlan lett volna,
illetve annak megoldása heteket vett volna igénybe.
1. ábra. Műszerleírás továbbítása az Internet E-mail szolgáltatásával
Az Internet hihetetlen ütemben növekvő, központi szervezés nélküli igen vegyes adatokat kezelő hálózat, amelyhez bárki vagy bármely szervezet csatlakozhat. A legtöbben a levelezési szolgáltatásokat használják, de egyre többen keresnek szakmai vagy közérdekű ismereteket, felvilágosítást az Internet fájlszerverein, újságcsoportjaiban is. Sokan a szabad információközlés alapköveként emlegetik az Internet-et és ebben sok igazság van. Vannak viszont árnyoldalai is az Internet-nek és erről sem szabad megfeledkeznünk. Jó tudnunk mi van a háttérben, ha bosszankodunk az Internet használatakor, ha lassú a keresés, ha sikertelenül keresünk adatokat a Web-en, vagy olyan e-levél (E-mail) üzenetet kapunk, amelyre a legkevésbé sem vágyunk. Ezekkel a kérdésekkel foglalkozunk a cikkben.
Web
oldalak
A
Web úgynevezett helyekből (website-okból) áll, amiket egy-egy cég, intézmény,
társadalmi szervezet vagy magánember tart fenn. A fenntartó céljai határozzák
meg a “hely” arculatát, tartalmát, formáját, hogy mit tesznek elérhetővé
és milyen bontásban. Vannak igen hasznos adatokat tartalmazó értékes információ-források
és vannak szép számban jól bevezetett és erőszakosan hírdetett helyek,
ahol csak vesztegeti idejét az odalátogató. A Web oldalakat általában a HTML
(HyperText Markup Language) nyelven írták. Ez a nyelv a következő
lehetőségeket biztosítja a felhasználó számára:
·
állandóan elérhető,
számítógépen tárolt iratok létrehozása, címekkel, szöveggel,
táblázatokkal, fotókkal stb.,
·
ismeretek lekérése
beültetett (hypertext) kapcsolatokon
(linkeken) keresztül,
·
űrlapok
(form-ok) használata, távoli
számítógépek által nyújtott szolgáltatások igénybevételére, mint
például információ keresése, termékek megrendelése stb.,
·
képjelenetek (videoklipek),
zene/hang és más alkalmazások csatolása
az oldalakhoz.
A
HTML csomag a szövegen kívül tartalmaz formázóutasításokat (HTML-tag-eket),
valamint megjelenítendő képelemekre történő hivatkozásokat is.
Ezek a HTML formázóutasítások befolyásolják az oldalak megjelenítését,
kapcsolatait. Ezeket az utasításokat a böngészőprogram értelmezi és
hajtjavégre. A HTML utasítások köre állandóan bővül, a nyelv fejlődik.
A szabványosítás csak lassan követi a fejlődést. Ezért nem minden
böngészőprogram tudja a HTML utasítások mindegyikét értelmezni. Egy
böngésző, ha számára értelmetlen utasítással találkozik, akkor
kihagyja, így nem okoznak problémát az újabb keletű - még
szabványosítatlan - utasítások a régebbi kiadású Web böngészőknek
sem. A HTML csomagot a fejléc elemek vezetik be, itt szokásos megadni, a keresők
számára az oldalcímet, a
készítő nevét, a létrehozó programot, rövid tartalmat stb. A
fejlécutasításokra jellemző, hogy a böngésző ablakban nem
jelennek meg.
A
HTML nyelv fejlesztése ma is folyik, és minden újabb változat
megjelenésével tovább nő a bonyolultsága: egyre összetettebb oldalak
megjelenítésére alkalmas. A DHTML (Dynamic Hypertext Markup Language) a HTML
kiterjesztése olyan új elemekkel, melyek a Web-oldalak tartalmának
mozgalmasabbá tételét szolgálják (pl. mozgó feliratok, ábrák), így
nincs szükség a lassabb Java vagy ActiveX programokra. A DHTML-t a régebbi
Web böngésző programok nem támogatják.
A
HTML szövegben, az aláhúzott kék színű szavakra kattintva az egérrel,
átugorhatunk egy másik témára, vagy helyre, ami az adott szóhoz kötődik.
A Web-en egy mutató (link) akár egy másik gépen levő fájl-ra is
mutathat, így a felhasználó a mutatók láncolatát követve tetszőleges
sorrendben barangolhat a hálózati információforrások között (2. ábra).
Gyakran a kapcsolati pont nem egy aláhúzott szó, hanem egy kép. Az
egérmutatót (pointer) a képernyőn a kapcsolati felületre mozgatva
megnézhetjük, hogy hová lehet az adott helyről kerülni. Ilyenkor az
egérmutató alakja megváltozik, egy mutató kéz lesz belőle. Ekkor a
képernyő alján látható állapotsorból megtudhatjuk, hogy csak egy
másik fájl kerül beolvasásra erről a szerverről, vagy átlépünk
a Föld egy másik pontján levő gépre. Fontos fogalom ezzel kapcsolatban
az URL (Uniform Resource Locator), amelyet az Interneten lévő
különbözõ információforrások típusának és helyének egyedi
megjelölésére használnak. Az URL tulajdonképpen egy
fájl Internet címe. Az URL cím két részbõl áll:
elsõ része a használt protokoll típusára utal (pl. news:// vagy ftp://),
második része pedig a szolgáltatás pontos címe a hálózaton (kiszolgáló-név
és az elérési útvonal); a Web-böngészés során az URL megadásával lehet
elérni az egyes forrásokat az Interneten. Az URL hivatkozásokat
tartalmazó hivatkozások (hiperlinkek) gyors elavulása az Internet egyik nagy
problémája.
2. ábra. Témakövetés hiperlink kapcsolattal különböző Web-lapokon
Sok
esetben a hivatkozások mögött E-levél címek vannak, ezt szintén az
állapotsorból olvashatjuk le. Ha ezekre kattintunk, akkor a saját levelezőprogramunk
indul el, így levelet tudunk írni a megadott címre. A címzett adott, csak a
levél tárgyát és szövegét kell beírni. Hangállományokat is
letölthetünk a Web-ről wav, mid, mod stb. formátumban, és lehetőség
van filmek megtekintésére is. A rádióhallgatást a Real Audio segédprogram
teszi lehetővé - mint ez a nevéből is kitűnik - valós időben.
Ezt a programot ma már megkapjuk a böngészőnkkel együtt.
A böngésző programok
Az Interneten az
információ megjelenési formája sokféle lehet, írott szöveg, program,
hang, kép, melynek forrása bárhol lehet a világon. A megjelenítés, az oldalak
megtekintése a Web böngésző-, vagy felhasználó (kliens) programokkal történik,
amilyen például a Netscape Navigator, az Internet Explorer, vagy a Mosaic.
Ezek a fogadják a keresőkérdéseket, megteremtik az összeköttetést a
kiszolgáló programokkal és ezeknek a válaszát megfelelő formában közvetítik
a felhasználónak. Általánosságban elmondható, hogy a böngészők
használata igen egyszerű, beállításuk viszont koránt sem az.
A
World Wide Web (WWW vagy Web) a kiszolgáló/felhasználó (szerver/kliens)elv
alapján működik. Ez azt jelenti, hogy ha a Web-et használjuk, akkor
tulajdonképpen két programot veszünk igénybe. A kiszolgáló program azon a
számítógépes rendszeren fut, amelyik az elérni kívánt információt
biztosítja. A felhasználó program, a böngésző jeleníti meg képernyőnkön
az információkat, fogadja a billentyűvel és az egérrel végrehajtott műveleteket,
valamint visszakeresi az igényelt információt a kiszolgálón.
A Web-en történő keresések során a háttérben
több különböző kiszolgáló kezeli igényeinket. Ha valamelyik irat
hozzáférhetetlenné válik, akkor ennek egyik oka az lehet, hogy egy olyan
kiszolgálóval próbáltuk meg fölvenni a kapcsolatot amelyik éppen nem üzemel.
A
böngésző Web oldalakat jelenít meg, amelyeket a http (HyperText Transfer
Protocoll) eljáráson alapuló kiszolgáló/felhasználó kapcsolaton keresztül
kap. Ez a kapcsolat mindig a felhasználó (a böngésző) kezdeményezésére
jön létre. Az oldal letöltésének és megjelenítésének folyamata a következő:
·
A böngésző megszólítja
a Web kiszolgálót és egy TCP/IP adatátviteli csatornát hoz létre a böngésző
és a kiszolgáló között.
·
A csatornán keresztül elküld
egy http kérést a kiszolgálónak, amelyben meghatározza, hogy melyik oldalt
szeretné letölteni.
· A kiszolgáló értelmezi a kérést, előszedi az oldalt, vagy képet és egy http válaszban leküldi a böngészőnek.
A böngészőbe kerülő oldalak formátuma többnyire HTML, és lehetnek benne képek, amelyeket a bögésző külön vesz át és tárol, majd a HTML oldal-hoz tartozó utasítások szerint jelenít meg az oldalon. Ez lehetővé teszi, hogy a képeket könnyen elmentsük saját célra.
Gyakran
előfordul, hogy egy terjedelmes anyag, akár egy egész könyv teljes
anyaga felkerül a Web-re. Ha a teljes anyagot végig akarjuk nézni, akkor ez
sok lap letöltesét jelenti, ami hosszadalmas lehet. Az is előfordulhat,
hogy többször kell ilyen terjedelmes iratban, vagy adatbázisban keresgélni.
Ilyenkor - ha az terjedelmi szempontból megoldható - célszerű letölteni
az oldalakat a saját gépünk merevlemezére.
Ebben segitenek az un. off-line web
browser-ek, amelyek a letöltést gyorsan és önmüködően elvégzik,
a hivatkozásokat helyi hivatkozásra cserelik stb. Egy jó off-line
browser például a "WebStripper", ami ingyen letölthető a http://www.solentsoftware.com/webstripper/
címről. A helyi (off-line) böngészéskor azonban gondolni kell arra,
hogy a letöltés általában csak egy adott oldalra terjed ki, annak
kapcsolataira nem.
Az Internetre jellemző, hogy a felhasználó számára egyszerűnek tűnő műveletek mögött igen bonyolult technikai megoldások vannak. A legjobb példa erre magának az információátvitelnek a megoldása. A TCP/IP alapu rendszerben a küldendő információt un. datagrammokra tördelik, amelyeket aztán a hálózat egymástól teljesen különállóként kezel. A datagramm adatok együttese, amely egy egyszerű üzenetként kerül továbbításra. Az Internet hálózati protokollokat úgy tervezték, hogy a küldő és a vevő képes a datagramm méretet egyeztetni. A TCP kapcsolat felépítésekor mindkét oldal közli a másikkal az általa kezelhetõ maximális méretet, majd a továbbiakban a kisebbiket használják. A datagrammok egymástól függetlenül, egyesével indulnak útjukra. Az adatcsomagok esetleg több tucat hálózaton is keresztülmehetnek mielőtt a célállomásra érkeznének. Az ezt megvalósító útvonal-választás láthatatlan a felhasználó számára, abból mindössze egy Internet címet kell, hogy ismerjen. Minden datagrammnak van egy sorszáma, amely a vevő oldalt arról biztosítja, hogy minden adatot helyes sorrendben kapjon meg, és ne veszítsen el egyet se a datagrammok közül. A datagrammok átvitele közben a hálózaton semmi nem utal arra, hogy közöttük bármiféle kapcsolat is létezne; előfordulhat, hogy egy a sorrendben eredetileg hátrább álló megelőz egy előtte állót. A datagrammnak a rendeltetési helyre való megérkezését a vevő egy nyugtával hozza a küldő oldal tudomására. Ez a szám a datagramm TCP fejlécében egy nyugta mezőben jelenik meg. Az is lehetséges, hogy a hálózaton valahol hiba keletkezik és néhány datagramm nem érkezik meg a rendeltetési helyére. Amennyiben a küldő oldal egy adott időn belül nem kap nyugtát, akkor újból elküldi az adatot. Ez a látszólag bonyolúlt adatátviteli módszer a gyakorlatban igen jól bevált, ezt az Internet elterjedtsége fényesen bizonyítja.
Ha
lassú a hálózat
Felmérések
szerint az Internet felhasználóinak mintegy 60%-a az adatátvitel
lassúságát tartja a legzavaróbb problémának. Valóban a Web használata
során gyakran alig győzzük kivárni, amíg a kért oldal megjelenik a
képernyőnkön. A lassúság egyik oka lehet, hogy a Web-lap
készítésekor nem gondoltak a letöltés szempontjaira, telezsúfolták azt
képekkel, hátterekkel. Egy-egy gazdagon díszített színes oldal letöltése
igen nagy mennyiségű adat átvitelét igényli.
A lassúság másik oka a nem megfelelő adatátviteli sebesség. Számítógépünk digitális jeleit az analóg távbeszélő-hálózatokon való átvitelhez át- és visszaalakító eszköz, ún. modem (MOdulator-DEModulator) alakítja át. A modemek sebességét bit/s-ban (bps) mérik, ez az egy másodperc alatt átvitt bitek száma. Rövid jelölésére használják az ezres előtaggal pl: 56 Kbps vagy csak 56 K-s. A modemek sebességének jellemzésére a velük elérhető legnagyobb átviteli sebesség értékét használjuk. A modemünk megfelelő átviteli sebessége, azonban még önmagában nem biztosíték arra, hogy gyors lesz az Internet kapcsolatunk. Az, hogy egy modemmel milyen gyorsan tudunk adatokat forgalmazni, függ a mi modemünktől, a vonal másik oldalán lévő modemtől, és az átviteli közeg (távbeszélővonal) minőségétől. Egy kis számolás. Pl. egy 33.6 K-s modem egy perc alatt 33600 bitet visz át. A modem sebessége bit/s-ban van megadva, a letöltés sebességét pedig Kbájt/s-ban számoljuk. Mivel 1 bájt=8 bit, de egy bájt átviteléhez kb. 11 bitre van szükség, mert van startbit, stopbit, meg paritásbit. Ez egy perc alatt 60x33.600=2.016.000 bit, azaz kb. 180 000 bájt vagyis 180 Kbájt. Ha Internetezni szeretnénk és a távbeszélővonalunk modern digitális központra csatlakozik, akkor mindenképpen 56 K-s modemet érdemes beszerezni. Abban az esetben, ha a távbeszélővonal minősége nem megfelelő, felvilágosítást kell kérni a helyi távbeszélő-szolgáltatótól, az esetleg jobb vonal bevezetéséről. Ha birtokunkban van az 56 K-s modem és elkezdjük a használatát, ne várjuk, hogy a kapcsolódási sebesség 56 K lesz. Ez általában 42...48 K között szokott változni. Ha a modemünk 56 K-s és a vonalunk rossz minőségű az adatátvitel kisebb sebességű lesz, pl: 33.6 K vagy akár 14.4 K.
Egy
további nyilvánvaló oka a lassúságnak, hogy csúcsidőben igen sokan
használják a hálózatot, és a hazai távközlési vonalak átviteli
kapacitása erősen korlátozott. A letöltés megkönnyítésére az
internetszolgáltatók kisegítő feladatokat ellátó un. proxy
kiszolgálót alkalmaznak, a forgalmat a nagyvilággal azon keresztül
bonyolítják le. Ha egy előfizető letölt valamit, vagy csak egyszerűen
böngészik egy Web-címen mondjuk távol Amerikában vagy Ausztráliában,
akkor a szolgáltató rendszere azt letölti a proxy kiszolgáló merevlemezére.
Ha valamelyik más előfizető néhány perccel később ugyanezt
keresi, akkor már nem kell Amerikából, Ausztráliából stb. letölteni, mert
az ott van helyben a kiszolgálón. A népszerű és gyakran látogatott
helyek így sokkal gyorsabban elérhetőek. Ezáltal csökken a
szolgáltató adatforgalma is a külvilág felé, ami neki költséget, a
felhasználónak pedig időt (így szintén költséget) takarít meg. A
proxy kiszolgáló többnyire földrajzilag valahol a felhasználó közelében
van.
Ennek a megoldásnak,
az átmeneti, vagy helyi tároló (cache), használatának előnyei és
hátrányai vannak.
·
A Web oldalak elérése
gyorsabbá válik, mivel elemzések szerint legalább minden ötödik letöltendő
oldal már megtalálható az átmeneti tárolóban. Ezek, mivel az eredeti
forrás nagy távolságra van, és nemzetközi vonalakon érhető csak el,
sokkal gyorsabban érkeznek a helyi tárolóból. A többi adat esetében a
letöltés sebessége ugyanakkora, mint átmeneti tároló használata nélkül.
A proxy kiszolgáló működéséből adódó késleltetés ugyanis
olyan kicsi hogy nem érzékelhető.
·
Csökken a belföldi és
nemzetközi Internet vonalak túlterheltsége. Nagyon sok adat, ugyanis ahelyett
hogy minden hozzáféréskor áthaladna ezeken a vonalakon, csak egyszer okoz
forgalmat. A vonalak terheltségének csökkenése egyébként azt is jelenti,
hogy a nem tárolt adatok elérése is gyorsulni fog!
· A csökkent forgalommal ráadásul költségmegtakarítás érhető el.
A
helyi tároló használatának hátránya, hogy esetenként egy-egy WWW oldalnak
nem a legfrissebb változatát kapjuk meg, hanem egy régebbit. Ez akkor
fordulhat elő, ha az eredeti adatokat megváltoztatták azóta, amióta az
az átmeneti tárba kerültek. Mivel az átmeneti tárak általában egy napig
tárolják a HTML szövegeket majd szükség szerint újra frissítik, ez elsősorban
a napi gyakorisággal változó oldalak esetén okozhat problémát. Sok fontos
oldalt frissítenek naponta, így ez több felhasználót érinthet. Ha
felmerülhet, hogy nem a legfrissebb változatot látjuk, és el akarjuk érni
az érvényes oldal letöltését, a böngésző Frissítés (Reload)
funkciójával ezt bármikor megtehetjük.
A proxy kiszolgálóknak emellett fontos biztonsági feladataik is vannak, tűzfalként szűrési feladatokat látnak el. Az Internet-es szóhasználatban a tűzfal olyan program vagy egység, amely a számítógép és az Internet között helyezkedik el, és a ki-be áramló adatcsomagokat megadott szabályok szerint szűri. Ennek az a célja, hogy megakadályozza az illetéktelenek behatolását példáúl egy belső vállalati hálózatba, illetve a belső hálózat felhasználóit korlátozza a munkájukkal nem kapcsolatos, egyéb tevékenységtől (tiltja az xxx-es oldalakat stb.). A manapság elterjedt trójai programok és más rossz szándékú üzenetek ellen ajánlatos még az otthoni számítógépekre is tűzfalprogramot telepíteni, abban az esetben, ha a gépet internetezésre is használjuk. Ha csak levelezésre használjuk, akkor felesleges, mert az alatt a pár perc alatt, amíg a levelek lejönnek, nem tud megtalálni, rákapcsolódni és a gépünkben kárt okozni senki, legalábbis nagyon kevés rá az esélye. Általában tűzfalon keresztül kapcsolódnak az Internet-hez a cégeken belüli un. Intranet hálózatok. Intranetnek akkor nevezzük a helyi hálózatot, amennyiben az Internet adatátviteli szabványt (TCP/IP) használja, és a helyi kiszolgálók Internetes adatközlő szolgáltatásokat (E-levél, www) nyújtanak.
A tűzfal program telepítésekor meg kell adnunk, hogy milyen típusú csomagokat, milyen programoktól, milyen címekre engedhet át, és melyeket nem. Ha olyan csomag jön, vagy megy, amire nem vonatkozik még szabály, akkor a tűzfal rákérdez, hogy ezzel most mit csináljon. Ilyen esetben egyedileg dönthetünk az adott csomag sorsáról (elfogadjuk vagy sem), de beállíthatjuk azt is, hogy mi történjen, ha később hasonló csomag érkezik. A hálózat sebességét észrevehetően nem befolyásolja a tűzfal beiktatása, mert "csak" annyit tesz, hogy pár tucat szabályból álló táblázatból kikeresi, hogy melyiknek felel meg a csomag, és ez alapján dönt a sorsáról. Ez pedig egy mai PC-nek nem túl nagy feladat.
Az Internet biztonsága
Az
Internet egy igen szabad világ: különböző szervezetek, cégek, magánszemélyek
nagyszámú szabadon elérhető programot, adatot tesznek elérhetővé
honlapjaikon. Máig sincs az egész Internetre nézve kötelező felhasználási
elv és biztonsági politika. Az ismeretközlés szabadságának az ára, hogy
az Internetre felkerülő ismeretekért senki sem felel, hogy ez jó vagy
sem, arra nem lehet egyértelmű választ adni. Az esetek túlnyomó többségében
a felhasználó megbízik a kapott adatokban. Sajnos ennek a bizalomnak néha
nincs alapja. Az elmúlt időszakban Internet-en hólabdaszerűen terjedő
vírusok számítógépek százezreiben tették tönkre az adatokat.
Egy másik veszélye az Internet-nek az, hogy nagyon sokan nem rendeltetés szerint, vagy éppenséggel rosszhiszeműen használják az Internet-en elérhető adatainkat. A Web-en történő keresés a névtelenség látszatát kelti. A felhasználók jó része nem tudja, hogy könnyen legyűjthetők személyes adataik a hálóról. Nemcsak a hírcsoportokban leírt üzeneteket lehet könnyűszerrel katalógusba szedni, és nemcsak azt lehet kideríteni, hogy milyen Web-helyeket látogattunk rendszeresen, hanem elektronikus postánktól vásárlásainkig és banki ügyleteinkig minden tevékenységünk ki van szolgáltatva a rossz szándékú leselkedőknek. Az Internet egyre inkább az elektronikus adatvadászok paradicsomává válik. Ma már számtalan hely van, ahol temérdek telefonszámot és címet lehet kigyűjteni, másutt biztosítási számok, és jogosítványadatok tengerében keresgélhet az érdeklődő. Még a nyilvános hálózatokon zajló pénzügyi ügyletek sem teljesen védettek. Ennek oka részben a helyeket fenntartó cégek gyenge biztonsági rendszere, részben pedig az ügyfelek gondatlansága. Szerencsére vannak bizonyos eszközök, például titkosítás és a névtelenítő (anonim) postai közvetítő (remailer), amelyekkel a lehető legkevesebbre csökkenthetjük annak veszélyét, hogy belelássanak személyes adatainkba. Megakadályozhatjuk azzal is, hogy a hálón való böngészés során nyomokat hagyjunk magunk után, ha névtelenítő helyeken (pl. http://www.anonymizer.com) keresztül pásztázzuk a hálót (3. ábra). Ha ellátogatunk erre a helyre, figyelemfelkeltő meglepetésként megtekinthetjük adatainkat, amelyekhez bárki hozzáférhet az Internet-en keresztül.
3. ábra. Névtelenítő hely honlapja
A
cookie-k
Nem
minden Internet felhasználó tudja, hogy az adatok mellett néha másféle fájlok
is kerülnek a gépébe, anélkül, hogy kérné azokat. Ezek a http üzenetek
fejlécében rejtőznek, ahol sok járulékos adat foglalhat helyet. Adatkéréskor
a böngésző általában elküldi a saját típusát, változat számát,
és hogy milyen operációs rendszeren fut, így a kiszolgálók pontosan érzékelik,
hogy ki használ Netscape Navigator, ki Internet Explorer vagy éppen valamilyen
más böngészőt, és ezt felhasználva például különböző módon
küldhetik el ugyanazt az adatcsomagot a különböző böngészőknek,
kihasználva azok egyedi tulajdonságait. A http válasz fejlécében a kiszolgáló
olyan adatokat küldhet, amelyek az oldal megjelenítését, tárolását,
illetve a proxy kiszolgálókon keresztüli továbbítását vezérlik. Küldhet
a fejlécben olyan állapot azonosító adatokat, amelyeket a böngésző a
legközelebbi http kérés fejlécében visszaküldhet. Ezeket a rövid kódsorozatokat
nevezik sütinek vagy bitsütinek, angolul cookie-nak.
A cookie-k adatokat helyeznek el a felhasználó saját merevlemezén.
Ezt a háttérben teszik, legtöbbször anélkül, hogy tudnánk róla. A
felhasználók többsége csak azért tud egyáltalán a cookie-k
létezéséről, mert bizonyos beállításban a Web böngésző
programok engedélyt kérnek a cookie-k
vételéhez (elfogadásához). A cookie
egy szöveges, txt kiterjesztésű állomány, amely semmi különleges védelem
alatt nem áll, a felhasználó minden következmény nélkül letörölheti azt.
A cookie-nak van egy másik lényeges
tulajdonsága: a lejárat ideje. Ezen idő után a böngésző nem
foglalkozik tovább vele, úgy tekinti, mintha nem létezne.
A
cookie elsősorban piacszervezési
eszköz, amely arra szolgál, hogy a meglátogatott Web-helyek tulajdonosai
felmérjék, milyen gyakran keressük fel a helyüket, és mit csinálunk ott. A
látogatók felkérhetők nyilvántartásra (regisztrációra) és így
adatbázis építhető fel a várható ügyfelekből. A cookie-ban
tárolhatnak, pl. nyilvántartási adatokat (így nem kell azt mindig
begépelnünk), eltárolhatják, hogy milyen nyelven olvassuk az oldalakat,
hányszor jártunk az adott helyen stb. A
cookie-k képzik a vásárlókártyák
alapját is az elektronikus kereskedelemben. A cookie-k
adatokat adnak át minden egyes látogatáskor, így ebből kiderül a
látogató érdeklődési köre, amit rossz esetben egy harmadik fél arra
használhat fel, hogy célzott hirdetést küldjön. Mivel egyre jobban előtérbe
kerül a személyi adatok védelme az Interneten, nem meglepő, hogy sokan
nem szeretik a cookie-kat.
Mint
már említettük böngészőnkben beállíthatjuk, hogy az hogyan fogadja a
cookie-kat. Teljesen elutasíthatjuk
őket, valamint lehetőség van minden egyes cookie
átvétele előtt egy megerősítő kérdés feltételére, hogy az
adott cookie létrehozását (vagy
módosítását) engedélyezzük-e (4. ábra). Ha egy Web-helyen személyes
adatokat kérnek tőlünk, megadhatunk hamis adatokat is. Így lemaradunk
ugyan a különféle kedvezményekről, amelyekkel a helyek kecsegtetnek
bennünket, de magánéletünk és személyiségi jogaink védelme ennyit
feltétlenül megér.
4.
ábra. Cookie-k ellenőrzését beállító menű az Internet Explorer böngészőben
Napról
napra többen használják a világhálót és ezzel együtt rohamosan nő a
rendszeren áthaladó személyes adatok mennyisége. Sajnos az elektronikus
társalgókban és hírcsoportokban magántitok egyszerűen nem létezik.
Valahányszor feladunk egy postai üzenetet, felkeresünk egy Web-helyet,
üzenetet küldünk egy hírcsoportnak vagy vásárlásra használjuk az
Internetet, kellő óvintézkedések híján kiszolgáltatjuk magunkat a
figyelő szemeknek. Közzétett üzeneteinket nemcsak a címzettek
olvashatják, hanem bárki, aki hónapok vagy évek múlva előkeresi őket
egy engedély nélkül készített adatbázisból. Az olyan helyek, mint
például a DejaNews vagy akár az Alta Vista, lehetővé teszik az az
Internet-en adatokat vadászóknak, hogy név alapján adatainkat,
tevékenységünkkel kapcsolatos ismereteket egybegyűjtsék.
Személyazonosságunkat azért is érdemes titokban tartani, mert így az
elektronikus postán érkező vásárlási ajánlatok tömegétől is
megmenekülhetünk. Szerencsére több módszer is van arra, hogy eltitkoljuk a
kilétünket, például a már említett postai közvetítőt (remailert)
kell használnunk, amely elfedi az elektronikus üzenet fejlécét, így a
feladó neve és címe gyakorlatilag kideríthetetlenné válik. Ha valaki
választ küld a kódolt címre, ténylegesen a postai közvetítőhöz
juttatja el üzenetét, amely minden küldeményt továbbít hozzánk.
Keresőgépek
Az
Interneten hatalmas mennyiségű adat és ismeret érhető el, kevés
kivétellel ingyen. Nem könnyű viszont hozzáférni a szükséges
adatokhoz, ugyanis az Internet kötetlen szerveződése révén nincs központi
adatbázis. A felhasználónak ezért az egyik legfontosabb kérdés az, hogy
milyen könnyen találja meg a számára szükséges szolgáltatást, címet,
ismeretet.
Az
Internet legfontosabb és legnépszerűbb szolgáltatásai közé tartoznak
világszerte a keresőgépek, amelyek lehetővé teszik, hogy a világhálón
megjelenő legkülönbözőbb oldalak között megtaláljuk azokat,
amelyekre valóban szükségünk van, amelyek valóban érdekelnek bennünket az
immár szinte beláthatatlan információtengerben. Az amerikai
GVU (Graphic, Visualization,
& Usability Center)
felmérése szerint a Web használók mintegy 85%-a használja a keresőgépek
szolgáltatásait. A felmérés arra is rámutatott, hogy a jelenleg működő
keresőgépeknek sok hiányosságuk van, kívánnivalót hagy maga után az
adatok érvényessége (aktualitása), és nem megfelelő a lefedett terület
sem.
A keresők fenntartását hírdetésekből oldják meg. A keresők igen alkalmas helyek hírdetés-csíkok (banner-ek) elhelyezésére. Egy keresőkérdés akár több ezer találatot is eredményezhet így sok oldal egyszerűen elkallódik a hasonló tartalmú oldalak rengetegében. Különleges módszerek léteznek arra, hogy a keresőprogramok egy adott Web-oldalt a találati lista első elemei között tüntessenek fel, ahol jó esély van rá, hogy a fogyasztó betér oda. Az egyes címek kiemelt kezelése külön bevételi forrást jelent a keresőprogramok üzemeltetőinek.
Magyar
keresők
AltaVizsla.
A MATÁV Rt. és a Digital
Magyarország Kft. együttműködése eredményeként 1998 májusában
megindult AltaVizsla magyar nyelvű kezelőfelülettel, a magyar nyelvű
tartalmakra összpontosítva segíti az Internet-en való eligazodást. Az
AltaVizsla 1999. júliusától egyesült a MATÁVnet legfontosabb Internet-es
tartalomszolgáltatásával, az [origo]-val. Ezzel nemcsak a megszokott keresésre
nyílik lehetőség. 24 órás hírszolgáltatás és téma szerinti ugrópontok
segítenek azoknak, akik szavak és kifejezések helyett inkább az egyes témákhoz
tartozó Web-oldalakat keresik az Internet-en.
A
World Wide Web-en a http://www.origo.hu címen elérhető AltaVizsla az erre
a célra készített szoftverek segítségével rendszeresen "átolvassa"
a World Wide Web magyar tartományának (.hu domain) teljes egészét. A
szolgáltatás naponta új tárgymutatót (indexet) készít, tehát a szó
szoros értelmében naprakész, s lehetőséget ad arra, hogy nyomon kövessük
a magyar oldalak változásait, bővülését. Az AltaVizsla tárgymutatatója
már a szolgáltatás indulásakor több mint kétszer annyi oldalt tartalmazott,
mint az amerikai AltaVista magyar jegyzéke. Ide kivánkozik az a személyes
megjegyzés, hogy az Alta Vistán találhatunk olyan magyar anyagot, amely nem
található meg magyar keresőkkel.
Az AltaVizslán lehetőség van egyszerű és összetett, logikai elemekből felépített keresések végrehajtására, a már megkezdett keresések szűkítésére, bővítésére, kiegészítésére ugyanúgy, mint a különböző ismerethordozókra (képek, hangok) való keresésre. Több szó megadása eseten a keresőprogram önmüködően ÉS műveletet feltételez. Ez azt jelenti, hogy csak olyan lapok fognak találatként megjelenni, amelyeken az összes keresendő szó szerepel.
A
felhasználók lehetőséget kapnak arra is, hogy saját oldalaikra felhívják
az AltaVizsla figyelmét az "URL hozzáadása" művelet segítségével,
valamint a honlapok fenntartói rákereshetnek arra is: hány más oldalról
mutatnak kapcsolók a saját oldalaikra. Saját tapasztalat szerint jó néhány
nap esetlég hét is eltelik a figyelem felhívástól, amíg honlapunkat
feldolgozza a kereső.
HuDir.
A megújult HuDir-ral (http://www.hudir.hu) kétféleképpen kereshetünk. Az
egyik változat a hagyományos keresés szavak, illetve kifejezések alapján.
Az ehhez tartozó beviteli mezőt és a keresést indító gombot a HuDir
valamennyi képernyőjén megtalálható. A másik változat, a tárgykörönkénti
keresés kiindulási pontjai a HuDir nyitóképernyőjén láthatók. Ez a
keresési mód lényegében olyan, mint egy fa szerkezete: elágazások segítségével
kereshetünk rajta. Ha kiválasztottuk a megfelelő kiinduló "faágat",
a következő képernyő bal oldalán megtaláljuk a további elágazásait
és azokat az Internet-es helyeket is, amelyek megfelelnek annak az elágazási
pontnak. Ha ezekre a mutatókra, amelyek a képernyő nagyobb részét
elfoglalják, rákattintunk, közvetlenül is elérhetjük a számunkra érdekes
Internet-es honlapokat. Ha az mutatók száma meghaladja a húszat, akkor több,
egymást követő lapra kerülnek. Ha az adott elágazáshoz tartozó mutatógyűjteményben
nem találjuk a számunkra érdekes honlapot, a baloldali tárgykörlistából választhatjuk
ki a megfelelő "al-tárgykört", így a faszerkezet további elágazásaihoz
juthatunk el.
Heuréka.
A Heuréka (http://www.heureka.hu) is a magyar Web-en keres. Megpróbál összegyűjteni
minden magyarországi, illetve magyar vonatkozású iratot, és önmüködően,
rendszeres időközönként adatbázisába dolgozza az új oldalakat. Az
adatbázis állandóan bővül. Természetesen előfordulhat, hogy egyes
oldalak kimaradnak az adatbázisból, vagy nem a legújabb változatuk szerepel
abban. Ez laponként erősen változó lehet, sok tényező befolyásolja.
Az is előfordulhat, hogy ugyanazt a lapot nem egyenletes időközökben
keresi fel a Heuréka. Átlagosan 2-3 hetenként látogat el a leszedőrobot
egy-egy Web-lapra. Vannak azonban olyan oldalak is, amelyeket a Heuréka naponta
frissít - ezek között keresünk, amikor a "friss" adatbázist választjuk
ki.
A
Heuréka keresőrendszerrel jelenleg két
csoportban kereshetünk:
·
A magyar lapok csoport
kijelölésével a viszonylag ritkán változó lapok között kereshetünk,
· A friss lapok kiválasztásával a naponta frissülő oldalakon kereshetünk.
Kereshetünk egyszerre mindkét csoportban is, ilyenkor jelöljük ki mindkét kapcsolómezőt. Ez egyben az alapbeállítás is. Például, ha a napilapok friss hírei között szeretnénk megkeresni azokat az oldalakat, amelyek tartalmaznak művelődés kezdetű szavakat, akkor válasszuk a friss lapokat, és írjuk be a művelődés* kereső-kifejezést!
A
keresőgépek összehasonlítása
1984-ben,
amikor az Internet még gyerekcipőben járt, a Lycos keresőgép
adatbázisa összesen 54 000 weboldalt jegyzett. 2000-ben a BrightPlanet (http://www.brightplanet.com) elemzése szerint mintegy 550 milliárd (!) honlap
érhető el az Internet-en, amely az eddigi becsléseket jócskán
meghaladja. A tanulmány azt is megállapította, hogy a világháló korántsem
annyira egységes, mint amilyennek látszik; a látogatók nagy része jól
meghatározható csomópontokba tömörül. Azok a weboldalak, amelyek a
csomópontot, a magot alkotják, csupán a teljes hálózat 30 százalékát
képviselik. Ezek azok az oldalak, amelyek a világháló bármely pontjáról
elérhetőek, és rengeteg más weboldalra lehet a segítségükkel eljutni.
Zömében a nagy hírszolgáltatók, keresők és népszerű, gazdag
tartalommal rendelkező weboldalak tartoznak ehhez körhöz. Az Internet
egyes részei között kevés kapcsolatot találtak a kutatók, a sűrűn
keresett oldalakon kívül rengeteg kapcsolat nélküli magányos sziget úszik
az információs űrben, amelyek nem mutatnak sehova, és rájuk sem
hivatkozik igazán senki.
A
keresőgépek többsége az
egész hálón keres (pl. AltaVista, Yahoo!), kisebbik része adott országra
vagy meghatározott nyelvre korlátozza a gyűjtőkörét (pl.
AltaVizsla, HuDir). Egy részük egyetemes, azaz minden fajta és mindenféle
tartalmú HTML-oldal a gyűjtőkörükbe tartozik, másik részük csak
adott tartalmú, vagy adott típusú HTML-lapokkal foglalkoznak. Egyes keresők
a gyorsaságukkal, mások a keresési eszközök gazdagságával, megint mások
a feldolgozott állomány nagyságával tűnnek ki. Tárgyszerűség
szempontjából vannak megbízhatóbbak és kevésbé megbízhatóak. Gyakran
jelennek meg elemzések a hálón, melyekből tájékozódni lehet a
különböző keresők hatékonyságáról, de még nem alakultak ki
megbízható tudományos módszerek az értékelésre
(5. és 6. ábrák).
5. ábra. A legnagyobb keresőgépek indexelt laptartománya, millió lapra. Röviditések: AV=AltaVista, FAST=FAST, NL=Northern Light, GG=Google, EX=Excite, INK=Inktomi, Go=Go (Infoseek), LY=Lycos (2000.júniusi állapot) |
6. ábra. A legnagyobb keresőgépek tartománya a Web becsült teljes lapállományának százalékában (2000.júniusi állapot) |
Az
ismeretek keresése és osztályozása szempontjából a keresőszolgáltatások
két fő típusa alakult ki: a tárgymutatót készítő (indexelő)
szolgáltatások és az Internet-katalógusok. Külön csoportba tartozik az
egyik kifinomultabb keresőgép a Google, amely azokat a lapokat keresi,
amelyeket az adott témában a legtöbben használnak. Ez a kereső minden
hónapban megvizsgálja a Web-lapokat, hogy frissítse
könyvtárszolgáltatását, és a legfrissebb, legtartalmasabb honlapok
legyenek ott. A vállalat legutóbbi keresésén 200 millió honlapot
regisztrált. A Google 1998 szeptemberében alakult meg, a cég 90 embert
foglalkoztat.
A
keresőgépek elsődlegesen mindig a Web-lap címet értékelik, majd
ezt követően a megadott kulcsszavakat (keywords), a megadott leírást
(description) és legvégül az oldal szövegében előforduló szavakat. A
HTML nyelv az úgynevezett címkékkel („tag")-ekkel mondja a böngészőnek,
hogy mit és hogyan jelenítsen meg. A "tag"-ek a HTML iratokban
szereplő, azok szerkezetét és megjelenését jelölő címkék.
Minden címke < > karakterek közé van zárva.
Többségükhöz egy / karakterrel kezdődő lezáró tag is
tartozik, amely az illető utasítás érvényességi határát jelzi a
megjelenítést végző Web-böngésző számára. Ha a böngésző
bizonyos címkét észlel, akkor azt értelmezi majd az utasításnak megfelelően
megjeleníti.
A kereső szolgáltatások teljesítménye és találat oldalaik tartalma nagymértékben különbözik egymástól, ami a felhasználót arra ösztönzi, hogy a lehető legnagyobb lefedés érdekében az un. meta-keresőszolgáltatásokhoz (metasearch engines) forduljon. Ezekkel egyszerre több keresőszolgáltatásban lehet keresni anélkül, hogy a felhasználónak az egyes szolgáltatásokkal külön foglalkoznia kellene.
Fontosabb általános célú kereső gépek a világhálón
Miért nem adnak megfelelő eredményeket a kereső gépek?
Ha valaki sokat használja a keresőgépeket azt tapasztalja, hogy bizonyos esetekben meglepően jó eredményt adnak, máskor szinte értéktelen a keresés eredménye még akkor is, ha a keresési feltétel megfelelő volt. Két alapvető probléma szokott előfordulni: a túl sok találat (high recall) és a hasznos oldalak hiánya (low precision). A keresőgépeket üzemeltető cégek az előbbit nem tekintik igazi hibának, hiszen egész üzleti célkitűzésük a teljes körű lefedettség hirdetésén alapul. Az amerikai kormány által létrehozott informatikai munkacsoport (WGGIN) megállapításai alapján a Web keresések eredménytelensége az alábbi fő okokra vezethető vissza:
·
A keresőgépek az egyes címeken
lévő lapoknak csak egy részét - a felső két-három szintet - vizsgálják,
pedig gyakran a fontos iratok az olcsóbb szinteken találhatók.
·
A keresőgépek, különösen
a legnagyobbak szabálytalan időközökben látogatják újra a címeket,
ezért sok esetben elavult adatokat adnak ki.
·
Értékes adatok kerülnek ki
a keresésből, mert azokat nem HTML alakban vitték fel a Web-re (pl. ábrák,
adatbázisok, vagy PDF fájlok formájában).
·
A keresőgépek nem odavágó,
vagy lényegtelen oldalakat adnak ki, mert nem tudják megkülönböztetni a
jellemző és jelentéktelen szavakat az iratokban.
A
két utóbbi probléma nemcsak a keresés eljárásmódjával kapcsolatos, hanem
az adatok felvitelét a honlapok készítését is érinti. A metaadatok használata
lényegesen javítana ezen a helyzeten. A metaadatokkal rendszerezett formában
írható le a Web-lapok adattartalma és ez nagymértékben megkönnyíti,
biztosabbá teszi azok elérését az érdeklődők számára. A
<META> tagot a böngésző alapállapotban nem jeleníti meg, csak ha
belépünk Forrás (Page Source) menüpontba. Sajnos ma még a keresőgépek
sem használják ki az új metaadat-szabvány kínálta lehetőségeket és
ezért a Web-lapok készítői sem fektetnek be munkát a részletes kódolásba.
Úgy is mondhatnánk, hogy a "tojás vagy tyúk" helyzet állt elő.
Összefoglalóan
elmondhatjuk, hogy a keresőszolgáltatások találatai rendkívül vegyes
minőségűek lehetnek. Gyakori, hogy már nincs is mögöttük élő
tartalomszolgáltatás, sokszor ugyanannak a HTML-oldal különböző időpontokból
származó változata jelenik meg, és a találatok túlnyomó többsége sok
esetben érdektelen a felhasználó számára, mivel a tárgymutatóban szereplő
szó nem a HTML-lap valódi tartalmát képviseli. Ennek egyik oka, hogy a
kereskedelmi tartalomszolgáltatók HTML-oldalaik címfejébe olyan kifejezéseket
is elhelyeznek, melyek valójában nem igazán jellemzik a lapjukat, de amelyekről
tudják, hogy a gyakran keresettek közé tartoznak. Így a kereső különlegesen
értékes találatként értékeli, és a találati listán a legelső
helyeken jeleníti meg azokat. Ez nem más, mint egyszerű félrevezetés. A
fő baj mindebben az, hogy felhasználó értetlenül áll az ilyen találatok
előtt és saját magát okolja a rossz keresési feltétel megadás miatt.
Az Internet nem azonos
a World Wide Web-el. Míg az Internet egy számítógépes hálózat összefoglaló
neve, addig a World Wide Web sok más alkalmazás közül az egyik - igaz, a
legnagyobb mértékben elterjedt - alkalmazása ennek a hálózatnak. A
cikksorozat következő részében a többi Internet-alkalmazásról szeretnénk
írni.
Radnai Rudolf
Irodalom
1. Ungváry Rudolf: A
tartalom szerinti információkeresés az Interneten. I. Indexelőszolgáltatások
c. cikkéből. Tudományos és Műszaki Tájékoztatás 47. évf., 1. sz.,
2000. 3-19.
2. Numbers, Numbers -- But What Do They Mean?The SearchEngine ReportMarch 3, 2000
3. Steve Lawrence and
C. Lee Giles: Accessibility of information on the Web, Nature, Vol. 400, pp. 107-109, 1999.
5. Iannella, R.: An
idiot's guide to the resource description framework. DSTC, November, 1998. http://www.dstc.edu.au/RDU/reports/RDF-Idiot/
6. LaVen] Dublin Core
and Z39.50., OCLC, February,1998. http://cypress.dev.oclc.org/
7.
MetaWeb Project Analysis of Metadata Creation Tools. June, 1998. http://www.dstc.edu.au/RDU/MetaWeb/
8. Search Engine Watch.
Search Engine Feature Company. 1998. http://searchenginewatch.com/webmasters/features.html
9. Füstös János: World Wide Web, Szak kiadó Kft., Bicske 1996
10. Galántai Zoltán,
Komáromy Gábor: Web Page saját kezűleg, Virgil kiadó Bt., 1997
11. Miklós Viktor: Web
lap szerkesztés mindenkinek, Cesare&Cserő Bt., 1996
12. Kris Jamsa,
Suleiman Lalani, Steve Weakley: A Web programozása, Kossuth kiadó 1997
A laprendszer készítője: UFE Bt.