Mi az a Wayback Machine, és miért hasznos?
Internet Weboldalak Hős / / April 22, 2021
Utolsó frissítés:
A Wayback Machine a legnépszerűbb része Internet Archívum weboldala. Először 2001-ben mutatták be az ingyenes online eszközt, amellyel „visszamehetsz az időben”, és megnézheted, hogyan néznek ki világszerte a webhelyek az időkben. A Wayback Machine 562 milliárd, ezermillió weblapok az írás idején, évente még sokan hozzáadva.
Itt van egy pillantás a Wayback Machine-re, és mi teszi különlegessé.
Internet Archívum Bevezetés
Brewster Kahle és Bruce Gilliat által létrehozott Internetes Archívum egy nonprofit szervezet, amelynek kijelölt küldetése az „összes ismerethez való egyetemes hozzáférés”. Elölről, a szervezet ingyenes nyilvános hozzáférést biztosított digitalizált anyagokhoz, például weboldalakhoz, könyvekhez, hangfelvételekhez, ideértve az élő koncerteket, videókat, képeket és szoftvereket programok.
A mai napig minden, amit az Internetes Archívum gyűjtött, több mint 70-et foglal el Petabájt szerverterület, beleértve két példányt. A szervezet adományokból, támogatásokból és könyv digitalizálási szolgáltatásokból származó díjakból kerül finanszírozásra. Az adatvédelem érdekében az Internet Archívum nem tartja nyilván az olvasók IP-címeit, és végig a HTTPS (biztonságos) protokollt használja.
A Wayback Machine
Az internetes archívumnak csak egy részét, a Wayback Machine-t tervezték megváltoztatott vagy eltávolított webhelytartalom rögzítésére. Indítása óta az internet egyik legnépszerűbb és legelismertebb helyévé vált. Kahle és Gilliat az 1960-as évek animációs sorozatának kitalált időutazó készülékéről, a The Rocky and Bullwinkle Show-ról nevezték el a helyszínt.
Noha az Internet Archívum csak 2001 októberében nyitotta meg a webhelyet a nyilvánosság előtt, a Wayback Machine 1996 májusától kezdte meg a gyorsítótárazott weboldalak archiválását. 2001-ig a digitális szalagok olyan információkat tároltak, amelyekhez csak a kiválasztott tudósok és kutatók férhettek hozzá. Amikor öt évvel később minden a nyilvánosság elé került (amint azt régóta tervezték), akkor már több mint 10 milliárd archivált oldalt tartalmazott.
Tárolás és gyűjtemények
Ma a webhely korábbi webes adatokat tárol a Linux csomópontok fürtjén. A Wayback Machine feltérképezési mechanizmusán keresztül letölti az összes nyilvánosan elérhető információt és adatfájlt a weboldalakról. Azonban nem minden, amit egy weboldalon közzétett, ide tartozik, mivel bizonyos tartalmak korlátozottak vagy adatbázisokban vannak tárolva, amelyek nem érhetők el. Emiatt egyes webhelyek jobban be vannak térképezve, mint mások, attól függően, hogy a fejlesztők egyszerre hozták létre a webhelyet.
Azt is észreveszi, hogy újabb az archívum, annál több tartalom érhető el az adott webhelyhez. Az Internet Archívum 2005-ben bevezetett új eszköze az egyik oka annak, hogy az újabb adatok teljesebbek. Az Archive-It.org segít leküzdeni a részben gyorsítótárazott webhelyek következetlenségeit azáltal, hogy lehetővé teszi az intézmények és a tartalomkészítők számára, hogy betakarítsák és megőrizzék a digitális tartalom gyűjteményeit.
A csúszómászásról
A webrobotok, amelyeket néha póknak vagy spiderbotnak hívnak, ugyanolyan régiek, mint maga az internet. Ezek a robotok olyan internetes robotok, amelyek indexelés céljából folyamatosan böngésznek az interneten, így minden modern keresőmotor fontos elemét képezik. A weboldalak digitális pillanatképeinek létrehozásához a Wayback Machine számára használt bejárók különböző forrásokból származnak, amelyek az idők folyamán megváltoztak.
Amint hamar észreveszi, a pillanatfelvételek készítésének gyakorisága webhelyenként eltér. Általában minél nagyobb (és talán népszerűbb) webhely, annál nagyobb a feltérképezés. Ráadásul sok múlik azon, hogy a webhely milyen gyakran változtat az oldalakon. A legkisebb webhelyeket is feltérképezik, hacsak nincs oka annak. Például a jelszóval védett webhelyek nem kerülnek feltérképezésre, és azok a webhelyek sem, amelyek webhelytulajdonosai azt kérték, hogy ne vegyék fel őket.
A Wayback Machine használata
A Wayback Machine webhelyet bárki könnyen használhatja. A webhely korábbi pillanatképeinek megkereséséhez írja be a nevét a webhely keresőjébe. A keresési eredmények oldalon a hiperhivatkozások a webhely archiválásának dátumát és időpontját jelölik. A linkre kattintva megtekintheti a webhelyet „időben vissza”.
A következő példákban láthatja az Apple weboldalának 2005 februárjában és 2014 novemberében rögzített címlapját, valamint a CNN kezdőlapját 2004 márciusától és 2010 szeptemberétől.
Megjegyzés: Ezek a bejárások nem csak a kezdőlapokra, hanem a megadott dátumokon rögzített más oldalakra mutató linkeket is tartalmaznak.
Speciális eszközök
A kutatók és a nyilvánosság számára egyaránt létrehozott Wayback Machine rendelkezik néhány beépített eszközzel, amelyek az alkalmi felhasználók számára hiányozhatnak. Például kialakítás alapján a keresési eredményoldalak könnyen hivatkozhatók. Mint kifejtettük: „Ha olyan archivált oldalt talál, amelyre hivatkozni szeretne a weblapján vagy egy cikkében, átmásolhatja az URL-t. Használhat még homályos URL-egyezést és dátummeghatározást is... de ez egy kicsit fejlettebb. "
A Wayback Machine azt is lehetővé teszi a webhelytulajdonosok számára, hogy egy „Oldal mentése most” funkciót használjanak egy adott oldal mentéséhez. És mégsem tökéletes. Jelenleg a szolgáltatás nem adja hozzá a webhely URL-jét a jövőbeni feltérképezésekhez. Ezenkívül a kérés nem ment el több oldalt. Ez azonban jó első lépés a webhely kezdőlapjának archiválása a történelmi nyilvántartás számára.
Új kereséshez nem kell minden alkalommal meglátogatnia a Wayback Gépet. Ehelyett a webböngésző eszköztárába beírva a címet találhatja meg a tartalmat. Használja ezt a formátumot minden kereséshez: http://web.archive.org/*/www.yoursite.com/*. Például használja http://web.archive.org/*/www.groovypost.com/* hogy archivált oldalakat találjon a GroovyPost!
Mobil és fejlesztői eszközök
Végül a Wayback Machine nem csak az interneten keresztül található. Megtalálhat egy Wayback Machine alkalmazást iOS és Android. A Chrome, a Safari és a Firefox kiterjesztései is vannak. A fejlesztők meg akarják nézni az Internet Archive Wayback Machine API-kat is. Ezek megkönnyítik a fejlesztők számára az információk visszakeresését a Wayback rögzítési adatokról.
Az Internet Archive Wayback Machine többféle API-t támogat. Ezzel megkönnyíti a fejlesztők számára az információk visszakeresését a Wayback rögzítési adatokról.
Kedvenc webhelyei „időben történő visszalépése” az első ok, amiért meglátogatja a Wayback Machine-t. Remek eszköz mindazok számára, akik webhelytörténetet kutatnak iskolai projektek vagy üzleti célokra. Bármit is tesz, keresse fel a Wayback Machine-t, és nézze meg, mit fedezhet fel néhány egyszerű lépésben.
Az Internet Archívum Archive-It előfizetési szolgáltatásáról további információt a hivatalos honlapján és kezdje el a közreműködést még ma!