Какво представлява Wayback Machine и защо е полезно?
Интернет Уебсайтове Герой / / April 22, 2021
Последна актуализация на
Wayback Machine е най-популярната част от Уебсайт на Internet Archive. Представен за първи път през 2001 г., безплатният онлайн инструмент ви позволява да се върнете „назад във времето“, за да видите как изглеждат уебсайтовете по света в даден момент. Wayback Machine разполага с 562 милиард уеб страници по време на писането, с много повече добавени всяка година.
Ето поглед към Wayback Machine и какво я прави специална.
Въведение в Интернет архива
Създаден от Брустър Кале и Брус Гилиат, Интернет архивът е организация с нестопанска цел с декларирана мисия за „универсален достъп до всички знания“. От началото, организацията е предоставила безплатен публичен достъп до дигитализирани материали, като уеб страници, книги, аудио записи, включително концерти на живо, видеоклипове, изображения и софтуер програми.
Към днешна дата всичко, събрано от Интернет архива, заема повече от 70 Петабайти на сървърното пространство, включително две копия на всичко. Организацията се финансира чрез дарения, безвъзмездни средства и такси от услуги за дигитализация на книги. За поверителност, Internet Archive не следи IP адресите на своите четци и използва протокола HTTPS (защитен) през цялото време.
Машината Wayback
Само една част от интернет архива, Wayback Machine, е проектирана да заснема съдържание на уебсайт, което е променено или премахнато. Откакто стартира, той се превърна в едно от най-популярните и признати места в мрежата. Kahle и Gilliat кръстиха сайта на измисленото устройство за пътуване във времето в анимационния сериал от 60-те, The Rocky and Bullwinkle Show.
Въпреки че Internet Archive не стартира сайта публично до октомври 2001 г., Wayback Machine започна да архивира кеширани уеб страници от май 1996 г. До 2001 г. цифровите касети съхраняват информация, достъпна само за избрани учени и изследователи. Когато пет години по-късно всичко стана публично достояние (както беше дълго планирано), то вече съдържаше над 10 милиарда архивирани страници.
Съхранение и колекции
Днес сайтът съхранява исторически уеб данни за клъстер от Linux възли. Wayback Machine изтегля цялата публично достъпна информация и файлове с данни на уеб страници чрез своя механизъм за обхождане. Тук обаче не е включено всичко, публикувано на уебсайт, тъй като част от съдържанието е ограничено или съхранявано в бази данни, които не са достъпни. Поради това някои уебсайтове се обхождат по-добре от други, в зависимост от това как разработчиците са създали сайт в даден момент.
Също така ще забележите, че колкото по-нов е архивът, толкова повече съдържание е налично за даден сайт. Нов инструмент, въведен през 2005 г. от Интернет архива, е една от причините новите данни да са по-пълни. Archive-It.org помага да се преодолеят несъответствията в частично кеширани уебсайтове, като позволява на институциите и създателите на съдържание да събират и съхраняват колекции от цифрово съдържание.
Относно обхождането
Уеб роботите, наричани понякога паяк или паяк, са толкова стари, колкото и самият интернет. Тези роботи са интернет ботове, които непрекъснато сърфират в мрежата за целите на индексирането, което ги прави важен компонент на всяка съвременна търсачка. Роботите, използвани за Wayback Machine за създаване на цифрови снимки на уебсайтове, идват от различни източници, които са се променили с течение на времето.
Както бързо ще забележите, честотата на заснемането на моментни снимки варира значително в зависимост от уебсайта. Обикновено, колкото по-голям (и може би по-популярен) уебсайт, толкова по-обхождащо се получава. Освен това много зависи от това колко често даден уебсайт има промени в страницата. Дори и най-малките уебсайтове в крайна сметка се обхождат, освен ако няма причина да не са. Например сайтовете, защитени с парола, не се обхождат, както и уебсайтовете, чиито собственици са поискали те да не бъдат включени.
Използване на Wayback Machine
Уебсайтът на Wayback Machine е лесен за използване от всеки. За да намерите исторически снимки на уебсайт, въведете името му в търсачката на сайта. На страницата с резултати от търсенето хипервръзките означават дати и часове на архивиране на даден сайт. Кликнете върху връзката, за да видите сайта „назад във времето“.
В следващите примери можете да видите първата страница на уебсайта на Apple, записана през февруари 2005 г. и ноември 2014 г., и началната страница на CNN от дата през март 2004 г. и септември 2010 г.
Забележка: Тези обхождания включват и връзки към други страници, записани на датите, а не само до началните страници.
Разширени инструменти
Създадена за изследователи и за обществеността, Wayback Machine има няколко вградени инструмента, които случайните потребители могат да пропуснат. Например по дизайн страниците с резултати от търсенето са лесни за справка. Както е обяснено, „Ако намерите архивирана страница, към която искате да се позовете на вашата уеб страница или в статия, можете да копирате URL адреса. Можете дори да използвате размито съвпадение на URL адреси и спецификация на датата... но това е малко по-напреднало. "
Wayback Machine също така позволява на собствениците на сайтове да използват функцията „Запазване на страницата сега“, за да запазят конкретна страница. И все пак, не е перфектно. Понастоящем функцията не добавя URL адреса на сайта към бъдещи обхождания. Освен това заявката не запазва повече от една страница. Това обаче е добра първа стъпка за архивиране на началната страница на уебсайта ви за историческия запис.
Не е нужно да посещавате Wayback Machine всеки път, за да извършите ново търсене. Вместо това можете да намерите съдържание, като въведете адреса в лентата с инструменти на вашия уеб браузър. Използвайте този формат за всички търсения: http://web.archive.org/*/www.yoursite.com/*. Например използвайте http://web.archive.org/*/www.groovypost.com/* за да намерите архивирани страници за GroovyPost!
Инструменти за мобилни устройства и програмисти
И накрая, Wayback Machine не се намира само в мрежата. Можете да намерите приложението Wayback Machine за iOS и Android. Има и разширения за Chrome, Safari и Firefox. Разработчиците също ще искат да разгледат API на Internet Archive Wayback Machine. Те улесняват разработчиците да извличат информация за данни за улавяне на Wayback.
Интернет архив Wayback Machine поддържа няколко различни API. По този начин улеснява разработчиците да извличат информация за данни за улавяне на Wayback.
Връщането назад във времето за любимите ви уебсайтове е основната причина да посетите Wayback Machine. Това е и чудесен инструмент за всеки, който изследва историята на уебсайтове за училищни проекти или бизнес употреба. Каквото и да правите, посетете Wayback Machine и вижте какво можете да откриете с няколко прости стъпки.
За повече информация относно абонаментната услуга Archive-It на Internet Archive посетете официален уебсайт и започнете да допринасяте още днес!