Ak si myslíte, že ste už zvládli základy pokročilého vyhľadávania prostredníctvom Google, Yandex a iných vyhľadávačov, je čas posunúť sa na vyššiu úroveň. Vyhľadávanie zmazaných alebo upravených informácií online môže byť náročná úloha, najmä ak boli odstránené alebo zmenené úmyselne.
Na základe skúseností fakt-checkera môžem potvrdiť, že je často potrebné vyhľadať a nájsť pôvodnú verziu publikovaného materiálu, pretože bol napríklad upravený, zmazaný alebo sa stratili dôležité informácie. Je možné, že stránka bola zmazaná alebo z nejakého iného dôvodu je momentálne nedostupná online. To isté platí pre celé domény webových stránok. V takýchto prípadoch sú tieto informácie sprístupnené vyhľadávačmi, pretože často ukladajú stránku vo svojej pôvodnej forme. Stránka uložená vo vyhľadávači sa nazýva cache. Google používa operátor „cache:“ pre každý odkaz na obnovenie v cache.
Stránka prevzatá z cache Google obsahuje deň, hodinu a minútu, keď systém uložil danú stránku. Treba brať do úvahy, že systém zobrazuje čas podľa GMT, teda londýnskeho času. Na prepnutie na slovenský čas (CET) je potrebné zohľadniť zmeny letného a zimného času, na čo môžete použiť konvertor času http://www.timebie.com/std/gmt.php.
Je dôležité pamätať si, že: nie vždy to funguje. Sú prípady, keď vyhľadávač nestíha ukladať cache alebo naopak, stránku prehodnotí po zmene a posledná verzia je uložená v cache, ktorá je už dostupná v sieti. Z tohto dôvodu je potrebné hľadať cache v niekoľkých systémoch naraz, napríklad „Google“, „Bing“, „Yandex“.
Všetko je jasné? Tak poďme ďalej. Treba brať do úvahy, že cache zmazaných starých stránok (tiež domén webových stránok) sa často odstraňuje aj z vyhľadávačov (dáta môžu byť zmenené/aktualizované na základe mesačných kruhov). V takom prípade navrhujeme použiť alternatívne zdroje. A áno, existujú. Napríklad existujú webové stránky, ktoré ukladajú a archivujú údaje na internete. Takže zmazané stránky, domény, ktoré už dávno nie sú dostupné, informácie odstránené z cache, možno nájsť v internetovom archíve: https://archive.org/web/.
Vyššie uvedená platforma tiež pomáha ľahko prejsť cez platobné brány mnohých webových stránok. Ak váš poskytovateľ internetu blokuje prístup k určitým webovým stránkam, táto platforma vám pomôže obísť tento zákaz. Ale prosím, nehovorte to ostatným ????
Na Archive.org si môžete zaregistrovať bezplatný profil a uložiť potrebné odkazy. Napríklad nejakú publikáciu eD ešte nie je možné nájsť na tejto platforme (ešte nie je “cached”). Ak chceme, aby publikácia bola dostupná skôr, ako boti urobia svoju prácu, musíme uložiť odkaz.
Len malý tip: nie je možné ukladať odkazy na sociálne médiá, takže publikácie na Facebooku, Twitteri, Instagrame, TikToku a iných platformách nemôžete nájsť na Archive.org.
Zhrnutie, cache dostupná vo vyhľadávačoch môže byť užitočná v niekoľkých scenároch:
Nedostupnosť stránky: Ak je webová stránka nedostupná, má problémy so serverom alebo bola odstránená, cez výsledky vyhľadávania Google/Yandex/Bing je stále možné pristupovať k verzii v cache.
Zmeny stránky: Ak bola webová stránka upravená alebo aktualizovaná od posledného indexovania vyhľadávača, verzia v cache môže ukázať, ako stránka vyzerala v tom konkrétnom čase.
Porovnanie: Porovnaním verzie v cache s aktuálnou verziou webovej stránky môžete vidieť, aké zmeny boli časom vykonané.
Ak chcete pristupovať k verzii stránky v cache, môžete vyhľadať stránku na Google/Yandex/Bing a kliknúť na šípku smerom nadol vedľa výsledku vyhľadávania. Z rozbaľovacej ponuky vyberte „Cached“ (Uložené v cache), aby ste videli verziu v cache.
Je dôležité pripomenúť, že cache nie je vždy dostupná pre každú webovú stránku a verzia v cache nemusí zahŕňať všetky prvky alebo funkcie pôvodnej stránky, ako sú interaktívne funkcie alebo dynamický obsah. Navyše, vyhľadávače pravidelne aktualizujú svoju cache, takže staršie verzie webových stránok môžu byť nakoniec nahradené novšími verziami.
Screenshoty v tomto príspevku môžu pomôcť ľahšie pochopiť, ako to funguje.
A pre viac informácií sa odporúčam navštíviť Archive.org: platforma poskytuje API (Application Programming Interface), ktoré umožňuje používateľom pristupovať a využívať archív Wayback Machine webových stránok a domén.