Google dokáže šmírovat všechny lidi na planetě

Článek na Zvědavci (https://zvedavec.news)

URL adresa článku:
https://zvedavec.news/techpor/2010/03/3564-google-dokaze-smirovat-vsechny-lidi-na-planete.htm

Vladimír Stwora

V tomto článku se pokusím ukázat na nebezpečí, které plyne z normálního používání Google, a naznačím cestu, jak se proti tomu bránit.

Používáte Google? Já ano. Odhaduji, že nejméně 10krát denně. Cokoliv, co člověk potřebuje, od jízdního řádu, přes mapu, přes programy kin a divadel, přes zboží, které ho zajímá, přes vlastní zdravotní problémy, o kterých se snaží poučit se na internetu, přes hledání spolužáka, až snad po způsoby pohřbu, vše začíná většinou kliknutím na Google. Tedy pokud už příslušnou adresu nemáte v bookmarks.

Zkoušel jsem různé vyhledávací servisy, Bing, Clusty, Ixquick a další a vždy znovu a znovu jsem se vracel ke Google. Jsou totiž nejlepší. Žádný jiný vyhledávač mi nenabídl tolik relevantních odkazů jako Google.

To by byla prima služba, kdyby to fungovalo z čisté dobroty, eventuálně pro těch pár inzerátů, které vám tam Google nacpe, ale obávám se, že skutečnost je mírně horší. Četl jsem v poslední době několik článků na téma Google a Velký bratr, naposledy třeba Four Top Reasons to Boycott Google. A všechny před Googlem varují. Totiž vypadá to tak, že Google archivuje všechno. Každý vyhledávací termín spolu s datem, časem a vaší IP adresou. Podívejme se na malý příklad. Není od Google, ale naznačí nebezpečí, které se za používáním vyhledávače (každého) skrývá.

V roce 2006 uveřejnila firma AOL úhrnná data za tři měsíce vyhledávání u 650 tisíc svých klientů. Byl z toho tenkrát docela skandál. Databáze je dodneška přístupná. Podívejte se, kdo hledal co. Například takový uživatel číslo 336865 sledovaný 51586krát. Ale, ale, tady vidím, že 9.3.2006 dotyčný hledal „child rape“ znásilnění dítěte. 14.3. hledal „incest story“ - příběhy o incestu, ve stejný den také zadal heslo „preteen sex stories“ příběhy o sexu s nezletilými a také „illegall child porn“. Ve sloupečku vpravo je i příslušná URL adresa, kterou vyhledávač vrátil, a na kterou dotyčný klikl. Bráno z pohledu dnešní hysterie v lovu na pedofily, ten člověk má zaděláno na docela velké problémy.

Co třeba uživatel číslo 22646185 sledovaný 39280krát? Aha, toho vzrušují zřejmě výkaly. Zadávaná hesla z 30.4: 2006: white girls shitting – bílá žena kálí. Ve stejný den hledal live toalet cams of girls shitting – přímý přenos pohledu na kálící dívku. Pěkné prasátko, že?

Když si kliknete na kteréhokoliv uživatele na stránce aolstalker.com, vždy najdete něco, co vám zvedne obočí. Kdož jsi bez viny, hoď kamenem.

Ovšem vyhledávání informací je jen špička ledovce. Google je dnes na internetu tak prolezlé, že téměř nenajdete stránku, kde by neměla své drápky. I oblíbená základní funkce mnoha webových stránek „vyhledej na této stránce“ je zajišťována Google. Je to totiž nejlepší. Než by webmaster investoval čas do vlastního indexování obsahu, přenechá to raději profesionálům z Google. Stejně by nedosáhl takových kvalit jako oni.

A je toho mnohem, mnohem více. Máte gmail? Je na serveru u Google volně k jejich nahlédnutí. Včetně vašich kontaktů. Fotky na Picasu? Jste u Google. Hledáte cestu odněkud někam? Možná používáte mapy.cz, ale Google je často lepší a hlavně funguje na celé planetě. Včetně obrázků z místa, které vás zajímá. Jste na stránkách nějaké firmy a díváte se, kde jsou? Pravděpodobně tam mají svou mapu z Google. Desítky, stovky webových aplikací používají mapy z Google jako podklad, na kterém budují svou nástavbu. Například stránka utrace.de, která vám vrátí přibližnou lokaci kterékoliv IP adresy. Zkuste si například IP adresu jednoho z nezvědavců. Právě jste použili Google a někde je uloženo, že z vaší adresy někdo hledal výše uvedené IP.

Pořád jsme ještě na špičce ledovce. Jaký máte prohlížeč? Vy ještě nemáte Google Chrome? Nevíte, o co přicházíte. Je fakt dobrý. Rychlý a silný. A dobráci z Google zveřejnili také zdrojový kód celého prohlížeče. Prý aby umožnili jeho transformaci do jiných operačních systémů, takže Chrome běží nejen pod Windows, ale i pod Macem a Linuxem.

Hledáte poslední zprávy? Nejlépe rovnou u Google News, která automaticky vyhodnocuje, indexuje a zařazuje stovky tisíc všech zpráv všech sdělovacích prostředků světa (kromě těch disidentských, pochopitelně). Nabídnou vám je utříděně, zprávy z mateřské země první a hned vedle světové. Jak poznají, odkud jste? Podle IP, of course.

Hledáte nějaký konkrétní obrázek něčeho? Použijte Google. Nabídne jich nejvíce.

Co třeba video? Pouze u Google. Mají hned dva velké megaservery. Jeden jejich původní google.videos.[koncovka podle země], druhý – youtube.com. Pod cizí doménou se skrývá starý dobrý Google.

Blog? Samozřejmě. Nejlépe blogspot.com. Opět Google. Ty, co nevlastní, mají zaindexované (blogsearch), takže pokud hledáte něco na jiném blogu, používáte Google.

Namátkou jmenuji další aktivity této „nenápadné“ firmy: Strojové překlady stránek, vyhledávání knih, Google Directory, Google Earth, Google Finance, Google Scholar, Google Trends, Google Code a desítky dalších.

A zdaleka nejsme u konce. Aplikace Google Docs je online kancelář. Dokumenty, kalendář (včetně vašich časových plánů a chystaných návštěv), prezentace a sešity podobné Excelu můžete dělat přímo přes web, pokud využijete službu Google. Mimochodem, mají to šikovně uděláno. Snahou je, abyste všechno, co jste v těchto aplikacích vytvořili, uložili zase u Google. Jo, můžete si to zaheslovat, ale pochybuji, že to je pro chlapce z Google problém.

Mailing listy, diskuzní skupiny, IM – Google.

Z čirého altruismu a jen proto, že má rád lidi, začal Google nabízet také vlastní veřejné DNS servery. Mají lehce zapamatovatelná čísla 8.8.8.8 a 8.8.4.4. Pro neodborníky: DNS server transformuje URL adresu, tu kterou napíšete do políčka prohlížeče, a která zní třeba www.seznam.cz , do číselné podoby. Představte si DNS databázi jako něco podobného telefonnímu seznamu. Myslíte, že je pro Google problém uložit si vaši IP adresu a adresu, kterou hledáte?

Nepoužíváte DNS od Google? Nevadí, Google se i tak dozví o podstatném množství vámi navštívených stránek a to díky další skvělé nabízené službě Google Analytics. Umožňuje provozovatelům webu poměrně slušnou analýzu návštěvnosti jejich stránek včetně sledování trendů. Řada webmasterů si příslušný šmírující kód od Google sama vloží na své stránky, takže Google má přesný přehled o tom, kdo a kdy navštívil příslušné stránky, a co na nich dělal.

Jiná mucholapka na nic netušící veřejnost jsou AdSense – reklamní bannery dodávané Googlem na webové stránky chudších webmasterů (Zvědavec je měl také, než mu je Google zrušil. Naštěstí :-)). V okamžiku, kdy si na stránku s inzeráty od Google kliknete, v Google to už vědí.

A třešničkou na dortu je, že můžete použít Google software (dodají zdarma) k indexování dokumentů, fotografií, hudby, videí na vašem vlastním počítači. Tak říkajíc off-line. No, pokud tomu věříte...

Zmínil jsem v posledním odstavci dodávku zdarma. Zdarma je od Google všechno, vždy a za všech okolností. Google jsou dobráci, kteří vyvinou špičkový software, dodají vám ho a nic, vůbec nic za to nechtějí. Jeden by je až zulíbal. Kde dnes najdete takové dobráky?

Google začal vyrábět a nabízet i mobily, nabízejí telefonování přes internet VoIP, nabízejí dokonce levné notebooky, na kterých bude běžet nikoliv Windows nebo Linux, ale jejich vlastní operační systém Google Chrome. Je to původně jen prohlížeč, zmínil jsem ho výše, ale v Google se rozhodli, že ho malinko rozšíří a udělají z něj rovnou celý hlavní operační systém. Pro uživatele příjemný, bez nastavování. Základní myšlenkou je – nic na vlastním počítači nemít. Všechna data, všechny aplikace - kde? U strýčka Google. No neberte to, když je to zadarmo.

Nemyslím, že jsem pokryl veškeré aktivity Google, ale pro představu nahánějící strach by to mohlo stačit. Podstatné je, že všechno, co na internetu děláte, je dnes nějak spojeno s Googlem. A Google si o tom uschovává záznam. Možná neví, jak se jmenujete (na 99% to ví), ale ví, kde bydlíte, zná vaše bydliště jak ze vzduchu, tak z detailu (projekt Google Earth a StreetView), ví, kdo bydlí ve vašem sousedství, jak vypadá, co má rád, dokáže si propojit vaši tvář (protože jste se plácli do Picasa nebo na Facebook, nebo jste se prostě poslali emailem někomu, šance, že někde proběhl po síti váš obrázek, je vysoká), s vaší IP adresou, s obsahem vašich emailů, často dokonce s obsahem vašeho disku.

Samozřejmě, že ty informace nejsou ucelené, ale Google je mistr v prosévání, analyzování a indexování obřích datových souborů. Když si propojí všechny aktivity do jedné pavučiny, získá se neuvěřitelně přesný obraz vašich zájmů, starostí, slabostí i názorů. Tak přesný, že byste to ani vy sami o sobě nebyli schopni sepsat.

IP adresy se sice často dynamicky mění, ale ne tak často, jako v dobách vytáčeného spojení. Většinou máte svou dynamicky přidělenou adresu na leasing po řadu týdnů, měsíců, někdy i roků. Dost na sběr údajů. A IP adresa zdaleka není jediným styčným bodem. Mimo to Google intenzivně využívá cookies, cross-site cookies (to jsou cookies, které uloží jedna stránka a přečte si je jiná, není to sice běžné, ale lze to), a dalších nástrojů.

Google má velmi těsné vazby na CIA a další americké špionážní agentury, dodává klíčovou technologii jak CIA, tak americké armádě, dokonce jim poskytuje své servery pro projekt Intellipedia, což je hlavní online platforma CIA pro sběr, analýzu a sdílení informací mezi jejími špióny a agenty. Mapovací software, který používá CIA a americká armáda pro své invaze, okupace a zasahování do vnitřních záležitostí suverénních států byl vyvinut pobočkou Google – tou stejnou, která vyrobila Google Earth.

Domnívám se, že Google je pro americké šmíráky cennější než Echelon, cennější než špionážní družice zavěšené na oběžných dráhách, cennější než cokoliv, co kdy měli. Je to dokonalý nástroj na šmírování všech lidí na planetě. Bezbolestný, pro běžnou veřejnost důvěryhodný. Nabízí zdarma opravdu hezké aplikace, tedy přímo špičkové. To, co s našimi daty dělá vzadu v kuchyňce, se ovšem nikdy nedozvíme. Ale jedno by nám to být nemělo.

A teď co se s tím dá dělat.

Obrana

Řekněme si rovnou, že obrana je poměrně složitá, vyžaduje základní počítačové znalosti, přijdete při jejím aplikování o velkou míru pohodlí a to hlavní - není úplně neprůstřelná. Google je tak neuvěřitelně prorostlý vším na internetu, že úplně se vyhnout jeho chapadlům už není možné. Ale můžete mu to malinko ztížit.

V podstatě lze obranu shrnout do tří základních bodů:

- anonymní nebo cizí IP adresa;
- žádné cookies;
- vypnutí JavaScriptu
- teorie otisků a podvržení User-Agent string

Mimoto ten, kdo se nechce vydat Google, by měl samozřejmě přestat používat všechny jeho úžasné hračky od Picasa přes mapy, Office Online, gmail a další. Jmenoval jsem podstatnější z nich výše.

Vypnutí JavaScriptu

Proč? Protože JavaScript má nepříjemnou schopnost prozradit vaši skutečnou IP adresu (a další informace) i když jste schováni za proxy serverem.

Okamžitě zjistíte, že vám přestaly fungovat tři čtvrtiny všech webových stránek. Bez JavaScriptu se dnes téměř nikam nedostanete. Zbývá jediné. Nainstalovat si doplněk k prohlížeči, který bude JavaScript povolovat jen dočasně a na vybraných stránkách. Pro Firefox se jmenuje NoScript, u jiných prohlížečů ani nevím, zda něco takového existuje. Po instalaci si ale musíte ještě projít předdefinovaný whitelist (seznam povolených stránek) a ručně vymazat všechny odkazy na Google, je jich tam několik.

Počítejte s tím, že zákaz JavaScriptů je velmi nepříjemný a je nesmírně otravné pokaždé při návštěvě stránky je dočasně povolovat.

Vypnutí cookies

Google si intenzivně ukládá u vás cookies a to z každé jejich stránky a dokáže je číst napříč různými stránkami, ačkoliv je to v podstatě nepovolená operace, určitá forma hackingu.

Na svém prohlížeči jsem to vyřešil tak, že jsem cookies povolil, ale jejich platnost jsem omezil jen do doby, než zavřu prohlížeč. V okamžiku, kdy jej znovu otevřu, mám všechna předchozí cookies pryč a začínám z čisté vody.

A opět zjistíte, že u mnoha stránek to velmi vadí, například u webových stránek bank. Je tedy nutno ručně povolovat stránky, u kterých cookies mohou zůstat i po uzavření prohlížeče.

Anonymní nebo cizí IP adresa

Tohle se ukázalo jako nejtěžší oříšek. Ne, že bych nevěděl, jak nastavit proxy server, ale kdo někdy používal anonymní proxy, ví, jak jsou (a) nespolehlivá, (b) pomalá. A to nemluvím o tom, že nikdy nevíte, KDO se ve skutečnosti skrývá za anonymním proxy serverem. Podle mého názoru jsou anonymní proxy ideální mucholapkou využívanou policejními a represivními složkami kteréhokoliv státu. Jejich zřízení a provoz jsou nenáročné jak technicky tak finančně a je vysoká šance, že je budou používat ti, kteří pro to mají důvod. Mají co skrývat. Tak proč si rovnou neukládat jejich IP adresy, že? Nevím, jestli to policie skutečně dělá, ale byla by hloupá, kdyby to nedělala. Takže anonymním proxy serverům ze zásady nevěřím.

Navíc anonymní proxy servery mají nepříjemnou vlastnost nefungovat, když zrovna nejvíc spěcháte a něco rychle potřebujete najít.

TOR

Ano, odpověď je TOR. Alespoň do jisté míry. Ale i TOR je často neskutečně pomalý, pokud vás náhodou zrovna propojí s někým na Madagaskaru, kdo používá vytáčené spojení. Nebo stačí, aby kdekoliv na cestě mezi vámi a koncovou IP adresou se to zaseklo (TOR běží přes mnoho uzlů, přičemž cesta paketů se dynamicky mění) a pak čekáte a čekáte...

V praxi jsem si ověřil, že používat TOR na seznam odkazů nabídnutých Googlem je v podstatě nemožné. Z důvodu rychlosti. Nebo spíše pomalosti. Ideální by bylo použít TOR jen pro Google a při klikání na jednotlivé odkazy už jít přímo.

Řešení se nabídlo v šikovném doplňku Firefoxu FoxyProxy. Opět – pokud nepoužíváte Firefox, máte patrně smůlu. FoxyProxy umožňuje dynamicky měnit proxy server podle toho, co jste zadali do adresního řádku. Při konfiguraci FoxyProxy pak stačí nadefinovat, aby všechno, co v sobě obsahuje slovo *google* (hvězdičky nahrazují cokoliv), šlo přes proxy, všechno ostatní pak může jít rovnou.

Myslíte, že máte vyhráno? Ani zdaleka. Google pozná, že vy nejste vy, a při každém pokusu něco najít na vás vybafne stránka (viz obrázek)

[Google je sorry]

tvrdící vám, že z důvodu vaší bezpečnosti (samozřejmě, jak jinak) musíte potvrdit, že nejste robot, a na důkaz opsat text z captcha obrázku. Písmenka jsou ale tak rozházená, že se často nestrefíte a budete muset zkoušet znovu.

Je v tom vztek, že jste si dovolili se skrývat, žádná ochrana uživatelů, jak se vám snaží namluvit. A pro vás to znamená další zdržovačku. Navíc naťukat písmena z divokého obrázku je někdy problém, jsou téměř nečitelná.

Teorie otisků a podvržení User-Agent string

Udělali jste všechno, co navrhuji? Mám pro vás špatnou zprávu. Je to skoro k ničemu. Přečtěte si článek na root.cz Váš prohlížeč je identifikovatelný i bez cookies, kde je podrobně vysvětleno, jak lze identifikovat váš prohlížeč na základě informací, které o vás prozradí on sám. Zejména kritickou je hlavička User-Agent, která nese informaci o přesné verzi jádra prohlížeče, akceptovaném jazyku a operačním systému. K identifikaci se používá teorie entropie: jak velká je skupina, která má stejné identifikační znaky, jako váš prohlížeč. Vyzkoušejte si Panopticlick a pokud uníte anglicky, přečtěte si článek A Primer on Information Theory and Privacy na stejném serveru.

Z obou článků, jak toho českého, tak toho anglického, vyplývá doporučení změnit informace v User-Agent string a dalších polích hlavičky tak, aby se váš prohlížeč prezentoval jako člen co největší skupiny. To lze udělat několika způsoby. Pokud máte Firefox, bude zřejmě nejjednodušší nainstalovat doplněk TOR Button. Pokud Firefox nepoužíváte, lze nastavit podvržení User-Agent string v aplikaci Polipo, která se instaluje automaticky jako součást instalace TOR.

Závěr

Uvedené metody jsou drastické a nepohodlné. Záleží na tom, jak moc si ceníte svého soukromí. Sám jsem se dokázal vycvičit a přinutit se je používat. Zvyknete si. Mně to trvalo asi měsíc. Samozřejmě nedělám si iluze, že Google ví o mé osobě dost na pěkně tlustý fascikl. Ale těší mě, že neví úplně všechno. Mám pocit, že naše soukromí se stává nesmírně cennou devizou a že stojí za trošku námahy si je chránit.

Článek byl publikován 4.3.2010


© 2024-1999 Vladimír Stwora
Článek je možno dále šířit podle licence Creative Common.