Společnost Google oficiálně zavedla svou novou technologii v oblasti indexování dat na internetu, zvanou Google Caffeine. O co se jedná a co nového přináší?
<script type='text/javascript'></script>
Tento projekt vznikl na základě růstu informací na internetu, nárůstem internetových stránek a jiných dat, která jsou zde obsažena. Právě tento vzestupný směr byl pro starší vyhledávací systém čím dál těžší a čerstvost informací měla spíše sestupnou tendenci.
Hlavním rozdílem oproti staršímu systému je více obsahu a až o 50 % rychlejší a především čerstvější výsledky. Starší systém totiž využíval technologii rozdělení internetových stránek do vrstev. Tyto vrstvy pak byly nepravidelně a pouze jednorázově aktualizované. To způsobovalo značnou prodlevu, než jsme nové informace mohli získat. Caffeine provádí pravidelnou aktualizaci ve zmenšených částech, což mu umožňuje rychlejší indexaci nových informací na internetu. Můžeme tak najít čerstvější informace rychleji, než kdy dříve.
Dříve Google indexoval internetové sektory jen jednou za určitou dobu (např. 4 měsíce nebo 30 dní), nyní je to jen pár sekund. Navíc Caffeine prochází web neustále, čili se nejedná pouze o jednorázové aktualizování.
Tato technologie byla samozřejmě podrobena testování a podle odborníků skutečně funguje. Také redaktoři, kteří ji zkoušeli, uvedli, že nově přidaný článek na internetu byl zaindexován téměř okamžitě. Navíc byla rozpoznána i lepší schopnost rozdělení obsahu – grafické prvky, jazyk apod.
Caffeine zabere kolem 100 milionů gigabytů v jedné databázi a za den se přidá stovky tisíc gigabytů nových informací. Pro představu: pro uložení takového množství dat bychom potřebovali 625 000 iPodů s největší možnou kapacitou.