Seznam.cz, Praha - Hlavní změnou je jiný způsob uložení slov v databázi (indexu) hledání.
Co bylo tedy předmětem změny?
Dříve jsme měli v databázi uložená tzv. “lemmata” - tj. základní tvar každého zaindexovaného slova. Výhodou bylo jednodušší vyhodnocování dotazů, protože se pro každé slovo hledalo jedno lemma a ne množství různých tvarů. Toto byla paradoxně i největší nevýhoda - nebylo možné rozlišovat tvary jednoho slova, což se zvláště negativně projevovalo u slov jejichž některý tvar kolidoval s jiným dotazem.
Nové zpracování oproti tomu ukládá do databáze všechna slova v takovém tvaru, tak jak se přesně vyskytují na stránce a následně pak rozšiřuje slova dotazu o možné tvary. Vyhodnocení je o něco náročnější, ale umožňuje řídit jak se které slovo má přesně vyhledat.
Co je vidět na searchtestu?
Databáze hledání, která je vidět na searchtestu, vznikla konverzí z produkční databáze (cca z konce června 2010). Konverze znamená, že aktuální test kopie databáze si ssebou stále nese staré nešvary a pro projevení všech změn bude potřeba reindexovat všechny stránky.


