Co znamená duplicitní obsah a proč vyhledavačům vadí?
Tzv. duplicitní obsah vzniká tehdy, pokud více různých adres (URL) ukazuje na totožnou stránku, či na stránky s velmi podobným obsahem. Nejčastějším, nikoli však jediným, typem duplicitního obsahu jsou totožné stránky odkazované z různých míst čtyřmi různými adresami, např.:
http://example.com/
http://example.com/index.htm
http://www.example.com/
http://www.example.com/index.htm
Vyhledavače chtějí nabídnout uživatelům výsledky vyhledávání, ve kterých se neopakují stejné nebo velmi podobné stránky. Proto jsou na duplicitní obsah citlivé. Z výše uvedených čtyř variant si vyhledavač obvykle vybere jen jednu a ostatní ve výsledcích vyhledávání nezobrazuje. Někdy navíc ignoruje i zpětné odkazy na ostatní varianty URL a stránka tak ztrácí cenné body určující její pozici.
Duplicitní obsah často vzniká i automatickým (a většinou zbytečným) připojováním tzv. session ID ke každému internímu odkazu—viz též: Jak mám navrhnout URL stránek, aby je Google indexoval?.
Jak se duplicitnímu obsahu vyhnout
Všude, kde máte odkazy na své stránky pod kontrolou (na vlastním webu, v katalozích apod.), používejte pro každou stránku jen jedinou verzi URL. Zejména se vyhněte uvádění výchozích dokumentů (index.php apod.) v URL.
Pokud už na nějakou vaši stránku vede víc odkazů s různými URL, které nemáte pod kontrolou, nebo jejich vznik hrozí (typické pro varianty s a bez www na začátku), nastavte přesměrování HTTP hlavičkou 301 z nepreferovaných variant na variantu preferovanou.
Nepoužívejte tzv. doménové aliasy. Máte-li pro jeden web více domén, vždy pomocí kódu 301 přesměrovávejte ze všech nepreferovaných domén na jedinou preferovanou doménu.
Na veřejně přístupném webu se vyhněte vkládání session id do URL.
Oficiální vyjádření Googlu k duplicitnímu obsahu z 18. 12. 2006 (anglicky):
Deftly dealing with duplicate content.