Jak vyhledávače vyhledávají, procházejí a indexují váš obsah?

Search Engine Optimization

Často nedoporučuji, aby si klienti budovali své vlastní systémy elektronického obchodování nebo správy obsahu kvůli všem neviditelným možnostem rozšiřitelnosti, které jsou dnes zapotřebí - primárně zaměřené na vyhledávání a sociální optimalizaci. Napsal jsem článek o jak vybrat CMS a stále to ukazuji společnostem, se kterými pracuji, které jsou v pokušení postavit si vlastní systém pro správu obsahu.

Existují však absolutně situace, kdy je vlastní platforma nutností. I když je to optimální řešení, stále tlačím na své klienty, aby vytvořili nezbytné funkce k optimalizaci svých stránek pro vyhledávání a sociální média. V zásadě existují tři klíčové funkce, které jsou nezbytností.

  • robots.txt
  • XML Mapa
  • Metadata

Co je soubor Robots.txt?

robots.txt soubor - robots.txt soubor je soubor ve formátu prostého textu, který je v kořenovém adresáři webu a sděluje vyhledávacím strojům, co by měly obsahovat a vyloučit z výsledků vyhledávání. V posledních letech vyhledávače rovněž požadovaly, abyste do souboru zahrnuli cestu k souboru XML Sitemap. Tady je můj příklad, který umožňuje všem robotům procházet můj web a také je přesměruje na můj soubor Sitemap XML:

User-agent: *
Sitemap: https://martech.zone/sitemap_index.xml

Co je soubor XML Sitemap?

XML Mapa - Stejně jako je HTML pro prohlížení v prohlížeči, XML je psán tak, aby byl programově tráven. Sitemap XML je v podstatě tabulka každé stránky na vašem webu a kdy byla naposledy aktualizována. Soubory XML Sitemap lze také řetězit… to je jeden soubor XML Sitemap, který může odkazovat na jiný. To je skvělé, pokud chcete logicky uspořádat a rozdělit prvky vašeho webu (časté dotazy, stránky, produkty atd.) Do jejich vlastních souborů Sitemap.

Soubory Sitemap jsou nezbytné, abyste mohli efektivně informovat vyhledávače o tom, jaký obsah jste vytvořili a kdy byl naposledy upraven. Proces, který vyhledávač používá při přechodu na váš web, není efektivní bez implementace souboru Sitemap a úryvků.

Bez souboru XML Sitemap, riskujete, že vaše stránky nebudou nikdy objeveny. Co když máte novou vstupní stránku produktu, která není propojena interně ani externě. Jak to Google zjistí? Jednoduše řečeno ... dokud nenajdete odkaz na něj, nebudete objeveni. Naštěstí vyhledávací stroje umožňují systémům pro správu obsahu a platformám elektronického obchodování, aby pro ně vytvořily červený koberec!

  1. Google objeví externí nebo interní odkaz na váš web.
  2. Google indexuje stránku a hodnotí ji podle jejího obsahu a obsahu a kvality webu odkazujícího odkazu.

S XML Sitemap, nenecháváte objev svého obsahu ani jeho aktualizaci na náhodu! Příliš mnoho vývojářů se snaží použít zkratky, které jim také ublíží. Publikují na webu stejný strukturovaný úryvek a poskytují informace, které nejsou relevantní k informacím o stránce. Publikují soubor Sitemap se stejnými daty na každé stránce (nebo se všechny aktualizují při aktualizaci na jedné stránce) a dávají frontám vyhledávačům, že hrají v systému nebo jsou nespolehlivé. Nebo vůbec nepingují na vyhledávače ... takže si vyhledávač neuvědomuje, že byly zveřejněny nové informace.

Co jsou metadata? Mikrodata? Bohaté úryvky?

Bohaté úryvky jsou pečlivě označená mikrodata který je před prohlížečem skrytý, ale je viditelný na stránce pro použití vyhledávači nebo weby sociálních médií. Toto se nazývá metadata. Google vyhovuje Schema.org jako standard pro zahrnutí věcí, jako jsou obrázky, názvy, popisy ... a také spousta dalších informativních úryvků, jako je cena, množství, informace o poloze, hodnocení atd. Schéma výrazně zvýší viditelnost vašeho vyhledávače a pravděpodobnost, že uživatel klikne přes.

Facebook používá OpenGraph protokol (samozřejmě nemohou být stejné), Twitter má dokonce i úryvek k určení vašeho profilu na Twitteru. Stále více platforem používá tato metadata k náhledu vložených odkazů a dalších informací při jejich publikování.

Vaše webové stránky mají základní význam, kterému lidé rozumějí, když čtou webové stránky. Ale vyhledávače mají omezené znalosti o tom, o čem se na těchto stránkách diskutuje. Přidáním dalších značek do kódu HTML svých webových stránek - značek, které říkají: „Hey search engine, this information explains this specific movie, or place, person nebo video“ - můžete vyhledávacím strojům a dalším aplikacím lépe porozumět vašemu obsahu a zobrazit je užitečným a relevantním způsobem. Microdata je sada značek zavedená s HTML5, která vám to umožňuje.

Schema.org, Co je MicroData?

Nic z toho samozřejmě není požadováno ... ale velmi je doporučuji. Když například sdílíte odkaz na Facebooku, a neobjeví se žádný obrázek, název nebo popis ... jen málo lidí bude mít zájem a skutečně klikne. A pokud vaše úryvky schématu nejsou na každé stránce, můžete se samozřejmě stále zobrazovat ve výsledcích vyhledávání ... ale konkurenti vás mohou porazit, když mají zobrazeny další informace.

Zaregistrujte své soubory Sitemap XML ve službě Search Console

Je nezbytně nutné, pokud jste si vytvořili vlastní platformu pro obsah nebo elektronický obchod, že máte subsystém, který testuje ping na vyhledávače, publikuje mikrodata a poté poskytuje platný soubor XML pro vyhledání obsahu nebo informací o produktu!

Jakmile bude váš soubor robots.txt, soubory Sitemap XML a strukturované úryvky přizpůsobeny a optimalizovány na celém vašem webu, nezapomeňte se zaregistrovat do vyhledávací konzoly každého vyhledávače (známé také jako nástroj pro webmastery), kde můžete sledovat stav a viditelnost vašeho web ve vyhledávačích. Můžete dokonce zadat cestu k souboru Sitemap, pokud není uvedena, a zjistit, jak ji vyhledávač spotřebovává, zda s ní jsou či nejsou nějaké problémy, a dokonce i to, jak je opravit.

Rozbalte červený koberec do vyhledávačů a sociálních médií a zjistíte, že se vaše stránky lépe hodnotí, vaše záznamy na stránkách s výsledky vyhledávačů více proklikávají a vaše stránky sdílejí více na sociálních médiích. Všechno se to sčítá!

Jak Robots.txt, Sitemap a MetaData spolupracují

Kombinace všech těchto prvků je hodně jako rozbalení červeného koberce pro vaše stránky. Tady je proces procházení, který robot bere spolu s tím, jak vyhledávač indexuje váš obsah.

  1. Váš web obsahuje soubor robots.txt, který také odkazuje na vaše umístění XML Sitemap.
  2. Váš systém CMS nebo elektronický obchod aktualizuje soubor XML Sitemap o jakoukoli stránku a zveřejňuje datum nebo upravuje informace o datu.
  3. Váš systém CMS nebo elektronický obchod provede ping na vyhledávače a dá jim vědět, že váš web byl aktualizován. Můžete na ně pingnout přímo nebo použít RPC a službu jako Ping-o-matic přejít na všechny klíčové vyhledávače.
  4. Vyhledávací modul se okamžitě vrátí, respektuje soubor Robots.txt, vyhledá nové nebo aktualizované stránky prostřednictvím souboru Sitemap a poté stránku indexuje.
  5. Když indexuje vaši stránku, využívá mikrodata rich snippet k vylepšení stránky s výsledky vyhledávače.
  6. Vzhledem k tomu, že na váš obsah odkazují jiné relevantní stránky, je váš obsah lepší.
  7. Jelikož je váš obsah sdílen na sociálních médiích, mohou uvedené informace o strukturovaných úryvcích pomoci správně zobrazit náhled obsahu a nasměrovat je na váš sociální profil.

2 Komentáře

  1. 1

    můj web není schopen indexovat nový obsah, načítám soubor Sitemap a adresy URL na webmastera, ale stále to nemohu vylepšit. Je to problém s backendem google?

Co si myslíte?

Tyto stránky používají Akismet k omezení spamu. Zjistěte, jak jsou vaše údaje komentářů zpracovávány.