SEO, meta tagy, manifest.json, robots.txt, sitemap.xml atd atd. rubrika: SEO
Zdravím,
neviem jak bych tento dotaz celý zformuloval, no začal by som asi tým jak to zatím mám ja.
Momentálne dokončujem jeden projekt, v ktorom používam len pár metatagov ako napr. charset, viewport a X-UA-Compatible, tie samozrejme sú bežné, a na SEO veľký vliv (snaď až na viewport) nemajú. Okrem týchto tu mám ešte description a theme-color. A to je všetko. V prípade manifest.json súboru mám vyplnené hodnoty: name, short_name, description, author, lang, icons, theme_color, background_color, start_url, a display. Robots.txt nemám, sitemap.xml taky nemám, i když uvažujem že sitemap.xml vytvorím.
Teraz by som tu dal pár otázok:
Aké meta tagy a hodnoty v manifeste vyplňujete u svojich projektoch?
Používate robots.txt a sitemap.xml?
ďalej:
Aké sú vaše všeobecné názory?
Čo by ste určite doporučili, a čo nemá veľký zmysel riešiť?
v prípade sitemap.xml, má zmysel v prípade stránky o desiatich podstránkach? prípadne od ako veľkej stránky podľa vás má zmysel tento súbor vytvoriť.
Jak veľký vliv na SEO majú všetky tieto zmínené "veci"?
Okrem toho bych byl rád za nejaké rady. Viem že základom je obsah, ten už mám vytvorený, v mojom prípade sa jedná o webovú aplikáciu, takže textového obsahu je tam menej (nie ako u blogoch či spravodajských portáloch), skôr tam mám prvky ako grafy, tabuľky, kalkulačku, a iné interaktívne prvky, to je myslím OK, ovšem okrem textového či iného obsahu si myslím že je dobré sa pozrieť aj na meta tagy a pod. Preto to tu píšem. ďakujem sa vaše názory a prípadne rady.
(Skôr sa jedná len o také všeobecnejšie kecanie o týchto veciach, zatím žiadny konkrétny problém so SEO nemám, keďže ešte som svoj projekt neuverejnil.)
Môj osobný názor zatím je že robots.txt je často nepotrebný a nemyslím si že má zmysel ho riešiť. Sitemap.xml má zmysel stránok s veľkým počtom podstránok, a že meta tagy a manifest.json stačí vyplniť tak ako som ho vyplnil ja (i když u meta tagov a manifest.json bych se nechal rýchlo presvedčiť).
Zkusím být věcný stručný.
Tag head
Pořadí tagů přímo ovlivňuje rychlost načítání a rendering (pre-rendering). Mít tagy link
nad script
je naprosté minimum. Obecně platí dávat nahoru tagy, které slouží k identifikaci stránky.
Rychlost renderingu také přímo ovlivňují hlavičky posílané serverem, např. uvedení kódování dokumentu atp.
Příklad pro multijazyčný web s jazykovými verzemi uvnitř URL, česká verze je primární. Příklad je primitivní, nereflektuje asynchronní načítání stylopisů, scriptů nebo písem.
<!DOCTYPE html> <html lang="cs"> <head> <meta charset="utf-8"> <meta name="robots" content="index,follow"> <link rel="alternate" hreflang="cs-cz" href="https://www.example.com/cs/"> <link rel="alternate" hreflang="en" href="https://www.example.com/en/"> <link rel="alternate" hreflang="fr-fr" href="https://www.example.com/fr/"> <link rel="canonical" href="https://www.example.com/cs/"> <meta name="viewport" content="width=device-width, initial-scale=1.0, minimum-scale=1.0"> <meta name="skype_toolbar" content="skype_toolbar_parser_compatible"> <meta http-equiv="X-UA-Compatible" content="IE=edge"> <title>Název stránky</title> <meta name="description" content="Popis stránky"> <meta name="author" content="autor obsahu, neplést s tagem generator atp."> <!-- pozor na případný konflikt při implementaci dalších metadat --> <link rel="stylesheet" href=""> <script src=""></script> <meta property="og:type" content="website"> <!-- website je obecný, nutno zkontrolovat povahu stránky a nastavit správný typ a k tomu náležející parametry --> <meta property="og:url" content="http://www.example.eu/cs/"> <meta property="og:site_name" content="Název webu (na všech stránkách stejný)"> <meta property="og:title" content="Název stránky (může být shodný s meta title)"> <meta property="og:description" content="Popis stránky (může být stejný jako meta description)"> <meta property="og:image" content="kanonická URL na obrázek dle specifikace (měl by být pro každou důležitou stránku jiný - platí pro obsahové weby)"> <meta property="og:image:type" content="image/jpeg"> <meta property="og:image:width" content="1180"> <meta property="og:image:height" content="984"> <meta name="twitter:card" content="summary_large_image"> <!-- summary_large_image je univerzální, nutno zkontrolovat povahu stránky a nastavit správný typ a k tomu náležející parametry--> <meta name="twitter:title" content="Název stránky (může být shodný s meta title)"> <meta name="twitter:description" content="Popis stránky (může být stejný jako meta description)"> <meta name="twitter:url" content="https://www.example.com/cz/"> <meta name="twitter:image" content="kanonická URL na obrázek dle specifikace (měl by být pro každou důležitou stránku jiný - platí pro obsahové weby)"> <link rel="apple-touch-icon" sizes="180x180" href="https://www.example.com/static/icons/apple-touch-icon.png"> <link rel="icon" type="image/png" sizes="16x16" href=".https://www.example.com/static/icons/favicon-16x16.png"> <link rel="icon" type="image/png" sizes="32x32" href="https://www.example.com/static/icons/favicon-32x32.png"> <link rel="manifest" href="https://www.example.com/manifest.json"> <meta name="apple-mobile-web-app-title" content=""> <meta name="application-name" content=""> <meta name="theme-color" content="#000000"> <script type="application/ld+json"></script> </head>
Sémantické označování
- JSON-LD je preferován. Nemusí se parsrovat ze zdrojového kódu jako mikrodata atd.
- Open Graph je doporučený nejen z hlediska sdílení na sociálních sítích, ale i z hlediska indexace. Praktický význam spočívá v tom, že máte v ruce nástroj pro přímé ovlivnění toho, co se primárně zobrazí při sdílení stránky napříč internetem. Nejdůležitější pro sdílení je obrázek, nadpis a popis.
- Twiter Cards podobě jako Open Grapd, pouze pro Twitter. Málo důležité. Pozor na více typů.
- Pinterest sites podobně jako Twitter Cards minoritní.
robots.txt
Jednoznačně ano.
- Primárně k zakázání URL (včetně URL queries) pro jednotlivé nebo všechny roboty. Důležité pro velké weby, kde hrozí, že by byl zbytečnými URL vyčerpán crawl budget.
- Sekundárně k uvedení adresy
sitemap.xml
. Tímto se verifikuje uvedené xml jako důvěryhodné a Google ho bere v potaz.
sitemap.xml
Jednoznačně ano.
- Měl by obsahovat pouze URL důležité z hlediska SEO. Google chápe URL uvedené v
sitemap.xml
jako důležité a indexuje je primárně. - Je výborným místem, kde definovat URL, které mají být z indexu vyhozeny. Zde uvedené URL pro vyhození se nejrychleji zpracují.
- Tag
loc
je povinný, musí obsahovat absolutní a kanonickou URL (samozřejmě stejná jako v meta značce). V případě více jazyků nezapomenout uvést jazykové alternacehrefland
a opět propsat do příslušnýchmeta
. - Tag
lastmod
je sice nepovinný, ale velice důležitý, protože informuje robota o změně a tedy vhodnosti reindexace. Při generování je nutné, aby se změna datumu provedla vždy při větší změně obsahu stránky. Tj. ne jen při opravě překlepů :-) Google často aktualizované stránky s minimální změnou částečně penalizuje. - Tagy
changefreq
aprio
nejsou při správném používánílastmod
důležité. - Podívat se na specifikaci pro vkládání obrázků nebo videí, u větších projektů opět k vůli cwarl budgetu nezahrnovat a využít JSON-LD.
- Do sitemap nevkládat URL na články (novinky) a místo toho využít formát pro RSS/Atom feedy (nezapomenout propsat do
meta
značky. - Pro větší projekty je dobré si přečíst specifikaci, např. omezení na 50 MB v nekomprimovaném stavu (lze
index.xml.gz
), max. 50000 URL, využítsitemap-index.xml
resp.sitemap-index.xml.gz
.
Co by se nemělo do XML dostat:
- ne-kanonické stránky,
- duplicitní stránky,
- stánky se stránkováním 2+ včetně,
- s parametry nebo session ID,
- výsledky vyhledávání (interní),
- různé verze vzniklé pro sdílení (zkrácené pro twitter, do e-mailu atp.),
- URL vzniklé použitím filtrováním, které nejsou důležité pro indexaci (viz SEO vzorce a noindex),
- archivované stránky,
- jakékoli redirecty 3xx, chybějící stránky 4xx nebo chybové 5xx,
- stránky blokované v robots.txt,
- stránky v noindex,
- stránky po odeslání formuláře atp.,
- stránky, které mají význam jen pro uživatele jako je login, kontaktní formulář, privacy policy atp.
K samostudiu: Index Coverage report, Google News Sitemap.
security.txt
- Užitečné pro reportování chyb viz https://securitytxt.org/. Celkem by ušetřilo práci viz Globální scan otevřených .git repozitářů.
manifest.json
- Viz vlákno od @marekzprahy. Mám napsat víc?
browserconfig.xml a Pinned Sites
- Netřeba explicitně uvádět v
meta
tagu, Internet Explorer si sám na soubor sáhne. - Minoritní, jen pro uživatele Window 8+. Málokdo o té funkci ve Windows ví. Síla spočívá spíše v uvedení a aktualizací feedů atp.
humans.txt
- celkem sranda viz http://humanstxt.org/CZ
Ikony
- viz nástroj https://realfavicongenerator.net/
Pro zobrazení všech 3 odpovědí se prosím přihlaste:
Nebo se přihlaste jménem a heslem:
Komentáře