SEO, meta tagy, manifest.json, robots.txt, sitemap.xml atd atd. rubrika: SEO

6 Mlocik97
položil/-a 13.9.2018
 
upravil/-a 13.9.2018

Zdravím,

neviem jak bych tento dotaz celý zformuloval, no začal by som asi tým jak to zatím mám ja.

Momentálne dokončujem jeden projekt, v ktorom používam len pár metatagov ako napr. charset, viewport a X-UA-Compatible, tie samozrejme sú bežné, a na SEO veľký vliv (snaď až na viewport) nemajú. Okrem týchto tu mám ešte description a theme-color. A to je všetko. V prípade manifest.json súboru mám vyplnené hodnoty: name, short_name, description, author, lang, icons, theme_color, background_color, start_url, a display. Robots.txt nemám, sitemap.xml taky nemám, i když uvažujem že sitemap.xml vytvorím.


Teraz by som tu dal pár otázok:

Aké meta tagy a hodnoty v manifeste vyplňujete u svojich projektoch?
Používate robots.txt a sitemap.xml?

ďalej:
Aké sú vaše všeobecné názory?
Čo by ste určite doporučili, a čo nemá veľký zmysel riešiť?
v prípade sitemap.xml, má zmysel v prípade stránky o desiatich podstránkach? prípadne od ako veľkej stránky podľa vás má zmysel tento súbor vytvoriť.

Jak veľký vliv na SEO majú všetky tieto zmínené "veci"?


Okrem toho bych byl rád za nejaké rady. Viem že základom je obsah, ten už mám vytvorený, v mojom prípade sa jedná o webovú aplikáciu, takže textového obsahu je tam menej (nie ako u blogoch či spravodajských portáloch), skôr tam mám prvky ako grafy, tabuľky, kalkulačku, a iné interaktívne prvky, to je myslím OK, ovšem okrem textového či iného obsahu si myslím že je dobré sa pozrieť aj na meta tagy a pod. Preto to tu píšem. ďakujem sa vaše názory a prípadne rady.

(Skôr sa jedná len o také všeobecnejšie kecanie o týchto veciach, zatím žiadny konkrétny problém so SEO nemám, keďže ešte som svoj projekt neuverejnil.)


Môj osobný názor zatím je že robots.txt je často nepotrebný a nemyslím si že má zmysel ho riešiť. Sitemap.xml má zmysel stránok s veľkým počtom podstránok, a že meta tagy a manifest.json stačí vyplniť tak ako som ho vyplnil ja (i když u meta tagov a manifest.json bych se nechal rýchlo presvedčiť).

odkaz
3 cebreus
odpověděl/-a 14.9.2018

Zkusím být věcný stručný.

Tag head

Pořadí tagů přímo ovlivňuje rychlost načítání a rendering (pre-rendering). Mít tagy link nad script je naprosté minimum. Obecně platí dávat nahoru tagy, které slouží k identifikaci stránky.

Rychlost renderingu také přímo ovlivňují hlavičky posílané serverem, např. uvedení kódování dokumentu atp.

Příklad pro multijazyčný web s jazykovými verzemi uvnitř URL, česká verze je primární. Příklad je primitivní, nereflektuje asynchronní načítání stylopisů, scriptů nebo písem.

<!DOCTYPE html>
<html lang="cs">
<head>
    <meta charset="utf-8">
    <meta name="robots" content="index,follow">
    <link rel="alternate" hreflang="cs-cz" href="https://www.example.com/cs/">
    <link rel="alternate" hreflang="en" href="https://www.example.com/en/">
    <link rel="alternate" hreflang="fr-fr" href="https://www.example.com/fr/">
    <link rel="canonical" href="https://www.example.com/cs/">
 
    <meta name="viewport" content="width=device-width, initial-scale=1.0, minimum-scale=1.0">
    <meta name="skype_toolbar" content="skype_toolbar_parser_compatible">
    <meta http-equiv="X-UA-Compatible" content="IE=edge">
 
    <title>Název stránky</title>
    <meta name="description" content="Popis stránky">
    <meta name="author" content="autor obsahu, neplést s tagem generator atp."> <!-- pozor na případný konflikt při implementaci dalších metadat -->
 
    <link rel="stylesheet" href="">
    <script src=""></script>
 
    <meta property="og:type" content="website"> <!-- website je obecný, nutno zkontrolovat povahu stránky a nastavit správný typ a k tomu náležející parametry -->
    <meta property="og:url" content="http://www.example.eu/cs/">
    <meta property="og:site_name" content="Název webu (na všech stránkách stejný)">
    <meta property="og:title" content="Název stránky (může být shodný s meta title)">
    <meta property="og:description" content="Popis stránky (může být stejný jako meta description)">
    <meta property="og:image" content="kanonická URL na obrázek dle specifikace (měl by být pro každou důležitou stránku jiný - platí pro obsahové weby)">
    <meta property="og:image:type" content="image/jpeg">
    <meta property="og:image:width" content="1180">
    <meta property="og:image:height" content="984">
 
    <meta name="twitter:card" content="summary_large_image"> <!-- summary_large_image je univerzální, nutno zkontrolovat povahu stránky a nastavit správný typ a k tomu náležející parametry-->
    <meta name="twitter:title" content="Název stránky (může být shodný s meta title)">
    <meta name="twitter:description" content="Popis stránky (může být stejný jako meta description)">
    <meta name="twitter:url" content="https://www.example.com/cz/">
    <meta name="twitter:image" content="kanonická URL na obrázek dle specifikace (měl by být pro každou důležitou stránku jiný - platí pro obsahové weby)">
 
    <link rel="apple-touch-icon" sizes="180x180" href="https://www.example.com/static/icons/apple-touch-icon.png">
    <link rel="icon" type="image/png" sizes="16x16" href=".https://www.example.com/static/icons/favicon-16x16.png">
    <link rel="icon" type="image/png" sizes="32x32" href="https://www.example.com/static/icons/favicon-32x32.png">
    <link rel="manifest" href="https://www.example.com/manifest.json">
 
    <meta name="apple-mobile-web-app-title" content="">
    <meta name="application-name" content="">
    <meta name="theme-color" content="#000000">
 
    <script type="application/ld+json"></script>
</head>

Sémantické označování

  • JSON-LD je preferován. Nemusí se parsrovat ze zdrojového kódu jako mikrodata atd.
  • Open Graph je doporučený nejen z hlediska sdílení na sociálních sítích, ale i z hlediska indexace. Praktický význam spočívá v tom, že máte v ruce nástroj pro přímé ovlivnění toho, co se primárně zobrazí při sdílení stránky napříč internetem. Nejdůležitější pro sdílení je obrázek, nadpis a popis.
  • Twiter Cards podobě jako Open Grapd, pouze pro Twitter. Málo důležité. Pozor na více typů.
  • Pinterest sites podobně jako Twitter Cards minoritní.

robots.txt

Jednoznačně ano.

  • Primárně k zakázání URL (včetně URL queries) pro jednotlivé nebo všechny roboty. Důležité pro velké weby, kde hrozí, že by byl zbytečnými URL vyčerpán crawl budget.
  • Sekundárně k uvedení adresy sitemap.xml. Tímto se verifikuje uvedené xml jako důvěryhodné a Google ho bere v potaz.

sitemap.xml

Jednoznačně ano.

  • Měl by obsahovat pouze URL důležité z hlediska SEO. Google chápe URL uvedené v sitemap.xml jako důležité a indexuje je primárně.
  • Je výborným místem, kde definovat URL, které mají být z indexu vyhozeny. Zde uvedené URL pro vyhození se nejrychleji zpracují.
  • Tag loc je povinný, musí obsahovat absolutní a kanonickou URL (samozřejmě stejná jako v meta značce). V případě více jazyků nezapomenout uvést jazykové alternace hrefland a opět propsat do příslušných meta.
  • Tag lastmod je sice nepovinný, ale velice důležitý, protože informuje robota o změně a tedy vhodnosti reindexace. Při generování je nutné, aby se změna datumu provedla vždy při větší změně obsahu stránky. Tj. ne jen při opravě překlepů :-) Google často aktualizované stránky s minimální změnou částečně penalizuje.
  • Tagy changefreq a prio nejsou při správném používání lastmod důležité.
  • Podívat se na specifikaci pro vkládání obrázků nebo videí, u větších projektů opět k vůli cwarl budgetu nezahrnovat a využít JSON-LD.
  • Do sitemap nevkládat URL na články (novinky) a místo toho využít formát pro RSS/Atom feedy (nezapomenout propsat do meta značky.
  • Pro větší projekty je dobré si přečíst specifikaci, např. omezení na 50 MB v nekomprimovaném stavu (lze index.xml.gz), max. 50000 URL, využít sitemap-index.xml resp. sitemap-index.xml.gz.

Co by se nemělo do XML dostat:

  • ne-kanonické stránky,
  • duplicitní stránky,
  • stánky se stránkováním 2+ včetně,
  • s parametry nebo session ID,
  • výsledky vyhledávání (interní),
  • různé verze vzniklé pro sdílení (zkrácené pro twitter, do e-mailu atp.),
  • URL vzniklé použitím filtrováním, které nejsou důležité pro indexaci (viz SEO vzorce a noindex),
  • archivované stránky,
  • jakékoli redirecty 3xx, chybějící stránky 4xx nebo chybové 5xx,
  • stránky blokované v robots.txt,
  • stránky v noindex,
  • stránky po odeslání formuláře atp.,
  • stránky, které mají význam jen pro uživatele jako je login, kontaktní formulář, privacy policy atp.

K samostudiu: Index Coverage report, Google News Sitemap.

security.txt

manifest.json

  • Viz vlákno od @marekzprahy. Mám napsat víc?

browserconfig.xml a Pinned Sites

  • Netřeba explicitně uvádět v meta tagu, Internet Explorer si sám na soubor sáhne.
  • Minoritní, jen pro uživatele Window 8+. Málokdo o té funkci ve Windows ví. Síla spočívá spíše v uvedení a aktualizací feedů atp.

humans.txt

Ikony

Komentáře

  • Mlocik97 : - tag head / meta tagy: díky za názor aj ukážku, ja mám head ohodne kratší i když zas nemám web multijazyčný takže nemám ani canonical adressy nalinkované a pod. Zaujal ma práve meta tag author ale aj meta tag robots, ja moc je podľa Vás "dôležité" je uviesť, resp. ako môžu ovplivniť stránku alebo web aplikaci? Ten skype_toolbar meta tag som už nekde videl, ale moc používaný nieje, takže mám pocit že ho môžem vypustiť, že veľký vliv mať nebude, podobne asi aj apple-mobile-web-app-title a application-name. V prípade ikón vidím vo Vašom príklade používanie rel="icon", ja však používam rel="shortcut icon" (a type type="image/x-icon") je v tom výrazný rozdiel? okrem toho v príklade je formát PNG, ja používam ICO. - sitemap.xml: tak už som ho napsal, mám tu však 2 verze svojho webu, jedna je neco jako "beta"/"dev" verze, tú neindexujem, myslím že najvhodnejšie je ho neindexovať a teda ani nepsať preň sitemap.xml, takže myslím že tak ako to mám teraz (sitemap len akoby existovala len jedna verzia), že je ok. Čo sa týka sitemap, mnoho som prečítal na sitemaps.org a v dokumentáciách googlu. Myslím že to mám už "vyřešeno". - security.txt: síce vytvorený ešte nemám, ale kontaktovanie ma už mám vyriešené inak, no rozmýšlam nad tým jak moc by bol tento súbor prospešný, kedže jak vidím, "vätšie internetové scany" když se robia, tak lidi čo sa tým stoja si automatizujú aj rozosielanie mailov a pod. - manifest.json: OK - browserconfig.xml: už som prečetl tucet stránok o rôznych "bazmekoch" tohoto typu, no konkrétne toto vidím prvý krát, takže áno "Málokdo o té funkci ve Windows ví." je zrejme čistá pravda. - humans.txt videl som, keďže som stránku robil celú sám, teda snaď okrem vínimky loga. Nemyslím že má zmysel to vytvárať v mojom projekte, ostatne už priamo na stránke mám neco málo o sebe napsané. Nevidím že by sa to nejak často používalo. - ikony: jak už som zmínoval v tag head časti, používam rel="shortcut icon" a formát ICO. Dík za link na nástroj, ja osobne používam http://icoconvert.com/ 14.9.2018
  • cebreus : — Tag `link rel="canonical"` je nezbytností, pokud to se SEO myslíte vážně. Nutí Vás mít generované unikátní URL. — Tag `skype_toolbar` zakazuje aplikaci Skype, aby procházela web a hledala telefonní čísla. Jakmile číslo najde, naformátuje si ho a často dojde k rozhození vizuálu stránky. — Tag `robots` je důležitý, určuje jestli se má stránka indexovat (index) nebo ne (noindex) a jestli mají být odkazy následované (follow) nebo nemají (nofollow). Nezapomenout na provázání s nastavením v `robots.txt`. — Ikona `favicon.ico` se do mete tagu explicitně neuvádí, protože se na ji prohlížeče samy ptají. Uvádět ji j tedy zbytečné. Zato se fajn se ujistit, že v souboru ikony jsou fyzicky rozměry 16x16, 32x32, 48x48, přičemž stačí mít jen tyto rozměry v TrueColor, protože už všechny OS to zvládají. Pozn.: pro starší systémy jako Windows 2000 atp. bylo potřeba vkládat i ikony s 256 barvami, protože systém TrueColor nepodporoval. 17.9.2018
  • Mlocik97 : lenže akú hodnotu do `rel="canonical"` mam davat, kdyz okrem dev verze ktoru neindexujem mam vsetky url unikatne?. Robots.txt ok, vytvoril som, meta tag robots taky. To so skypom sa mi zdá hodne divné, ešte som to nevidel, ani sa mi nezdá že by to mohlo zasahovať do prehliadačov a zmeniť formatovanie. 17.9.2018
  • cebreus : — `rel="canonical"`má obsahovat unikátní URL, tzn. pokud máš jen unikátní URL, tím lépe, nemusíš řešit redirecty a jejich počet (maximálně jeden redirect). — Meta pro Skype ovlivňuje jen chování Skype pluginu, tj. neovlivní vykreslování v negativním smyslu. 24.9.2018
  • Mlocik97 : cerberus díky 24.9.2018

Pro zobrazení všech 3 odpovědí se prosím přihlaste:

Rychlé přihlášení přes sociální sítě:

Nebo se přihlaste jménem a heslem:

Zadejte prosím svou e-mailovou adresu.
Zadejte své heslo.