Rozhovor: Dušan Janovský o Seznamu

31. Březen 201528 komentářů

V Seznamu se toho poslední dobou podle všeho děje hodně. Nabírají nové vývojáře pro fulltext, zrychlují frekvenci novinek a i to „Juhů!“ slýcháme častěji, než dřív. Takže jsem moc vděčný, že si na mne matador fulltextového týmu Dušan Janovský našel chvíli čas na několik otázek. Ať se líbí :-)

 

1) Mohl bys představit, co vlastně v Seznamu děláš?

Moje pozice se donedávna jmenovala Vedoucí oddělení relevance. Chtěl jsem se posunout víc k technologiím, tak jsem od března zase jenom řadový člen tohoto oddělení, které se stará o to, aby hledání něco našlo a aby se to pak co nejlépe řadilo. V tomto produktovém týmu máme různě rozdělené role. Navrhujeme signály stránek, pomocí strojového učení modelujeme relevanci, vyvíjíme expanze dotazu, opravy překlepů, sbíráme statisíce učících příkladů. Sestavujeme data pro našeptávač, počítáme relevance z textů stránek, z odkazů a dalších signálů, klasifikujeme dotazy, testujeme změny algoritmů. Vymýšlíme, jak stránky indexovat a jak sestavovat co nejlepší titulky a snippety. Oddělení, jehož práci jsem teď nastínil, odpovídá produktově asi za čtvrtinu práce na celém seznamáckém hledání.

 

2) Vyhledávání se věnuješ už dlouho – proč sis vybral tuhle oblast, co
tě na tom tak baví?

Byv na civilní službě v městské knihovně jsem si všimnul, že vyhledávání informací je pro uživatele internetu prostě to nejdůležitější. V té době (1999 – 2001) bylo vyhledávání na internetu mnohem obtížnější než dnes. Když jsem se pak dostal do Seznamu jako kodér, přirozeně jsem asi po roce a půl projevil zájem vyhledávání rozvíjet. Seznam kdysi měl svůj Kompas, ale ten se definitivně zastavil koncem roku 2001. Přišlo mi, že máme na víc než na prohledávání katalogu, a tak jsem napsal specifikaci na fulltextové vyhledávání. A kolem něj se točím dodnes.

 

3) Google je pověstný velkými vývojářskými i „antispam“ týmy. Kolik
lidí se věnuje péči o fulltext v Seznamu?

Konkrétně na „antispam“ máme nyní 4 specialisty plus pár vývojářů. Celková velikost týmu fulltextu je v desítkách lidí. Špatně se to počítá, protože ne vždy lze říci, co patří do fulltextu a co už je obecné hledání. Mimochodem stále nabíráme vývojáře.

 

4) Řada lidí si myslí, že v Seznamu sedí tajemní lidé, kteří den co
den zlovolně pohybují vahami různých faktorů a baví se na účet
nešťastných webmasterů. To bude (doufám!) nesmysl :-) Mohl bys ve
stručnosti laicky nastínit, jak dnešní algoritmy v Seznamu fungují?

 

Váhy faktorů jsme měli do roku 2011. Pak jsme přešli na modely strojového učení, konkrétně rozhodovací stromy uspořádané do „lesů“, které jsou vnitřně mnohem složitější než nějaké vážené sčítání faktorů. Na druhou stranu se nám lesy jednodušeji používají, protože teď fakt nemusíme bádat nad tím, který signál máme v kterém rozsahu hodnot jak používat. Ruční zásahy tam tedy nejsou žádné, všechno se odvíjí od dat.

 

Proces tvorby lesa se začíná u sběru dat. Máme asi třicet tisíc dotazů, které dobře reprezentují uživatelské dotazy. U nich nám brigádníci zvaní „kalibrátoři“ ručně stanovují, jak je na dotaz která stránka z výsledků našeho hledání relevantní. Mají na to šestibodovou stupnici, klikací rozhraní a podrobný manuál. Takto máme nasbíráno a stále obnovujeme asi milión ručních hodnocení stránek, kterým můžeme důvěřovat.

 

Dalším úkolem je pak naučit nějaký automat, aby uměl stránkám vypočítat hodnocení, které se co nejvíce bude podobat hodnocení, které určili kalibrátoři. Automat nemůže mít lidský úsudek, a proto musí pro rozhodování, která stránka je relevantní a která ne, použít nějaké signály. Signálů máme pár stovek, něco mezi 200 a 300, stále vyvíjíme nové, občas nějaké předěláváme nebo odstraňujeme. Příkladem signálu je třeba počet vyhledaných slov na stránce, délka stránky, počet (a druh) odkazů odkazujících na stránku odkazů vedoucích ze stránky, počty lajků, navigačnost dotazu, tematická shoda dotazu se stránkou, jazyková shoda, pagerank a tak dále. Možná znáš stránky se soupisy SEO faktorů, na kterých odborníci odhadují, podle jakých signálů vyhledávače řadí. Tak to je přibližně ono.

 

Teď jde o to, jak skloubit nasbíraná data s vypočítanými signály. Dříve (před rokem 2011) jsme dělali to, že jsme napočítané signály prostě nějak váženě sčítali, případně používali lineární regresi. Byla to dost otročina a chovalo se to jak Rubikova kostka, které když sestavíš jednu stranu správně, tak tím ostatní rozbiješ. Když jsme tedy zvýšili váhu jednoho faktoru, tak to sice některé dotazy opravilo, ale jiné to naopak rozbilo.

 

Strojové učení nám do toho tedy vneslo mnohem více logiky. Stromy si samy rozdělí dotazy tak, aby se na jedné skupině mohly rozhodovat podle jednoho signálu a na druhé skupině podle signálu jiného. V praxi je to samozřejmě složitější, odkažme vážené čtenáře třeba na wikipedické heslo Learning to Rank.

 

Matematicky vzato jde o regresní úlohu. Máme nasbírané známé příklady (vzorek dotazů) a snažíme se získat vzoreček, který nám odhadne závislost známého výsledku na nějakých veličinách. To nám pak pomůže dozvědět se něco o situacích, které známé nejsou (všechny ostatní dotazy). Zatímco ve školním příkladu s prokládáním grafu přímkou stačí určit dva parametry lineární funkce, naše rozhodovací lesy mají parametrů třeba dvanáct tisíc. Ale zase fungují chytřeji a na mnohorozměrném prostoru.

 

Jediné parametry rozhodovacích lesů, které tak můžeme ovlivnit, jsou různé hyperparametry jako jsou učící koeficienty, podoba vyhodnocovací funkce (nDCG, ERR, pFound), úpravy dat závislé na jazycích a občasné vypínání některých signálů, u kterých nám přijde, že fungují špatně, zpětnovazebně nebo že jenom šumí.

 

 


5) Vnímáte ty a tvůj tým co se děje v “profesionálním SEO”, co dělají a radí konzultanti a agentury? Sledujete nějak různá doporučení “jak na Seznam vyzrát”? Nebo to pro vás naopak není důležité?

 

Já nějaká doporučení sledovat nestíhám, nebaví mě to. Ale vidíme, co lidé na stránkách dělají. Víme, že dělají různé patičkové sestavy, tak zvané PR weby nebo jiná kouzla. Je nám jasné, že tím využívají slabiny vyhledávačů, a tak nám dávají návod, na co se zaměřit. Takové manipulace se týkají hlavně komerčních dotazů. Nemůžu napsat, že by to pro nás nebylo důležité. Je to prostě jenom velmi obtížné. Snažíme se algoritmicky oddělit přirozené signály od umělých a nikdy to nefunguje stoprocentně.

 

6)  SEO se za poslední roky hodně posunulo od relativně hodně technických věcí a hromadění odkazů vice k PR, ke smysluplné komunikaci. Alespoň je trend to říkat. Vnímáš to stejně? Co jsou podle tebe dnes ty klíčové kvality, které by měl mít web usilující o dobrou viditelnost ve vyhledávání?

 

Nemyslím, že by se nějak slučovalo PR a SEO. Jenom spíš PR získává větší roli. A není to už PR nablýskaných tiskových zpráv, ale je to PR v diskusích a v textu běžných webových stránek. Vždycky jsem měl rád The Cluetrain Manifesto, starý to text, který tvrdí, že zákazníci propojení sítí jsou chytřejší než firmy, které se zákazníkům snaží něco prodat. Dokud se to projevovalo tím, že firmu pomluvila nějaká odborná diskuse s omezeným dosahem, tak se nic moc nedělo. S nástupem globálních sociálních sítí si firmy konečně uvědomily, jak je důležité, aby se vyjadřovaly lidsky a česky.

 

Klíčové kvality? Podle mě jsou v komerčních oborech obecně jen dvě. Jednak jde o to, jak dobře stránka odpovídá na uživatelův dotaz nebo jeho potřebu. Za druhé záleží na tom, jak moc si web váží svého uživatele. Kdybych tyto dvě veličiny uměl kardinálně kvantifikovat, pak bych chtěl výsledky vyhledávání řadit pouze podle jejich součinu. Všechny ostatní signály, o kterých po nocích přemýšlí SEOisté i my, návrháři vyhledávání, jsou jenom dílčími aspekty těchto dvou klíčových kvalit.

 

7) V komerční sféře (typicky u eshopů) bývá problém odlišit reálné
signály kvality od falešných. Přeci jen si je většina obchodníků hodně
podobná a asi se shodneme, že velká část odkazů a zmínek o eshopech
není zrovna přirozených. Jak to v Seznamu řešíte?

 

Na vyhodnocování přirozenosti různých faktorů pracujeme už od roku 2007. Na přirozenosti odkazů jsme zapracovali hlavně v roce 2012 a děláme na tom i nyní. O detekci patiček jsme se pokoušeli i dříve, ale ty přístupy byly docela naivní. Nyní v tom máme hodně strojového učení. Dneska můžu říct, že většinu nepřirozených citací a odkazů rozpoznáme a patřičně zohledníme. Naneštěstí k problému stačí, když máme třeba dvě promile false negatives (FN, tedy nepřirozených odkazů chybně vyhodnocených jako přirozené). Ve 25 miliardách odkazů, které známe a vyhodnocujeme, to je 50 miliónů FN, což stále není málo. Můžeme sice zpřísnit klasifikátory, aby se FN objevovalo méně, to ale to nutně povede k tomu, že se zvýší počet false positives (FP, přirozené chybně označené jako nepřirozené). S větším počtem FP se snižuje množina odkazů, ze které lze něco smysluplně počítat, což pak omezuje kvalitu výsledných signálů. Takže musíme stále vyvíjet nové modely, abychom měli FN co nejmenší.

 

Zajímavé je, že i naše relevanční modely, které výsledné signály dostávají na vstupu spolu s dalšími signály, umí najít relaci mezi komerčností dotazu a odkazovými signály. Když se rozhodovací strom někde nahoře větví podle komerčnosti, často v nekomerční větvi následuje rozhodování podle odkazů, přičemž komerční větev odkazy téměř ignoruje. Je to způsobeno tím, že když dvě stě obchodů prodává jeden a ten samý výrobek, tak je pak z pohledu vyhledávání vlastně jedno, jestli si uživatel prohlédne produkt na webu A, nebo na webu B. Hlavně, že si ho prohlédne aspoň někde a může si ho tam koupit.

 

 

8) Mezi českými firmami přežívá dlouhodobě celá řada mýtů o tom, jak
Seznam řadí výsledky. Třeba o vlivu využívání placených služeb (Firmy,
Sklik aj.) na viditelnost v neplaceném vyhledávání nebo časté ruční
penalizace a úpravy hodnocení webu vůbec administrátory. Můžeš to
uvést na pravou míru? :-)

 

Firmy.cz jsou od vyhledávání úplně oddělené. Jediné, co z firem interně používáme, je export URL, kterým krmíme robota, aby lépe crawloval. Také je to tuším jedním ze signálů do detekce spamu a minoritně vstupuje do jednoho slabého relevančního signálu. To je veškeré přímé propojení. Důležitější je nepřímý vliv. Náš algoritmus považuje odkaz z firmy.cz nebo z odkazového katalogu Seznamu za výrazný pozitivní signál pro kvalitu stránky. Nenutili jsme ho k tomu, prostě si to sám vypočítal.

 

Sklik je také úplně odpojený, výsledky se potkávají až na webovce. S Sklikem sdílíme některá data na úrovni dotazů, například nám signály z Skliku pomáhají s výpočtem komerčnosti dotazu a to jen velmi málo. Na úrovni stránek žádné propojení není, takže vlivy Skliku na neplacené výsledky můžou být jenom nepřímé. V případě Skliku se nepřímé vlivy hledají hůře než u Firem, ale může jít o aplikaci poučky „návštěvnost dělá návštěvnost“. Třeba ti, kdo se proklikli z Skliku, vytvořili někde na základě své zkušenosti odkaz, napsali recenzi, přidali komentář apod.

 

Ruční penalizace používáme velmi málo a spíše se jimi snažíme usměrnit crawlera než ovlivnit výsledky vyhledávání. Obecně se držíme zásady, že nepoužíváme ruční penalizace tam, kde má fungovat automatické rozpoznávání pochybných praktik. Takže sice musíme ručně postihovat neviditelný text a podobné špatně strojově rozpoznatelné jevy, ale v případech jiného spamu, strojově rozpoznatelného, si ho místo ruční penalizace prostě přidáváme do trénovacích množin. To nemá přímý vliv na pozice webů. Přesto se lidé často domnívají, že jejich stránky jsou obětí ruční penalizace, třeba když vidí propad návštěvnosti. Ve většině případů to ale způsobují změny našich algoritmů, technické chyby na straně webu nebo penalizace automatická, vypočítaná z našich naučených příkladů. Například když někdo na svém webu hostuje kromě svých stránek ještě linkfarmu, tak si toho náš algoritmus dříve nebo později všimne i bez ručního zásahu.

 

DNES SE DOSTALO JEN NA PÁR OTÁZEK, PŘÍŠTĚ TO TŘEBA BUDE VÍC – POKRAČOVÁNÍ JE NA VÁS, MILÍ ČTENÁŘI :-)  NA CO BYSTE SE DUŠANA RÁDI ZEPTALI, CO VÁS ZAJÍMÁ, CO BYSTE VE FULLTEXTU RÁDI VIDĚLI NEBO JAKOU ZPĚTNOU VAZBU ČI POMOC MŮŽETE NABÍDNOUT?

TĚŠÍME SE V KOMENTÁŘÍCH :-)

Komentáře 28 Přidat komentář

  1. Pavel Ungr napsal:

    No, mě by zajímaly konkrétnější věci. Tzn. třeba proč Seznam nemá své webmaster tools, proč podpora nedokáže lidem víc pomoct, proč je indexace tak pomalá. Proč na Seznam dovolí takové zneužívání jako přesné shody klíčového slova nebo proč upřednostňuje kvantitu nad kvalitou.
    Proč se SEO komunitou nekomunikuje jako Google a úmyslně se tak staví kolem sebe zeď.
    Spousta otázek.

  2. LukasP napsal:

    Tak z rozhovoru mám pocit, že na začátku celého procesu rozhoduje o výsledcích vyhledávání nějakej „punťa“, kterej nakonec zmrví celý serp, protože se podle mě neubrání pocitu a osobního dojmu na prohlížené stránky. Podle toho ten serp taky vypadá :-/ Bohužel…

  3. Jan Nachtigal napsal:

    Dobrý rozhovor. Zajímalo by mě to, co tady už padlo – jestli Seznam plánuje nějakou podobu „webmaster tools“, kde by se dalo alespoň částečně poznat, co si Seznam o webu „myslí“. Protože je fajn, že Seznam má, na rozdíl od konkurence, podporu – ale konkrétní odpověď z ní člověk stejně nevypáčí. S penalizacemi bych tomu rád věřil, i když mi přijde divné, když jsou přístupy Google/Seznam v poměru 90:10 a Seznam nenajde ani na přesnou frázi, přestože danou stránku indexuje. Ale chápu, že řešit konkrétní web tady nelze.
    Přál bych Seznamu, aby se nedal ochcávat a nebylo nutné řešit oddělené „strategie“ pro Seznam a pro Google. A sobě, když už mě obvykle netrápí guglí ZOO, abych se nemusel klepat před každým dalším Juhů :-)
    Lukáši díky – podobných rozhovorů je málo a když bude pokračování, bude to supr. Třeba pak začnu Dušanovi věřit víc, než seznamáckým obchoďákům, kteří u klientů tajemně naznačují, jak bonita ovlivňuje fulltext.

  4. Linki napsal:

    Komunikace směrem k webmasterům by určitě mohla jít za hranici podpory, viz. GWT. Co třeba začít s daty o tom, kolik z webu je v indexu, ty už někde máte. Site operátor je na nic.

  5. Radek Hojgr napsal:

    Chápu správně, že linkbuilding pro eshopy nemá smysl??? Viz: „Když se rozhodovací strom někde nahoře větví podle komerčnosti, často v nekomerční větvi následuje rozhodování podle odkazů, přičemž komerční větev odkazy téměř ignoruje. Je to způsobeno tím, že když dvě stě obchodů prodává jeden a ten samý výrobek, tak je pak z pohledu vyhledávání vlastně jedno, jestli si uživatel prohlédne produkt na webu A, nebo na webu B. Hlavně, že si ho prohlédne aspoň někde a může si ho tam koupit.“

  6. Lukáš Pítra napsal:

    Tak to určitě nejde říct, že by neměl smysl – ostatně praxe říká, že určitě smysl má (možná až moc), alespoň u mně :-)

    Nechci mluvit za Dušana, ale myslím, že tím chtěl říct, že v rámci komerčních dotazů je drtivá většina zpětných odkazů manipulativní bullshit, který je lepší zahodit. To ale neznamená, že všechny :-)

  7. Seznamu je v podstatě jedno (nebo to neumí) jakým způsobem seřadí například prvních 100 výsledků v SERPu. Důležité je, že jsou relevantní hledanému dotazu a tak nějak to uspokojí uživatele. Interpretace kvality nejen pokulhává, ale je i dost proměnlivá. Modří vědí.

    Pokud se Dušan sám více posunul k technologiím a celý fulltext hlásá výrazné posilování programátorského zázemí, můžeme doufat v tendence vedoucí ke zkvalitnění samotných výsledků nebo jsou tyto snahy v Seznamu prozatím liché?

  8. Radek Hojgr napsal:

    Mě právě taky funguje, proto se tak divím ;)

    Jen teda doufám že to není vize za kterou fulltext Seznamu půjde – vykašlat se na hodnocení backlinků eshopů když jsou stejně všechny stejné. Možná by to mohl Dušan v dalším rozhovoru trochu více konkretizovat.

  9. Mě by zajímalo, jestli, co a v jakých oblastech tým fulltextu komunikuje s týmem Skliku, jak taková spolupráce probíhá a jestli jsou nějaké zajímavé příklady toho, co spolu řešili?

  10. Pavel Pajkrt napsal:

    Pokud u komerčních dotazů nerozhodují odkazy, co tedy rozhoduje? Podle výsledků v SERPu to nebývá obvykle kvalita webu.

  11. Vítek napsal:

    Seznam má antispam tým, jako fakt? V tom případě mám radu zdarma, v SERPu máte farmu o 6000 doménách plnou cloakingu a vygenerovanýho/vykradenýho obsahu. Všechny jsou v registru na pár nesmyslných fake jmen, jak složité je takový problém jednorázově vyřešit při 4 lidech? Zatím to trvá víc jak rok, tak zkusíme počkat další… :-)

  12. Lukáš Pítra napsal:

    Vítku, užitečnější by byl odkaz na seznam těch 6000 podle vás špatných domén. Dušan v rozhovoru mimo jiné mluví o tom, že se stroje učí z dat. Dodejte data a můžete pomoct tomu, aby se naučily opravit svoji chybu :-)

  13. Vítek napsal:

    Lukáši, 6000 tisíc domén vám sepisovat nebudu. Pokud by to k něčemu bylo (a ono není, protože jsem zkusmo už nekteré věci reportoval v minulosti), tak vám jich sepíšu třeba prvních padesát a dodám podrobnosti. Návod, jak následně najít (a vyřešit) zbytek jsem už popsal. Je to věc známá, stejně jako firma, která za tím stojí.

  14. Lukáš Pítra napsal:

    Vítku, nezlobte se na mně, ale pochybuju, že má fulltextový tým čas a energii honit duchy na základě podobných „udání“, selektivně. Myslím, že pracují spíš na systémových řešení. A to i v případě různých firem spravujících doménové / odkazové farmy, které v branži všichni tak nějak léta známe a něco si o nich myslíme.

    Pro info – podobné iniciativy, kdy lidé „od SEO“ dodávali data, která sama pracně nasbírali nebo měli v rámci různých databází už tu byly a rozhodně nebyly zbytečné. Kontakt na Dušana / fulltext tým je veřejně dohledatelný, určitě bude za strukturované informace rád.

    Takže upřímně, je to hlavně na vás. Pokud o nějakém problému víte a chcete ho vyřešit, budete muset přiložit ruku k dílu a „důkazní materiál“ dát dohromady. Nebo můžete Seznamu nadávat v diskuzi, že to neřeší, čímž se vám možná momentálně uleví, ale k řešení to asi nepomůže :-)

  15. Vítek napsal:

    Lukáši, v rozhovoru je zmíněn tým 4 lidí antispamového týmu. Na to jsem reagoval a právě od nich bych *přesně* něco takového očekával (a stejně tak jsem již uvedl, že to nefunguje, protože jsem to už „absolvoval“) – vy to nyní svým komentáře překlápíte úplně jinam. Na Seznam jsem nijak nenadával, nemám to zapotření a Dušan je jediný důvod, proč věřím, že se to zlepší.

  16. Martin Šoch napsal:

    Je hezké nahlédnout do technických zákoutí vyhledávače a poslechnout si akademické vyprávění o úžasných algoritmech, ale co ten vyhledávač opravdu používat? Používá pan Janovský vyhledávač od Seznamu ve své denní praxi?

    Tak třeba minulý týden. Stojím bezradně na Karláku. Hledám prodejnu s papírem. Vytáhnu mobil a zadám „papír karlák“. Google má zcela jasno – první výsledek trefa do černého. Seznam je úplně mimo – diskuse o ORL na emiminu, příprava na koloskopii, pletení z papíru, počasí, povídky E.A.Poe, Votické noviny… Spousta věcí „co neznám“, ale nic, co by mi pomohlo.

    Navzdory stovkám signálů jsou pro mě vždy výsledky na Seznamu prolnuty desítkami úplně nesmyslných položek. Změním-li dotaz na „papír karlovo náměstí“, pořád má Seznam na prvním místě RM Systém a na pátem místě Fio Banku.

    Zajímalo by mě, jestli v Seznamu vědí, že to tak řada lidí vnímá a zda s tím něco umí dělat. Anebo rezignovali a opravdu jim jde jen o to, aby nabídli odpovědi na dotazy typu „facebook“, „google“ apod. Je to otázka mozků, peněz, hardwaru?

  17. Radim Hasalík napsal:

    Martin Šoch: hezký příklad s tím papírem. Opravdu to ukazuje na nekvalitu seznamáckého fulltextu. Tentýž problém se vyskytuje u firmy.cz, kde tamější engine na dotaz „rodinné domy na klíč“ ještě nedávno doporučoval, zda-li nechci hledat rodinné domy v okolí obce Klíč. Teď už nedoporučuje, ale u plesů na klíč to říká stále: „Nechtěli jste hledat plesy v okolí Klíče?“.

    Dušana bych se zeptal, proč jsou výsledky v obou vyhledávačích tak propastně odlišné. Co chce Seznam.cz dělat, aby se ta kvalita zlepšila.

  18. Martin S. napsal:

    K diskusi o webmaster tools – „Něco jako Google Webmaster Tools by v Seznamu také chtěli. Tedy kdyby byl svět ideální. V reálu se jich ale nedočkáme, kvůli nízké prioritě a vysokým nárokům na výpočetní kapacitu.“ – tohle jsem si zapsal z Dušanova vyjádření na červencové poslední středě, viz odkaz na článek o ní.

    Obecně ke kvalitě vyhledávání – je logické, že pokulhává za Googlem, který má k dispozici mnohonásobně větší tým… Je pravda, že na výsledky seznamáckého vyhledávání taky občas nadávám, nicméně z druhé strany – v kolika dalších zemích dokáže někdo konkurovat ve vyhledávání Googlu? A to je jeden z důvodů proč fulltext (a k tomu mapy.cz) považuji za dvě pro mě nejzajímavější a nejpřínosnější služby Seznamu, i když u fulltextu je to spíš z profesního hlediska…

  19. Vít Michalek napsal:

    Zajímalo by mě vyhledávání, signály pro řazený výsledků, kromě toho že těchto signálu je celá spousta. 21.4 chce Google změnit mobilní vyhledávání a upřednostovaní webu použitelné na mobilních zařízeních. Vím, že je složité říct co je ještě použitelné a co ne, nedávno se to řešilo na Facebooku v jedné „diskuzi“. Ale chystá se seznam nějak zohledňovat tyto upravené stránky? (testovat jestli je stránka aspom mimo okraj – pro mě základní prvek použitelnosti přece mužete skrze techniku, která pořizuje scrrenshoty stránek? Dalším tématem by mohlo být https, spekuluje se ,že weby na tomto protokolu mají nějakou vyhodu na Google, co na to seznam? Dostaneme za to nějaké malé bodíky?:) A když už jsme u https, co přechod samotného vyhledávání na tento protokol, loni už přešla homepage seznamu. Technicky to asi problém nebude, ale jak se k tomu stavíte? Snad mě za tu poslední otázku ostatní neukamenujou, víme všichni co by to znamenolo. ..

  20. Martin Šimko napsal:

    Lukáši a Dušane, díky moc za rozhovor. Já osobně bych velice ocenil, kdyby měl Seznam lepší nápovědu, co se technických věcí týká. Například, jak ideálně řešit mobilní verzi webu, jak ideálně řešit stránkování atd. atd. Google má tyto věci hodně dobře sepsané a u Seznamu je to o zkoušení a vyhodnocování, jestli to funguje stejně jako u Googlu. Oficiální dokumentace by byla v tomto smyslu hodně super.

    A samozřejmě Seznam Webmaster Tools by byl taky super, jak už psali kolegové přede mnou ;-)

  21. Roman napsal:

    S tím papírem je to dobrý příklad :-) musí se však vzít v potaz, že Google mění výsledky podle tvé polohy, pokud stojíš na Karláku, hodí podle toho výsledky, Seznam nic takového neumí, a vyhazuje „statické“ výsledky.

    Seznam se zaměřuje na služby kolem – Firmy, Stream aj. dle mého už trochu vzdal boj s fulltextem a bere ho pouze jako doplněk, osobně mám Seznam jen na e-mail, letmým okem zprávy, když něco hledám hned jdu na Google.

  22. Ondřej Kocman napsal:

    Jsem rád, že v článku zaznělo, že zápis z firmy.cz nebo odkazového katalogu Seznamu je VÝRAZNÝ signál pro kvalitu stránky čímž se potvrzuje propojení firmy.cz a vyhledávání. Stejně tak má vliv propagace v Skliku na SERP i když Dušan v článku tvrdí že může být jen nepřímý. V důsledku je to však jedno o jaké propojení nebo vliv jde. Zkrátka pokud budete platit Seznamu za sklik a zápisy na firmy.cz budete se zobrazovat výše ve výsledcích hledání. ;-)

  23. Jakub Vytiska napsal:

    Seznam a jeho fulltext, téma které bude asi vždy vířit diskuzi.. pár postřehů
    – rychlost indexace Seznamu je katastrofální, jestli chce Seznam zastavit úpadek podílu vyhledávání bude s tím muset něco udělat, postupně si čím dál uživatelů uvědomuje, že Seznam není internet a není to jediná domovská stránka, takto to bylo v minulosti zažito, ale časy se již dávno změnily… upřednostňují relevantní vyhledávač. K tomu se váže i příjem s Skliku a řešení priorit na výpočetní kapacitu a adekvátní rozvoj služeb a celého teamu (je super že konkuruje Google, ale jde mu o Sklik, který bude mít stále větší úpadek)
    – přímá shoda odkazů je jasný problém a dlouhodobě bez výrazné změny
    – podpora Fulltext… eh.. kapitola sama o sobě, jen pro příklad… za poslední dobu měsíc jsem komunikoval 3x pokaždé s někým jiným, jedna osoba mi dokázala (údajně) poslat robota na přepočet relevantnosti obsahových stránek celého webu (?), za týden jiná osoba mě ubezpečuje, že nic takového není možné…spíš mi to připadá jako co nejrychleji ho vyřeš, stejně se nedoví, zda to k něčemu bylo
    – Firmy se podílejí pouze jako externí zdroj URL a nepřímý vliv. Ale to že jejich výpis bortí SERP a dělí 3 a 4 příčku na pozice s nelogickým CTR samozřejmě není věc teamu fulltextu, ale má značný vliv na jeho funkci.
    – nastínění zda bude oddělovat algoritmus pro mobilní vyhledávání a stav webu pro UX atd

    Je fajn že popisuje to jak Seznam funguje a snaží se v podstatě obhajovat, že funguje čistě, ale to jsou pro informace, které beru s lehkým úsměvem, nicméně by byla zajímavější informace jaké má fulltext plány do budoucna, otevření se více veřejnosti / konzultantům, možnost sběru podnětů, řešení..

    no je večer, po hokeji, tak se nebudu rozčilovat :)

  24. David Řezáč napsal:

    Lukáši dodatečně díky za rozhovor! S dovolením sdílím dále v seznamu českých článků o SEO a Linkbuildingu :-)
    http://www.affilo.cz/clanek/zobrazit/23/

  25. Gustav Spáčil napsal:

    Dobrý den, jsem rád, že jsem narazil na tento článek. Měl bych dotaz k p.Janovskému a moc rád bych chtěl odpověď, nebo radu, protože jsem bezvýsledně komunikoval se zaměstnancem od Seznamu, který má na starosti firmy se zápisem v mém oboru, ale zatím bez odezvy. Můj problém spočívá v tom, že jsem v cca listopadu 2015 zaregistroval nový podlahářský web http://www.podlahy-vinylove.cz/ zaměřený na vinylové podlahy. Verzi zápisu mám placenou, tzn.spuštěnou kampaň, ale potíž je v tom, že ve fulltextu se nezobrazuji, vůbec..hledal jsem do 400 místa bezvýsledně. Indexaci nových stránek provádím pravidelně po týdnu, ale marně, indexace nereaguje, v historii site:podlahy-vinylove.cz je stále zobrazena jen polovina stránek. Už nevím jak to dál řešit a na koho se obrátit. Jsem podlahář, ale mám dost času na to si web spravovat sám, protože jsem do toho až zapálen, rád fotím svoje zakázkové díla a potencionálním zákazníkům chci předat relevantní informace, nadšenějšího podlaháře jako jsem já by jste těžko v Brně hledali… Gustav Spáčil
    PS: Google mi indexuje nové stránky v rámci několika hodin a po zadání prvních třech slov titulku se zobrazuji se do 15 místa, což je pro mě známka toho, že můžu s webem pracovat a někam ho posouvat.

  26. Gustav Spáčil napsal:

    Tak od včerejška je vše jak má být, indexace funguje. Chce to čas, nejspíš..

  27. Petr Jurečka napsal:

    Dobrý den.
    Jsem provozovatelem eshopu a vždy jsem využíval sekci zboží.cz. Již cca 3měsíce stále píši na seznam ohledně problému, který stále přetrvává. Při napsání klíčového slova interiérové dveře do zboží.cz se zobrazí pouze jeden výrobce dveří. Přitom před 3 měsíci tam byli výrobci např. porta doors, verte, dre, invado, agmar, erkado atd. zboží.cz mi přinášelo cca 100 zákazníků deně. Zákazník si nemá z čeho vybrat. Děkuji za odpověď Petr Jurečka

  28. Miroslav Beran napsal:

    Mohu se zeptat, kam až zajdete ve svém trendu komerčních odkazů? Jednou bude zbytečné nějaké SEO řešit, protože poslední dobou se při zadání odkazu setkávám s tím, že člověk, který se věnuje organice o 95% trafficu přijde a to nepřeháním. Aby se po zadání výrazu do vyhledávače na zobrazené stránce nezobrazil ani jeden organický odkaz je úlet. Příklad: vpravo produktové inzeráty, nahoře 3x sklik, dále následuje baner na zbozi.cz jako kráva, Firmy v kterých se na cestě ztratí nejméně polovina trafficu, přes půl další stránky po scrolování mapy.cz, kde se ztratí téměř celý traffic. Nebude v budoucnu organic úplně zlikvidován? Je mi jasné, že vám v testech jistě vychází lépe to co jsem popsal, protože to přináší více šťávy do Seznamu, ale člověk pak úplně přichází o svobodu, protože musí strávit to, co je mu naservírováno. Nemyslíte si, že výsledkem bude zmenšení počtu portálů/eshopů na úkor několika velkých, naučení lidí na srovnávače, naštvání těch co potřebují relevantní výsledek atd?

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna. Vyžadované informace jsou označeny *

Další podobné články