Jak spravovat data o impresich/proklicich/objednavkach a delat nad tim rychlou analytiku rubrika: Návrh

2 tomassedlacek90
položil/-a 30.1. 20:09

Zdravim vsechny,

mame k dispozici vetsi mnozstvi dat o produktech (stovky tisic polozek) a nad nimi nasobne vetsi mnozstvi interakci, od impresi, k proklikum az uskutecnenym nakupum k danym uzivatelum. Dlouhou dobu jsme si delali nejaky zakladni reporting ve vlastni aplikaci bezici nad PHP/Nette, ktera volala nejake agregacni dotazy nad MySQL, jen jak ty data rostou, tak agregovat rychle nektera data a ruzne je kombinovat zacina byt casove narocnejsi. Premyslime tedy, jak idealne dal a radi bychom ziskali pohled lidi, kteri si uz tu cestu prosplapli, at nejdeme slepe smerem k nejakymu nesmyslu.

  1. Jak ukladat idealne interakce nad produkty? Takovych dat je vetsinou hodne, hodne rychle rostou, ale jsou vhodne pro personalizaci a segmentaci. Je vhodne je drzet v MySQL nebo tento typ dat spis ukladat jinam? Nejake napady?

  2. Dava smysl, pokud to jde, ukladat vsechna data originalne v DB a pak pro ucely rychleho zpracovani je spise posilat do jineho typu DB? Treba Elastic?

  3. Premyslime, zda by Elastic dokazal fungovat jako databaze, z ktere bychom rychle vytvareli ruzny reportovaci dashboardy. Tj. originalni data z db bychom lili do modelu v Elasticu a nad tim bychom volali frontend pro analytiku. Je to blbost, hodi se pro to vubec Elastic? Narazil jsem na tenhle case https://www.elastic.co/solutions/business-analytics

Jakekoliv sdileni zkusenosti v teto oblasti ocenim. Dekuji.

odkaz
9 Žížala
odpověděl/-a 31.1. 7:50
 
upravil/-a 31.1. 7:54

Já používám HOLAP na MSSQL na kterém jede naše interní ERP.
Nějaké reporty mám nad tím v PHP a na něco používám BIRT, který mám napojený přes PHP bridge. Některé menší datové výstupy jsou přímo v Excelu přes pivot table s napojením na HOLAP.

Na eshopu pak mám Datatables a JS pivot table na rychlé live statistiky nad živou DB (Postgresql).

S Elastic Vám neporadím, už 3 roky se chystám, že se na něj podívám, ale jelikož musím pořád řešit provozní věci, tak to prostě nestíhám...

Komentáře

  • harrison314 : MS SQL by mala take veci zvladat aj cez Grafovy engin realtime (https://github.com/arvindshmicrosoft/MillionSongDatasetinSQLServer), popripade jej BI nastroje, ale to su uz drahsie veci. A stavim sa, ze tu niekto pride zo specilizovanou databazou presne na toto. 31.1. 8:02
  • Žížala : Řeknu to takhle, moje priorita je eshop. A dokud nepřijde požadavek od vedení, nehodlám se statistikami nějak zabývat. Moje priorita je eshop. Statistiky žerou hodně času, protože management neví přesně co potřebuje, ale potřebuje to, nejlépe včera. A to znamená dlouhé bádání nad daty a jejich prezentací, aby výstupu management rozuměl. 31.1. 8:08

Pro plný přístup na Devel.cz se prosím přihlaste:

Rychlé přihlášení přes sociální sítě:

Nebo se přihlaste jménem a heslem:

Zadejte prosím svou e-mailovou adresu.
Zadejte své heslo.