Rozdíl mezi dolováním dat a OLAP

Rozdíl mezi dolováním dat a OLAP
Rozdíl mezi dolováním dat a OLAP

Video: Rozdíl mezi dolováním dat a OLAP

Video: Rozdíl mezi dolováním dat a OLAP
Video: Jak cvičit dámský klik? Jaký je rozdíl mezi tím "pánským"? 2024, Červenec
Anonim

Data mining vs OLAP

Jak data mining, tak OLAP jsou dvě běžné technologie Business Intelligence (BI). Business intelligence označuje počítačové metody pro identifikaci a extrahování užitečných informací z obchodních dat. Data mining je obor informatiky, který se zabývá extrakcí zajímavých vzorů z velkých souborů dat. Kombinuje mnoho metod z oblasti umělé inteligence, statistiky a správy databází. OLAP (online analytické zpracování), jak název napovídá, je kompilací způsobů dotazování vícerozměrných databází.

Data mining je také známý jako Knowledge Discovery in Data (KDD). Jak již bylo zmíněno výše, jedná se o obor informatiky, který se zabývá získáváním dříve neznámých a zajímavých informací z hrubých dat. Vzhledem k exponenciálnímu růstu dat, zejména v oblastech, jako je podnikání, se dolování dat stalo velmi důležitým nástrojem pro převod tohoto velkého množství dat na business intelligence, protože manuální extrakce vzorů se v posledních několika desetiletích zdánlivě stala nemožnou. V současnosti se například používá pro různé aplikace, jako je analýza sociálních sítí, odhalování podvodů a marketing. Data mining se obvykle zabývá následujícími čtyřmi úkoly: shlukování, klasifikace, regrese a asociace. Clustering je identifikace podobných skupin z nestrukturovaných dat. Klasifikace je učení se pravidlům, která lze aplikovat na nová data a obvykle zahrnuje následující kroky: předběžné zpracování dat, návrh modelování, výběr učení/funkcí a vyhodnocení/ověření. Regrese je nalezení funkcí s minimální chybou při modelování dat. A asociace hledá vztahy mezi proměnnými. Dolování dat se obvykle používá k zodpovězení otázek, jako jsou hlavní produkty, které by mohly v příštím roce pomoci dosáhnout vysokého zisku ve Wal-Martu.

OLAP je třída systémů, které poskytují odpovědi na multidimenzionální dotazy. OLAP se obvykle používá pro marketing, rozpočtování, prognózování a podobné aplikace. Je samozřejmé, že databáze používané pro OLAP jsou konfigurovány pro složité a ad-hoc dotazy s ohledem na rychlý výkon. K zobrazení výstupu OLAP se obvykle používá matice. Řádky a sloupce jsou tvořeny rozměry dotazu. K získání souhrnů často používají metody agregace na více tabulkách. Lze jej například použít ke zjištění letošních tržeb ve Wal-Martu ve srovnání s loňským rokem? Jaká je predikce tržeb v příštím čtvrtletí? Co lze říci o trendu při pohledu na procentuální změnu?

I když je zřejmé, že dolování dat a OLAP jsou podobné, protože pracují na datech za účelem získání inteligence, hlavní rozdíl spočívá v tom, jak pracují s daty. Nástroje OLAP poskytují multidimenzionální analýzu dat a poskytují souhrny dat, ale naopak dolování dat se zaměřuje na poměry, vzory a vlivy v souboru dat. Jedná se o dohodu OLAP s agregací, která se scvrkává na provozování dat prostřednictvím „sčítání“, ale dolování dat odpovídá „rozdělení“. Dalším významným rozdílem je, že zatímco nástroje pro dolování dat modelují data a vracejí použitelná pravidla, OLAP bude provádět techniky porovnávání a kontrastu v rámci obchodní dimenze v reálném čase.

Doporučuje: