Klíčový rozdíl – dolování dat a strojové učení
Data mining a strojové učení jsou dvě oblasti, které jdou ruku v ruce. Vzhledem k tomu, že jsou příbuzní, jsou si podobní, ale mají odlišné rodiče. Ale v současnosti se oba stále více podobají; skoro jako dvojčata. Někteří lidé proto pro dolování dat používají slovo strojové učení. Při čtení tohoto článku však pochopíte, že strojový jazyk se od data miningu liší. Klíčovým rozdílem je, že dolování dat se používá k získávání pravidel z dostupných dat, zatímco strojové učení učí počítač učit se a chápat daná pravidla.
Co je dolování dat?
Data mining je proces extrahování implicitních, dříve neznámých a potenciálně užitečných informací z dat. Přestože dolování dat zní nově, technologie tomu tak není. Data mining je hlavní metodou výpočetního odhalení vzorů ve velkých souborech dat. Zahrnuje také metody na pomezí strojového učení, umělé inteligence, statistiky a databázových systémů. Pole dolování dat zahrnuje databázi a správu dat, předběžné zpracování dat, úvahy o odvození, úvahy o složitosti, následné zpracování objevených struktur a online aktualizaci. Bagrování dat, lov dat a snooping dat jsou běžnějšími termíny při dolování dat.
Společnosti dnes používají výkonné počítače k prozkoumání velkých objemů dat a analýze zpráv z průzkumu trhu po celá léta. Data mining pomáhá těmto společnostem identifikovat vztah mezi interními faktory, jako je cena, kvalifikace zaměstnanců, a externími faktory, jako je konkurence, ekonomická situace a demografické údaje zákazníků.
CRISP Diagram procesu dolování dat
Co je strojové učení?
Strojové učení je součástí informatiky a velmi podobné dolování dat. Strojové učení se také používá k prohledávání systémů za účelem hledání vzorců a zkoumání konstrukce a studia algoritmů. Strojové učení je typ umělé inteligence, který poskytuje počítačům schopnost učit se, aniž by byly explicitně naprogramovány. Strojové učení se zaměřuje především na vývoj počítačových programů, které se dokážou naučit růst a měnit se podle nových situací a má opravdu blízko k výpočetní statistikě. Má také silné vazby na matematickou optimalizaci. Některé z nejběžnějších aplikací strojového učení jsou filtrování spamu, optické rozpoznávání znaků a vyhledávače.
Automatizovaný online asistent je aplikace strojového učení
Strojové učení je někdy v rozporu s dolováním dat, protože oba jsou jako dvě tváře na kostce. Úlohy strojového učení se obvykle dělí do tří širokých kategorií, jako je učení pod dohledem, učení bez dozoru a posilování.
Jaký je rozdíl mezi dolováním dat a strojovým učením?
Jak fungují
Data mining: Data mining je proces, který začíná od zdánlivě nestrukturovaných dat k nalezení zajímavých vzorců.
Strojové učení: Strojové učení využívá mnoho algoritmů.
Data
Data Mining: Data mining se používá k extrakci dat z libovolného datového skladu.
Strojové učení: Strojové učení znamená číst stroj, který souvisí se systémovým softwarem.
Aplikace
Data mining: Data mining využívá především data z konkrétní domény.
Strojové učení: Techniky strojového učení jsou poměrně obecné a lze je použít na různá nastavení.
Zaměření
Data Mining: Komunita dolování dat se zaměřuje hlavně na algoritmy a aplikace.
Strojové učení: Komunity strojového učení platí více za teorie.
Metodika
Data Mining: Data mining se používá k získání pravidel z dat.
Strojové učení: Strojové učení učí počítač učit se a rozumět daným pravidlům.
Výzkum
Data mining: Data mining je výzkumná oblast, která využívá metody jako strojové učení.
Strojové učení: Strojové učení je metodika, která umožňuje počítačům provádět inteligentní úkoly.
Shrnutí:
Dolování dat vs. strojové učení
I když je strojové učení s dolováním dat úplně jiné, obvykle jsou si navzájem podobné. Data mining je proces extrahování skrytých vzorců z velkých dat a strojové učení je nástroj, který lze k tomu také použít. Oblast strojového učení dále rostla v důsledku budování AI. Data Mineři mají obvykle velký zájem o strojové učení. Oba, dolování dat a strojové učení, spolupracují stejnou měrou na vývoji umělé inteligence i na výzkumných oblastech.
S laskavým svolením k obrázku:
1. "CRISP-DM Process Diagram" od Kennetha Jensena - Vlastní práce. [CC BY-SA 3.0] prostřednictvím Wikimedia Commons
2. „Automatický online asistent“od Bemidji State University [Public Domain] prostřednictvím Wikimedia Commons