Rozdíl mezi shlukováním a klasifikací

Obsah:

Rozdíl mezi shlukováním a klasifikací
Rozdíl mezi shlukováním a klasifikací

Video: Rozdíl mezi shlukováním a klasifikací

Video: Rozdíl mezi shlukováním a klasifikací
Video: Pančelky - Hlásky (..aneb jaký je rozdíl mezi hláskou a písmenem?) 2024, Červenec
Anonim

Klíčový rozdíl mezi shlukováním a klasifikací je ten, že shlukování je technika učení bez dozoru, která seskupuje podobné instance na základě funkcí, zatímco klasifikace je technika učení pod dohledem, která přiřazuje instancím předdefinované značky na základě funkcí.

I když se shlukování a klasifikace zdají být podobné procesy, existuje mezi nimi rozdíl na základě jejich významu. Ve světě dolování dat jsou shlukování a klasifikace dva typy metod učení. Obě tyto metody charakterizují objekty do skupin podle jednoho nebo více znaků.

Co je shlukování?

Shlukování je metoda seskupování objektů tak, že se objekty s podobnými vlastnostmi spojují a objekty s odlišnými rysy se oddělují. Je to běžná technika pro statistickou analýzu dat pro strojové učení a dolování dat. Průzkumná analýza dat a zobecnění je také oblastí, která využívá shlukování.

Rozdíl mezi shlukováním a klasifikací
Rozdíl mezi shlukováním a klasifikací
Rozdíl mezi shlukováním a klasifikací
Rozdíl mezi shlukováním a klasifikací

Obrázek 01: Shlukování

Clustering patří k dolování dat bez dozoru. Není to jeden konkrétní algoritmus, ale je to obecná metoda řešení úlohy. Proto je možné dosáhnout shlukování pomocí různých algoritmů. Vhodný algoritmus clusteru a nastavení parametrů závisí na jednotlivých sadách dat. Není to automatický úkol, ale je to iterativní proces objevování. Proto je nutné upravovat zpracování dat a modelování parametrů, dokud výsledek nedosáhne požadovaných vlastností. K-means clustering a Hierarchical clustering jsou dva běžné shlukovací algoritmy při dolování dat.

Co je klasifikace?

Klasifikace je proces kategorizace, který využívá trénovací sadu dat k rozpoznání, rozlišení a pochopení objektů. Klasifikace je technika učení pod dohledem, kde je k dispozici tréninková sada a správně definovaná pozorování.

Klíčový rozdíl – shlukování vs klasifikace
Klíčový rozdíl – shlukování vs klasifikace
Klíčový rozdíl – shlukování vs klasifikace
Klíčový rozdíl – shlukování vs klasifikace

Obrázek 02: Klasifikace

Algoritmus, který implementuje klasifikaci, je klasifikátor, zatímco pozorování jsou instance. Algoritmus K-Nearest Neighbor a algoritmy rozhodovacího stromu jsou nejznámější klasifikační algoritmy v dolování dat.

Jaký je rozdíl mezi shlukováním a klasifikací?

Shlukování je učení bez dozoru, zatímco klasifikace je technika učení pod dohledem. Seskupuje podobné instance na základě vlastností, zatímco klasifikace přiřazuje instancím předdefinované značky na základě vlastností. Clustering rozděluje datovou sadu na podmnožiny a seskupuje instance s podobnými funkcemi. Nepoužívá označená data ani tréninkovou sadu. Na druhou stranu nová data kategorizujte podle pozorování tréninkové množiny. Tréninková sada je označena.

Cílem shlukování je seskupit sadu objektů a zjistit, zda mezi nimi existuje nějaký vztah, zatímco klasifikace má za cíl zjistit, do které třídy nový objekt patří ze sady předdefinovaných tříd.

obraz
obraz
obraz
obraz

Shrnutí – Shlukování vs klasifikace

Shlukování a klasifikace se mohou zdát podobné, protože oba algoritmy dolování dat rozdělují soubor dat do podmnožin, ale jedná se o dvě různé techniky učení v dolování dat k získání spolehlivých informací z kolekce nezpracovaných dat. Rozdíl mezi shlukováním a klasifikací je ten, že shlukování je technika učení bez dozoru, která seskupuje podobné instance na základě funkcí, zatímco klasifikace je technika učení pod dohledem, která přiřazuje instancím předdefinované značky na základě funkcí.

S laskavým svolením k obrázku:

1.”Cluster-2″ od Cluster-2.gif: odvozené dílo hellisp: (Public Domain) prostřednictvím Wikimedia Commons 2.”Magnetism” od Johna Aplesseda – Vlastní dílo. (Public Domain) přes Wikimedia Commons

Doporučuje: