Klíčový rozdíl mezi klasifikací a regresním stromem je v tom, že v klasifikaci jsou závislé proměnné kategorické a neuspořádané, zatímco v regresi jsou závislé proměnné spojité nebo uspořádané celé hodnoty.
Klasifikace a regrese jsou techniky učení k vytváření modelů predikce ze shromážděných dat. Obě techniky jsou graficky prezentovány jako klasifikační a regresní stromy, respektive vývojové diagramy s rozdělením dat po každém kroku, respektive „větvení“ve stromu. Tento proces se nazývá rekurzivní dělení. Obory, jako je hornictví, používají tyto klasifikační a regresní techniky učení. Tento článek se zaměřuje na klasifikační strom a regresní strom.
Co je klasifikace?
Klasifikace je technika používaná k dosažení schématu, které ukazuje organizaci dat počínaje prekurzorovou proměnnou. Závislé proměnné jsou to, co klasifikuje data.
Obrázek 01: Dolování dat
Strom klasifikace začíná nezávislou proměnnou, která se rozvětvuje do dvou skupin podle existujících závislých proměnných. Má objasnit odpovědi ve formě kategorizace vyvolané závislými proměnnými.
Co je regrese
Regrese je predikční metoda, která je založena na předpokládané nebo známé číselné výstupní hodnotě. Tato výstupní hodnota je výsledkem série rekurzivního dělení, přičemž každý krok má jednu číselnou hodnotu a další skupinu závislých proměnných, které se rozvětvují na další pár, jako je tento.
Regresní strom začíná jednou nebo více prekurzorovými proměnnými a končí jednou konečnou výstupní proměnnou. Závislé proměnné jsou buď spojité, nebo diskrétní numerické proměnné.
Jaký je rozdíl mezi klasifikací a regresí?
Klasifikace vs regrese |
|
Stromový model, kde cílová proměnná může nabývat diskrétních hodnot. | Stromový model, kde cílová proměnná může nabývat spojitých hodnot, typicky reálných čísel. |
Závislá proměnná | |
U klasifikačního stromu jsou závislé proměnné kategorické. | U regresního stromu jsou závislé proměnné numerické. |
Hodnoty | |
Má nastavené množství neuspořádaných hodnot. | Má buď diskrétní, ale uspořádané hodnoty, nebo nediskrétní hodnoty. |
Účel stavby | |
Účelem konstrukce regresního stromu je přizpůsobit regresní systém každé větvi determinantu tak, aby se dosáhlo očekávané výstupní hodnoty. | Strom klasifikace se větví, jak je určeno závislou proměnnou odvozenou z předchozího uzlu. |
Shrnutí – Klasifikace vs regrese
Regresní a klasifikační stromy jsou užitečné techniky pro zmapování procesu, který ukazuje na studovaný výsledek, ať už jde o klasifikaci nebo jedinou číselnou hodnotu. Rozdíl mezi klasifikačním stromem a regresním stromem je jejich závislá proměnná. Klasifikační stromy mají závislé proměnné, které jsou kategorické a neuspořádané. Regresní stromy mají závislé proměnné, které jsou spojité hodnoty nebo uspořádané celé hodnoty.