Korábbi bejegyzésünkben összefoglaltuk, hogy miért fontos az üzleti partnereket pénzügyileg minősíteni és röviden utaltunk is, hogy ez milyen módszerekkel történhet.
A jelen írásban a módszerekről fogunk írni, pontosabban a döntési fa algoritmusok használatát mutatjuk be egy rövid példán a csődvalószínűség becslésére.
Döntési fa algoritmusok
A döntési fa (decision tree) a döntéstámogatásban használt grafikus modell, amit a lehetséges kimentelek vizsgálatára és az optimális döntés meghatározására használnak. A döntési fa bemenetként egy attribútumokkal leírt objektumot kap, és egy „döntést” ad vissza eredményként, ami a bemenetre adott válasz várható értéke.
Minden egyes belső csomópontja valamely attribútum értékére vonatkozó tesztnek felel meg, a csomópontból kilépő ágakat pedig a teszt lehetséges kimeneteivel címkézzük.
Az döntési fák előállítására induktív tanuló algoritmusok használhatók,
- ID3 Interactive Dichotomizer 3
- CART Classification and Regression Trees
- CHAID Chi-squared Automatic Interaction Detection
Döntési fa és csődvalószínűség
A mi esetünkben a bemeneti attribútumok egy adott vállalat pénzügyi mutatói (likviditás, ROE, eladósodottság) lesznek, a kimenet pedig annak a becslése, hogy várhatóan csődbe megy-e az adott vállalat.
A kimenet egy 0/1 bináris érték (csőd? IGEN/NEM), a döntési fa egyes levelei a pénzügyi mutatók különböző értékeinek függvényében fognak ehhez valószínűséget rendelni. A döntési fa adott ága a mintában használt pénzügyi mutatók érték kombinációit mutatja, az adott "út" végén levő levél pedig az annak megfelelő elemek számát illetve hogy abban az elemhalmazban hány cég ment csődbe.
Az adatelemzést és a fa előállítást az R statisztikai programnyelv segítségével, ctree tanuló algoritmussal végeztük. A döntési fát egy 1000 darabos mintán állítottuk elő, a mintában ~11% volt a csődbe ment cégek arány.
Ami a döntési fáról leolvasható, hogy a 0.49 alatti likviditás és -4.2% alatti ROE esetén szinte biztosan csődbe megy a cég, míg 0.75 likviditás és 1.6% ROE felett, elhanyagolható a csődkockázat.
A fa egyes levelei bizonyos vizsgálatok elvégzése alapján összevonhatók, vagyis a fa által felállított szabályrendszer egyszerűsíthető. Ezt szakmai intuíciók alapján is meg lehet tenni, de vannak eljárások a fa "tisztítására".
Figyelem, a fa előállításához használt minta egy nem reprezentatív, teszt adathalmaz, így a konkrét értékeket ne használd a gyakorlatban. Másrészt a gyakorlatban általában 3nál több (akár 7-15) pénzügyi mutatót is alkalmaznak. A fenti példával kizárólag az volt a célunk egy rövid, de érthető betekintést adjunk.
Hamarosan bemutatunk egy másik módszert is, a logit regressziós csőd előrejelzési modellt!