A pénzügy terület a vállalaton belül az egyik olyan részleg, amely a legaktívabb felhasználója az adatoknak illetve maga is számos riportot, feldolgozott információt biztosít a menedzsment és társterületek számára. Többek között ilyenek lehetnek az átfogó pénzügy riportok, előrejelzések vagy az értékesítésnek adott információk a különböző vevői forgalmakról, kinnlevőségekről, termékjövedelmezőségről. Ezek elsősorban leíró vagy elemző jellegű információk, amelyek a „hagyományos” eszköztár részei.
Ezeken túlmutat a prediktív analízis, amely egy jövő orientált megközelítés és egy 3 részes bejegyzés sorozatban fogunk vele foglalkozni. Jelen bejegyzésben egy általános áttekintést adunk, majd a következő részben megnézzük, hogy milyen alkalmazási területek lehetnek a (vállalati) pénzügyek területén. Végül egy konkrét példán mutatjuk be a prediktív analízis használatának lehetőségét R programnyelven készített lineáris regressziós modell és egy saját fejlesztésű genetikus algoritmus segítségével.
A prediktív analízis fogalmának megmagyarázása a legegyszerűbben a Gartner által publikált ábrán keresztül lehetséges, mivel az kontextusba helyezi a prediktív analízis szerepét a különböző adatelemzési módszertanokkal összevetésben.
Ez alapján látható, hogy az első és legkevésbé bonyolult szint az adatelemzésben a leíró analízis („descriptive analytics”), amely egy visszatekintő jellegű elemzés és arra fókuszál, hogy mi történt? Ennél egy fokkal bonyolultabb a diagnosztikai analízis, amely a múltbeli adatok alapján betekintést ad abba, hogy miért történtek a dolgok.
Ezután következik a sorban a prediktív analízis, amely már a jövőre fókuszál és a múltbeli adatokból levonható következtetések, minták keresése alapján próbál arra válaszolni, hogy várhatóan mi fog történni (magyarán egy előrejelző típusú elemzésről beszélünk). Üzleti tervezés és különböző üzletfejlesztési döntések várható pénzügyi hatásainak modellezéséhez használható.
Végül pedig következik az elemzéseknek az lépcsőfoka, amikor már nemcsak reaktívan vizsgáljuk az adatokat, hanem proaktívan, vagyis azt próbáljuk meghatározni, hogy mit kell tenni ahhoz, hogy bizonyos esemény bekövetkezzen („prescriptive analysis”).
Mitől prediktív egy analízis?
A prediktív analízisnek nincs egzakt definíciója, leginkább olyan fejlett elemzési módszertanokat jelent, amelyek célja, hogy múltbeli adatokból kinyert információk és minták alapján a jövőbeni viselkedésre, eseményekre vagy trendekre adjon becslést (pl. döntési fák, szabályrendszerek, logit modellek). Ugyanakkor a prediktív analízis sokszor összemosódik a leíró jellegű elemzésekkel, a különbséget az alábbiak szerint határozhatjuk meg.
- a prediktív analízis valamilyen tény adatokon alapuló előrejelzést ad egy változó jövőbeni várható értékére
- az előrejelzés releváns múltbeli adatokon alapul („tréning minta”), amely adatok kontextusa hasonló, mint amire maga az előrejelzés vonatkozik, de az előrejelzés tárgyát képező egyed egy másik mintából származik
- a tréning mintában ismertek az egyes elemek tulajdonságai és a vizsgált kimentek (pl. hogy vásárló lesz-e egy adott jövedelemi, társadalmi stb. tulajdonságokkal bíró egyénből), míg a vizsgálat (előrejelzés) tárgyát képező mintában a kimente (vásárló lesz-e az egyén) nem ismert, hiszen pont azt akarjuk megbecsülni jövedelem, életkor stb. attribútumok alapján
- a leíró statisztika az összefüggéseket alapvetően a mintán belül vizsgálja (pl. osztályozza a minta egyes tagjait), nem akar más minták elemire vonatkozó előrejelzést adni
Mik az építőkövei a prediktív analízisnek?
A Harvard Business Review cikke alapján lehet szerintem a legjobban összefoglalni, hogy milyen komponensek szükséges:
- az adatok: a jó minőségű, megbízható adat hiánya általában a legnagyobb akadály, mivel sok szervezet, vállalkozás nem rendelkezik elegendő adattal
- a (statisztikai) modellek: ha az adatokat tekintjük az üzemanyagnak, akkor a motorja a prediktív analízisnek azok a modellek, amelyek az összefüggéseket matematikailag leírják. Legtöbbször valamilyen regressziós modell a használt eszköz, illetve tanuló algoritmusokkal előállított döntési fák, szabályrendszerek is használhatók.
- feltételezések: a legalapvetőbb feltételezés minden prediktív modell esetén, hogy a jövő a múlthoz hasonlóan folytatódik (bár nem feltétlenül lineáris módon!)
Jövő héten jelentkezünk a következő résszel, addig is akit érdekel a téma, az a korábbi bejegyzések között már olvashat a témához kapcsolódóan döntési fa algoritmus és logit regressziós modell felhasználási lehetőségeiről a vállalati pénzügyek területén...