Hierarchikus klaszterezési módszerek
Legközelebbi szomszéd vagy egyszerűlánc-módszer
Két klaszter távolságát a két klaszter legközelebbi tagjai közötti távolságként értelmezzük.
Legtávolabbi szomszéd vagy teljeslánc-módszer
A klaszterek távolságát a két klaszter legtávolabbi pontjai közötti távolságként értelmezzük.
Átlagoslánc-módszer
Két klaszter távolságát az összes elem páronkénti távolságának átlagából számítjuk ki, ahol a pár egyik tagja az egyik klasztereleme.
Ward-féle eljárás
Az egyik leggyakrabban használt varianciamódszer, ahol a klaszterátlágoktól való négyzetes euklideszi távolságot minimalizáljuk.
Centroid módszer
Két klaszter távolságát a két klaszter centroidjának (átlagának) a távolságaként értelmezzük.
Elemzés kezdete
Általában a klaszteranalízis az elemzéshez használt változókkiválasztásával és adatgyűjtéssel kezdődik. Célszerű, ha legalább száz fős mintán dolgozunk, s a minta valamennyi elemét felmérjük a kulcsváltozók szerint. Az adatgyűjtés eredményeként egy p×n-es mátrixot kapunk, amelynek elemei a kulcsváltozó megfelelő paraméterével jellemzett piaci szereplők.
Hogyan mérjük a megvizsgáltak hasonlóságát, illetve különbözőségét?
Feltevésünk szerint a piaci szereplők annál hasonlóbbak, minél kisebb a köztük levő távolság. A távolság megméréséhez szükségünk van egy mérőszámra.
A statisztikai eljárások számos lehetőséget biztosítanak a piaci szereplők közti távolság kiszámítására: pl. az euklideszi távolság, a négyzetes euklideszi táv, a Manhattan-, a Minkowski-, a Csebisev-távolság.
A piaci szereplők közti távolságot itt is célszerű egy n×n-es távolságtáblázatban összefoglalni.
A hasonlósági-távolsági együtthatókat tartalmazó mátrix felhasználásával könnyen csoportosíthatóak az azonos szegmensbe tartozó piaci szereplők.
Hierarchikus eljárások
A hierarchikus klaszterelemzés olyan csoportkialakító eljárás, amely az adatok egymást követő fúzióján, illetve szétválasztásán alapul.
A klaszteranalízis következő fázisában döntenünk kell arról, hogy az alapsokaságból hogyan képezzünk csoportokat! A csoportok képzése hierarchikus vagy nem hierarchikus eljárásokkal történik.
Jellemzője a hierarchikus eljárásoknak, hogy ha az adott elem egyszer bekerült egy szegmensbe, akkor ott is marad, azaz a csoportosítás visszavonhatatlan.
A hierarchikus eljárások lehetnek összevonó elemzések, melyek során abból indulunk ki, hogy minden egyes piaci szereplő külön klasztert alkot (n darab egyelemű klaszterrel kezdjük az elemzést). A szegmensek a fogyasztók egyre nagyobb és nagyobb klaszterekbe csoportosításával alakulnak ki.
A folyamat addig folytatódik, amíg minden fogyasztó egyetlenegy klaszter tagjává nem válik.