A binomiális eloszlás
Gyakoriság-eloszlásról (röviden eloszlás) beszélünk, amikor megadjuk egy sokaság elemeinek gyakoriságát valamilyen paraméter szerint. Az eloszlások lehetnek diszkrétek és folytonosak.
A binomiális eloszlás diszkrét eloszlás, azaz az x változó csak meghatározott értékeket vehet fel.
Amikor a minőséget akarjuk ellenőrizni, akkor azt akarjuk meghatározni, hogy a minta mennyire felel meg a minőségnek. A tétel darabszámát m-mel jelöljük, a hibás darabok számát pedig n-nel, így a selejtarány p = n/m lesz. Amennyiben több mintát vizsgálunk ugyanabból a tételből, akkor a p minden mintánál lehet más, de ha a tétel elég nagy a mintához képest, akkor ez az eltérés elhanyagolható.
Mit jelent a binomiális eloszlás? Ha a tételünk m darabból áll, amiből p arányú a selejt, akkor a mintaelemek kiválasztásakor p valószínűséggel lesz hibás az elem, q = 1 – p valószínűséggel pedig hibás. Összesen tehát n db hibás elem lesz a mintában. Az x valószínűségiváltozó lehetséges értékeit tehát: 0, 1, 2 … n. Egyelemű minta esetén tehát x lehet 0 vagy 1, kételemű minta esetén 0, 1 vagy 2 és így tovább.
Egyelemű minta esetén az x valószínűségi változó eloszlása a következő lesz:
• annak valószínűsége, hogy x = 0 (tehát az elem jó lesz): P(x=0) = 1 – p = q
• annak valószínűsége, hogy x = 1 (tehát a kiválasztott elem hibás lesz): P(x=1) = p
Kételemű minta esetén:
• annak valószínűsége, hogy x = 0 (tehát mindkét elem jó): P(x=0) = q*q = q2
• annak valószínűsége, hogy x = 1 (tehát egyik elem jó, másik hibás): P(x=1) = q*p
• annak valószínűsége, hogy x = 2 (tehát mindkettő hibás): P(x=2) = p*p = p2
Ha pl. a selejtarány 5%, akkor p = 0,05 és q = 0,95. Tehát P(x=0) = 0,952 = 90,25%, P(x=1) = 0,95 * 0,05 = 4,75% (ez kétszer fordul elő, mivel az első elem is lehet jó és a második hibás, ill. fordítva), P(x=2) = 0,052 = 0,25%.
Nagyobb elemszámú minta esetén is levezethetők a valószínűségek annak figyelembe vételével, hogy p + q = 1 és így
(p + q)n = 1.
A minőség-ellenőrzésben alkalmazott statisztikai módszerek
A statisztikai módszerek a valószínűség-számításra épülnek, ez a számítási módszer szinte mindegyik vizsgálat alapja, leginkább a különböző eloszlásoknál, pl. binomiális és normál eloszlás vizsgálatánál hasznosítjuk.
Alkalmazzuk a szórás-számítást, amit szintén szinte minden vizsgálat során felhasználunk a különböző képletekben. A korreláció- és regressziószámítás, a konfidenciaintervallum-meghatározás során mindenképpen szükségünk van a szórás, ill. a szórásnégyzet kiszámítására.
A különböző átlagok kiszámítása szintén egy alapmódszer, melyről nem feledkezhetünk meg a vizsgálatok során (a minta adataiból gyakran számolunk valamilyen átlagot).
A viszonyszámok alkalmazása is gyakori, pl. amikor selejtarányt határozunk meg egy mintából.
A normáleloszlás
A normáleloszlás (más néven Gauss-eloszlás) folytonos eloszlás, mivel az x bármilyen értéket felvehet.
A gyakorlatban általában akkor fordul elő normális eloszlás, ha sok, egymástól független tényező hatása összegződik. A gyártásban ezt úgy fordíthatnánk le, hogy ha a körülmények (technológia, alapanyag, dolgozó, eszközök stb.) azonosak, paramétereik állandóak, akkor az ellenőrzés során a névleges értéktől eltérő érték csak a véletlennek köszönhető, tehát az adatok normál eloszlásúnak tekinthetők.
A normáleloszlás egyértelműen meghatározható a várható érték és a szórás segítségével. A gyakorlatban a mintából számított átlagot (xátlag) és a tapasztalati szórás (s) alkalmazzuk.
A normáleloszlás sűrűségfüggvénye a várható értékre szimmetrikus görbe (a Gauss-görbe). A várható értéktől ±σ szórásnyira eltérő értékek adják az összes adat 68,26%-át, ±2σ intervallumba esik az adatok 95,44%-a, ±3σ intervallumba pedig az adatok 99,73%-a. Ez azt jelenti, hogy ha elfogadható a gyártásban 0,27% selejtarány, akkor az elfogadható minőségű termékek a várható érték 6σ széles intervallumába esnek. Csúcstechnológia esetén természetesen ezt a selejtarányt nem lehet elfogadni, ez nem eléggé szigorú feltétel.
A számítások során, ahhoz, hogy ne kelljen minden egyes esetben egyedileg meghatározni a normáleloszlás sűrűségfüggvényét, táblázatos módszert alkalmazunk. Ismertek táblázatos formában a normáleloszláshoz kapcsolódó ún. Φ(u) értékek, ezeket a standard normáleloszlás adataival együtt alkalmazva könnyen meghatározható a selejtarány. A standard normáleloszlás várható értéke 0, szórása pedig 1. A számítás módja a következő:
1.) meghatározzuk u értékeket:(x – várható érték)/szórás), ahol x az intervallum szélső értéke, a várható érték helyére beírhatjuk a számított átlagot, a szórás helyére pedig a tapasztalati szórást
2.) a táblázatból kikeressük a Φ(u) értékeket, ezzel meghatározzuk, hogy hány 5-os valószínűséggel esik az adott intervallumba a mért érték
Példa: egy termék mérete névlegesen 50 mm. A sokaság a tapasztalatok szerint normál eloszlású, átlaga 50 mm, tapasztalati szórása 0,04 mm. Határozzuk meg, hogy a termékek hány százaléka esik az 50 ± 0,06 mm intervallumba!
u = (x – xátlag)/s és x1 = 50 – 0,06 = 49,94, x2 = 50 + 0,06 = 50,06, azaz
u1 = (49,94 – 50) / 0,04 = -1,5 és u2 = (50,06 – 50) / 0,04 = 1,5
A normális eloszlás eloszlásfüggvényének táblázata:
u Φ(u) u Φ(u) 1,47 0,9292 2,02 0,9783 1,48 0,9306 2,04 0,9793 1,49 0,9319 2,06 0,9803 1,50 0,9332 2,08 0,9812 1,51 0,9345 2,10 0,9830 1,52 0,9357 2,12 0,9838 1,53 0,9370 2,14 0,9846
A táblázatban nem szerepelnek negatív u értékek, mivel Φ(-u) = 1 - Φ(u).
Tehát példánkban a keresett hányad a két Φ érték különbsége, azaz Φ(u2) - Φ(u1) = 0,9332 – (1 – 0,9332) = 0,9332 – 0,0668, azaz 0,8664. A termékek 86,64%-a esik az 50 ± 0,06 mm intervallumba.
Ugyanezt a számítási módszert lehet alkalmazni abban az esetben is, ha azt akarjuk meghatározni, hogyan kell beállítani egy gyártósort, hogy a végeredmény bizonyos intervallumon belül essen előre meghatározott valószínűséggel.
Példa: a terméket 1000 grammos dobozokba töltik. A termékek maximum 2%-a lehet 1000 grammnál könnyebb. Próbagyártás során a szórást 8 grammban állapították meg. Határozzuk meg, hogyan állítsák be a töltőgépet (mennyi legyen a névleges tömeg)!
Tudjuk, hogy 2% lehet könnyebb 1000 grammnál, tehát Φ(u) = 0,02. A táblázatban megkeressük ezt az értéket (azaz 1 – 0,02 = 0,98-at, mivel az u itt negatív szám lesz), azt kapjuk, hogy u ≈ -2,05. Az u = (x – xátlag)/s képletbe behelyettesítve:
-2,05 = (1000 – xátlag) / 8
xátlag = 1016,4 tehát a gépet 1016,4 grammra kell beállítani ahhoz, hogy az 1000 grammnál könnyebb termékek aránya ne legyen nagyobb 2%-nál.
A statisztika alkalmazásának területei
A matematikai statisztika módszereit azért alkalmazzák a minőségbiztosításban, hogy a mintaadataiból következtetéseket tudjanak levonni a teljes sokaságra. Alkalmazási területei:
• Becsléselmélet: a minta selejtarányából megbecsüljük a tétel selejtarányát a valószínűségek figyelembe vételével.
• Korreláció- és regressziószámítás: a minta eredményeinek elemzése segítségével a két mennyiség közötti összefüggéseket keressük.
• Konfidenciaintervallum-meghatározás: annak meghatározása, hogy nagy valószínűséggel milyen mintaátlag körüli intervallumba esik a várható érték.
• Hipotézisvizsgálat: egy hipotézis (feltételezés) igaz voltának eldöntése statisztika próba segítségével.
• Illeszkedésvizsgálat: azt vizsgáljuk, hogy egy minta tapasztalati eloszlásfüggvénye illeszkedik-e valamely elméleti eloszlásfüggvényhez.