Alkalmazott matematika 3

Tartalom


Eseményalgebra

A valószínűségszámítás ún. véletlen tömegjelenségekkel foglalkozik, amelyek hasonló körülmények között (legalábbis elvileg) tetszőleges sokszor megfigyelhetők, vagy kísérletek formájában bármikor kiválthatóak vagy előállíthatóak, és ezáltal vizsgálhatóak. A vizsgált véletlen tömegjelenség egy bekövetkezését a továbbiakban kísérletnek nevezzük, egy kísérlet lehetséges, egymást kölcsönösen kizáró kimeneteleit elemi eseményeknek, az elemi események összességét pedig eseménytérnek nevezzük. Ha egyazon véletlen jelenség vizsgálatakor n darab kísérletet végzünk el, (n darabos) mintavételről beszélünk.

Például ha egy kockával dobunk, kísérletről beszélhetünk, ahol az eseményteret alkotó elemi események a dobások lehetséges értékei (vagyis ekkor az eseményteret hat elemi esemény alkotja). Ha egymás után 10-szer dobunk, 10 darabos mintavételt végeztünk.

Jelöljük az eseménytért Ω módon. Az eseménytér A⊆Ω részhalmazait (véletlen) eseményeknek nevezzük. A következő eseményeket fogjuk megkülönböztetni:
– az A⊆Ω esemény lehetetlen esemény, ha egyetlen elemet sem tartalmaz, azaz A=∅ (vagy |A|=0);
– az A⊆Ω esemény elemi esemény, ha pontosan egy elemet tartalmaz, azaz Aω={ ω∈Ω } (megjegyzés: ha nem okoz félreértést, az elemi eseményekre az Aω={ ω∈Ω } halmaz helyett egyszerűen ω∈Ω módon hivatkozunk);
– az A⊆Ω esemény összetett esemény, ha egynél több elemet tartalmaz, azaz ∣A∣>1 teljesül;
– az A⊆Ω esemény biztos esemény, ha Ω összes elemét tartalmazza, azaz A=Ω teljesül.

Az eseményalgebra alapvető fogalma az események bekövetkezése:

Például ha egy kockával dobunk, az elemi események halmaza Ω = {ω1, ω2, ..., ω6} ahol ωi jelenti azt az elemi eseményt, hogy a kockával 'i'-t dobtunk (1≤i≤6). Ekkor például az
A = {a dobás eredménye páros szám} = {ω2, ω4, ω6}
összetett esemény pontosan akkor következik be, ha az ω2, ω4 és ω6 (egymást kizáró) elemi események közül az egyik bekövetkezik.

Ha az A, B⊆Ω események egyenlőek (A=B), akkor A pontosan akkor következik be, amikor B bekövetkezik. Az A⊆Ω esemény B=Ω∖A kiegészítő vagy komplementer eseménye pontosan akkor következik be, amikor A nem következik be. A B⊆Ω esemény maga után vonja az A⊆Ω eseményt (másképpen a B eseményből következik az A esemény), ha B⊆A teljesül. Ebben az esetben ha B bekövetkezik, akkor A is bekövetkezik (de ha B nem következik be, akkor ebből A bekövetkezésére vonatkozóan semmilyen következtetést nem tudunk levonni).

A "B-ből következik A" relációt például a logikában megszokott módon B⊃A vagy B⇒A formában jelölhetjük. A valószínűségszímítás szakirodalmában szokásos a B⊂A jelölés is, de a jelölések inkonzisztenciájának elkerülése miatt a halmazelméletben megszokott B⊆A jelölés sokkal jobb választásnak tűnik.

Az eseményalgebrában az események közötti műveleteket mint (rész)halmazok közötti műveleteket értelmezzük, és a következőképpen nevezzük, ill. jelöljük:
– az A, B⊆Ω események összege az A+B = { ω∈Ω | ω∈A ∨ ω∈B} esemény;
– az A, B⊆Ω események szorzata az A*B = { ω∈Ω | ω∈A ∧ ω∈B} esemény (megjegyzés: az A és B események szorzatát a szakirodalomban AB módon is jelölik);
– az A, B⊆Ω események különbsége az A−B = { ω∈Ω | ω∈A ∧ ω∉B} esemény.
(Két esemény különbsége A−B=A*B módon is kifejezhető.)

Az A, B⊆Ω események egymást (kölcsönösen) kizáró események, ha A*B=∅ teljesül.

Az A1, A2, ..., Ak⊆Ω események teljes eseményrendszert alkotnak, ha
– A1+A2+ ... +Ak=Ω és
– Ai*Aj=∅ (1≤i<j≤k)
teljesül. A definícióból következik, hogy egy teljes eseményrendszert alkotó események közül mindig pontosan egy következik be.

Intuitíven két eseményt függetlennek nevezünk, ha az egyik bekövetkezése "nem befolyásolja" a másik bekövetkezését. Azonban pusztán eseményalgebrai eszközökkel ezt nem tudjuk egzakt módon értelmezni.


A valószínűség fogalma

Ha egy kísérletet n-szer megfigyelünk vagy végrehajtunk, és a kísérlet eseményalgebrai modelljében az A esemény k-szor következik be, a kA értéket az A esemény gyakoriságának, az

ηA kA
n
számot az A esemény relatív gyakoriságának nevezzük. A valószínűségszámítás jelentőségét az a gyakorlati tapasztalat adja, hogy a véletlen tömegjelenségek esetében a relatív gyakoriság egy adott (0 és 1 közötti) számérték körül ingadozik.

    Jelöljük azt az értéket, amely körül az ηA relatív gyakoriság ingadozik, P(A)-val.

Az alábbiakban ezt az értéket fogjuk intuitíven az A esemény valószínűségének tekinteni. A valószínűség matematikai fogalmát azonban axiomatikusan vezetjük be.

A valószínűségre vonatkozó axiómák a következők (A. N. Kolmogorov nyomán, 1933):

(1) Legyen Ω egy eseménytér. Az eseménytér minden A⊆Ω eseményéhez hozzárendelünk egy P(A) valós számot, amelyet az esemény valószínűségének nevezünk. A valószínűség 0 és 1 közötti érték, azaz bármely A⊆Ω esemény esetén 0≤P(A)≤1 teljesül.

(2) A biztos esemény valószínűsége 1, azaz P(Ω)=1 teljesül.

(3) Ha A1, A2, ..., Ak egymást páronként kizáró események (azaz Ai*Aj=∅, 1≤i<j≤k), akkor P(A1+A2+ ... +Ak) = P(A1)+P(A2)+ ... +P(Ak) teljesül.

Megjegyzés: a továbbiakban a "valószínűség" helyett néha használni fogjuk a rövidebb "valség" megnevezést is.

Az axiómákból számos fontos összefüggés levezethető. Legyenek A, B⊆Ω tetszőleges események. Ekkor teljesülnek az alábbi összefüggések:

Az utolsó összefüggés levezetése:

P(A+B)=P(A−B)+P(B−A)+P(A*B), de mivel
    P(A−B)=P(A)−P(A*B) és
    P(B−A)=P(B)−P(A*B) teljesül, ezért
P(A+B)=P(A)−P(A*B)+P(B)−P(A*B)+P(A*B), ezt egyszerűsítve
P(A+B)=P(A)+P(B)−P(A*B), q.e.d.


Események függetlensége

Az A, B⊆Ω eseményeket függetleneknek nevezzük, ha P(A*B) = P(A)*P(B) teljesül. Ebből következik, hogy a biztos és a lehetetlen esemény minden eseménytől független; továbbá az, hogy az egymást kizáró és pozitív valségű események nem lehenek függetlenek.

Legyenek A, B⊆Ω események, és legyen B egy pozitív valószínűségű esemény (azaz P(B)>0 teljesül). Tegyük fel, hogy a B esemény bekövetkezett; ilyen feltétel mellett az A esemény bekövetkezését jelöljük A|B-vel.

Az A|B esemény az A esemény leszűkítését jelenti az Ω|B eseménytérre, azaz B = { ω1, ω2, ..., ωm } esetén
A|B = { ω∈A | ω∈ B }
teljesül. Ez értelemszerűen megfelel az Ω eseménytéren az
A*B = { ω∈Ω | ω∈A ∧ ω∈ B }
eseménynek.

Megjegyzések:
(1) Legyen az Ω eseménytéren a B esemény valsége P(B) (a B esemény az Ω|B eseménytéren a biztos esemény, tehát a B esemény valsége PB=1.) Ekkor az Ω|B eseménytér elemi eseményeinek valsége PB(ω)=P(ω)/P(B), mivel az Ω|B eseménytéren az elemi események valségének az összege 1 kell, hogy legyen. (Feltételezzük, hogy a B esemény bekövetkezése nem befolyásolja az ωi elemi események valségét.)
(2) Az ΩB=Ω|B eseménytérre való leszűkítés minden A⊆Ω eseménynek az A*B⊆Ω ↔ A|B⊆ΩB eseményt felelteti meg. Ebből azonban nyilvánvalóan nem következik az, hogy PB(A|B)=P(A*B), mivel az A|B és A*B eseményeket, valamint a PB és P valószínűségeket más eseménytéren értelmezzük.

Az A esemény B eseményre vonatkozó feltételes valószínűsége alatt az A|B eseménynek az Ω|B eseménytéren vett valószínűségét, azaz PB(A|B)-t értjük, és PB(A|B)=P(A*B)/P(B) módon definiáljuk. (Ez a definíció teljes összhangban van a valószínűség klasszikus kiszámítási módjával (ld. később; vö. Csatlósné 1996: 173-174). Ez azonban hallgatólagosan feltételezi, hogy az Ω eseménytér leszűkítése az ΩB eseménytérre, azaz a B esemény megfigyelése nem változtatja meg a valószínűségi viszonyokat.) A továbbiakban, ha nem okoz félreértést, PB(A|B) helyett egyszerűen P(A|B)-t írunk.

A feltételes valószínűség definíciójából P(A*B)=P(A|B)*P(B) következik. Ebből viszont az következik, hogy független események esetén (P(A*B)=P(A)*P(B) és P(B)>0 miatt) P(A|B)=P(A) teljesül.

Tekintsük a következő példát: legyen 3 tyúkunk (ezek halmaza {A,B,C}) és 2 kacsánk (ezek halmaza pedig {X,Y}). Válasszunk két állatot egymás után úgy, hogy a kiválasztott állatot mindig visszatesszük. Mivel egymás után választunk, a kiválasztás sorrendje számít, azaz pl. (A,X) és (X,A) különböző elemi események. Ezért összesen 5*5=25 lehetséges elemi eseményünk van.
Legyen például a 'D' esemény az, hogy egy tyúkot és egy kacsát választottunk (a kiválasztás sorrendjétől függetlenül). A 'D' esemény 3*2+2*3=12 választás esetén következhet be, vagyis P(D)=12/25.
Ezek után legyen az 'E' esemény az, hogy elsőre tyúkot választottunk. Az 'E' esemény 3*5=15 választás esetén következhet be, vagyis P(E)=15/25=3/5.
Az 'F' esemény pedig legyen az, hogy az első kiválasztott állat megegyezik a másodikkal (azaz a két választás megegyezik). Az 'F' esemény 5 választás esetén következhet be, vagyis P(F)=5/25=1/5.
Mivel az E*F esemény nyilvánvalóan 3 választás esetén következhet be, ezért P(E*F)=3/25. De P(E)=3/5 és P(F)=1/5 miatt P(E*F)=P(E)*P(F), vagyis az 'E' és az 'F' események egymástól függetlenek.
Vizsgáljuk meg az E|F feltételes eseményt. Mivel ΩF 5 elemi eseményből áll, amiből az (A,A), (B,B) és (C,C) elemi események alkotják az E|F eseményt, ezért P(E|F)=3/5, ami megegyezik P(E)-vel.
Vizsgáljuk meg az F|E feltételes eseményt is. Mivel ΩE 15 elemi eseményből áll, amiből az (A,A), (B,B) és (C,C) elemi események alkotják az F|E eseményt, ezért P(E|F)=3/15=1/5, ami megegyezik P(F)-vel.

Írjuk a P(A*B)=P(A|B)*P(B) képletbe az A*B esemény helyett az A2*A1 eseményt, ekkor
    P(A2*A1)=P(A2|A1)*P(A1)
adódik. Ezt három eseményre általánosítva P(A3*A2*A1) = P(A3|A2*A1)*P(A2*A1) miatt
    P(A3*A2*A1) = P(A3|A2*A1)*P(A2|A1)*P(A1)
adódik (és ez könnyen tovább általánosítható akár 'n' eseményre is). A képlet egy lehetséges alkalmazására később egy példát is adunk.

Ha az A, B⊆Ω események függetlenek, akkor P(A*B)=P(A)*P(B) teljesül, tehát a feltételes valószínűség definíciójából PB(A|B)=P(A) és PA(B|A)=P(B) következik.

Tegyük fel, hogy a B1, B2, ..., Bk⊆Ω események teljes eseményrendszert alkotnak, és az A⊆Ω eseményre ismertek a P(A|Bi) feltételes valószínűségek (1≤i≤k). Ekkor

P(A) = 
k
Σ
i=1
P(A|Bi)*P(Bi)
teljesül (a teljes valószínűség tétele).

Tegyük fel, hogy a B1, B2, ..., Bk⊆Ω események teljes eseményrendszert alkotnak, P(Bi)>0 (1≤i≤k), A⊆Ω tetszőleges esemény, amelyre P(A)>0, és ismertek a P(A|Bi) feltételes valószínűségek (1≤i≤k). Ekkor

P(A)
k
Σ
i=1
P(A|Bi)*P(Bi)
felhasználásával a P(Bj|A) feltételes valószínűségek (1≤j≤k) kiszámíthatók
P(Bj|A) =  P(A|Bj)*P(Bj)
P(A)
módon (Bayes tétele).

Tekintsük az alábbi példát (Bíró-Vincze 2010: 364-365). Egy üzemben egy terméket négy különböző géppel állítanak elő. Az első gép a termékek 20 százalékát, a második és harmadik 25 százalákát, a negyedik pedig 30 százalékát álltja elő. Emellett még azt is tudjuk, hogy az első gép selejtszázaléka 2%, a másodiké 1.5%, a harmadiké 2.5%, a negyediké pedig 1%.
Jelentse 'A' azt az eseményt, hogy egy kiválasztott termék selejtes. Keressük 'A' valségét, továbbá annak a valségét, hogy a kiválasztott terméket a negyedik gép gyártotta.
    (1) Ha Bi jelenti azt, hogy a kihúzott terméket az i-dik gép állította elő (1≤i≤4), akkor P(B1)=0.20, P(B2)=0.25, P(B3)=0.25, P(B4)=0.30 teljesül.
    (2) Mivel az első gép selejtszázaléka 2% (=0.02), a másodiké 1.5% (=0.015), a harmadiké 2.5% (=0.025), a negyediké 1% (=0.01), ezért az 'A' selejtes termék kihúzásának feltételes valsége P(A|B1)=0.020, P(A|B2)=0.015, P(A|B3)=0.025, P(A|B4)=0.010 gépenként.
    (3) A fentieket felhasználva az 'A' selejtes termék valségére a teljes valószínűség tétele alapján P(A) = P(A|B1)*P(B1) + P(A|B2)*P(B2) + P(A|B3)*P(B3) + P(A|B4)*P(B4) = 0.017 adódik.
    (4) Annak a valsége, hogy az 'A' esemény teljesülése mellett a kiválasztott selejtes terméket a negyedik gép gyártotta, a Bayes-tétel alapján számítható ki P(B4|A) = P(A|B4)*P(B4) / P(A) ≈ 0.176 módon.


Klasszikus valószínűségi mező

Az Ω = { ω1, ω2, ..., ωn } véges, n elemből álló eseményteret és a rajta értelmezett P : 2Ω → [0,1]⊆ℝ valószínűséget klasszikus valószínűségi mezőnek nevezzük, ha minden elemi esemény azonosan valószínű, azaz P(ωi)=P(ωj) (0≤i<j≤n) teljesül.

Ha Ω klasszikus valószínűségi mező, amelyre ∣Ω∣=n, akkor minden ω∈Ω elemi eseményre P(ω)=1/n teljesül.
Ha pedig A={ ω1, ω2, ..., ωk }⊆Ω tetszőleges esemény, amelyre ∣A∣=k, akkor az A esemény valószínűsége

P(A)  k   =   (kedvező esetek száma) 
 n   (lehetséges esetek száma) 
módon számítható ki. (Ez a valószínűségek ún. klasszikus vagy kombinatorikus kiszámítási módja.)

Az előzőek alkalmazására tekintsük a következő példát. Egy 32 lapos magyar kártyából egymás után három lapot húzunk (visszatevés nélkül). Számítsuk ki annak a valségét, hogy az első kihúzott lap hetes lesz (A1), a második kilences lesz (A2), és a harmadik hetes lesz (A3)? (Solt 1971: 134-135).
Első megoldás:
    (1) Mivel a 32 lapos magyar kártyában 4 db. hetes van, ezért a valség klasszikus kiszámítási módja alapján P(A1)=4/32=1/8 adódik. (Ha a klasszikus Ω={(ωijk) | 1≤i,j,k≤32} eseménytérben minden elemi esemény azonos 32*32*32 valségű, akkor ebben az esetben is P(A1)=4*32*32/(32*32*32)=1/8 adódik.)
    (2) Mivel a 32 lapos magyar kártyában 4 db. kilences van, ezért a hetes kihúzása (A1) után a valség klasszikus kiszámítási módja alapján P(A2|A1)=4/31 adódik.
    (3) Mivel a 32 lapos magyar kártyában 4 db. hetes van, ezért a hetes és a kilences kihúzása (A1*A2) után a valség klasszikus kiszámítási módja alapján P(A3|A1*A2)=3/30=1/10 adódik.
    Tehát a keresett valószínűségre P(A3*A2*A1) = P(A3|A2*A1)*P(A2|A1)*P(A1) = (1/10)*(4/31)*(1/8) = 1/620 adódik.
Második megoldás:
A valség klasszikus kiszámítási módja alapján a kedvező esetek száma k=4*4*3, az összes eset száma pedig n=32*31*30, amiből közvetlenül adódik a P=k/n=1/620 valószínűség.

Egy fontos kiegészítés az előző példa megoldásához.

A három húzásnak megfelelő eseménytér az Ω=Ω123 direkt szorzatnak felel meg. Legyen A∈Ω a három húzásnak megfelelő esemény, az egyes húzásoknak megfelelő eseményeket pedig jelöljük A1∈Ω1, A2∈Ω2, A3∈Ω3 módon. Ekkor alapvető feltételezés az, hogy mivel az egyes húzásokat egymástól függetleneknek tekintjük, P(A)=P(A1)*P(A2)*P(A3) teljesül.

Valójában ilyenkor az A3*A2*A1, valamint az A2|A1 és A3|A2*A1 "feltételes" események pusztán formális jelölések, mivel az A1, A2 és A3 eseményeket más-más eseménytereken értelmezzük. Az előző húzások következményeit az egyes húzásoknak megfelelő Ω1, Ω2 és Ω3 eseményterek meghatározásakor vettük figyelembe.

Egy másik példa a következő. Egy kockadobás során jelölje 'A' azt az eseményt, hogy 6-nál kisebbet dobunk, azaz legyen A={1,2,3,4,5}. Másrészt jelölje 'B' azt az eseményt, hogy páros számot dobunk, azaz B={2,4,6}. Mekkora a valószínűsége annak, hogy ha páros számot dobunk, akkor az eredmény 6-nál kisebb lesz? (Bíró-Vincze 2010: 360)
Megoldás:
    A valség klasszikus kiszámítási módja alapján P(B)=1/2 és P(A*B)=2/6=1/3, ezért a feltételes valség definíciója alapján a keresett valségre P(A|B)=P(A*B)/P(B)=2/3 adódik.
(A feladat értelmezésekor először leszűkítettük az eseményteret a páros számokra, és feltettük, hogy ezek azonos valószínűségű elemi eseményeket jelentenek. Figyeljük meg, hogy a következő valószínűségeloszlás (ld. később) mellett
    P(1)=0, P(2)=1/3, P(3)=0, P(4)=1/3, P(5)=0, P(6)=1/3
P(A*B)=P(2)+P(4)=2/3 adódik, vagyis ugyanarra a megoldásra jutunk.)
A feladat megfordítása:
    A feladat értelmezésekor nagyon fontos, hogy melyik az az esemény, amelynek alapján a feltételes valséget képezzük. Ha ugyanis annak a valségét keressük, hogy ha 6-nál kisebb számot dobunk (A), akkor az eredmény páros lesz (B), más eredményre jutunk. A valség klasszikus kiszámítási módja alapján P(A)=5/6 és P(A*B)=2/6, ezért a keresett valségre a feltételes valség definíciója alapján P(B|A)=P(A*B)/P(A)=2/5 adódik.
(A feladat értelmezésekor először leszűkítettük az eseményteret a 6-nál kisebb számokra, és feltettük, hogy ezek azonos valószínűségű elemi eseményeket jelentenek. Figyeljük meg, hogy a következő valószínűségeloszlás (ld. később) mellett
    P(1)=1/5, P(2)=1/5, P(3)=1/5, P(4)=1/5, P(5)=1/5, P(6)=0
P(A*B)=P(2)+P(4)=2/5 adódik, vagyis ugyanarra a megoldásra jutunk.)
Kiegészítés:
    Ha annak a valségét keressük, hogy páros és 6-nál kisebb számot fogunk dobni, a valségre a klasszikus kiszámítási mód alapján (feltéve, hogy minden dobás azonosan valószínű) egyszerűen P(A*B)=2/6=1/3 adódik.


Klasszikus valószínűségeloszlások

Legyen A1, A2, ..., Ak⊆Ω teljes eseményrendszer. A teljes eseményrendszer valószínűségeinek sorozatát valószínűségeloszlásnak (vagy ha nem okoz félreértést, egyszerűen eloszlásnak) nevezzük (Rényi 1973: 83). Ennek megfelelően a

p1=P(A1), p2=P(A2), ..., pk=P(Ak)

valószínűségek sorozata egy valószínűségeloszlás, amelyre

k
Σ
i=1
pi  = 1

teljesül.

Korábban láttuk, hogy ha az Ω = { ω1, ω2, ..., ωn } véges eseménytér klasszikus valószínűségi mező, akkor az ω1, ω2, ..., ωn elemi események valószínűségeire p1 = p2 = ... = pn = 1/n teljesül. Ilyenkor egyenletes eloszlásról beszélünk.

Nézzünk meg két típusfeladatot, amelyek a gyakorlatban jól használható valószínűségeloszlásokhoz vezetnek.

visszatevés nélküli mintavétel

Legyen 'N' darab termékünk, és legyen ezek között 's' darab selejt (1≤s≤N). Vegyünk a termékekből egy 'n' elemű mintát (1≤n<<N) egyszerre vagy egymás után, de visszatevés nélkül. Határozzuk meg annak a valségét, hogy ezek között 'k' darab selejt lesz (0≤k≤s, 0≤k≤n) (Reimann-Tóth 1985: 26-27). A megoldás:

P(k)
( s ) ( N−s )
k n−k
( N )
n

(a) Ha az 'n' elemű minta elemeit egyszerre ("közvetlenül") vesszük ki (vagyis a kiválasztott elemek sorrendje nem számít), a képlet a valség klasszikus kiszámítási módja alapján a következőképpen kapható meg:
– a mintában 'k' darab különböző selejtes termék van, amelyeket az összes 's' darab selejtes termékből választunk; a kiválasztott selejtek sorrendje nem lényeges, ezért az összes kiválasztás számát 's' k-ad rendű ismétlés nélküli kombinációja adja, vagyis k1=(s k);
– az 'n' elemű mintában (n−k) darab különböző nem selejtes termék van; ezeket az összes (N−s) darab nem selejtes termékből választjuk ki úgy, hogy a kiválasztott termékek sorrendje nem lényeges, ezért az összes ilyen kiválasztás számát (N−s) (n−k)-ad rendű ismétlés nélküli kombinációja adja, vagyis k2=(N−s n−k);
minden lehetséges 'k' elemű selejtcsoporthoz tartozhat minden lehetséges (n−k) elemű nem selejtes termékcsoport; az összes variációs lehetőséget a kiválasztások számának szorzata adja, vagyis k1*k2;
– a kedvező esetek száma tehát (s k)*(N−s n−k);
– az 'n' elemű mintában különböző termékek vannak, és ezek sorrendje nem lényeges, ezért az összes minta (az összes eset) számát 'N' elem n-ed rendű ismétlés nélküli kombinációja adja, vagyis (N n);
– ha a kedvező esetek számát elosztjuk az összes esetek számával, a fenti képlet adódik.

(b) Ha egyenként, visszatevés nélkül vesszük ki a mintaelemeket (és a kiválasztott elemek sorrendje számít), akkor a következőképpen számolhatunk:
    (1) Ha először egymás után 'k' darab selejtet húzunk, akkor ezt k1=s!/(s−k)! módon tehetjük meg (ismétlés nélküli variáció);
    (2) Ha ezután egymás után (n−k) darab minőségi (nem selejtes) terméket húzunk, akkor ezt k2=(N−s)!/((N−s)−(n−k))! módon tehetjük meg (ismétlés nélküli variáció);
    (3) mivel (1) minden lehetséges esetéhez (2) minden lehetséges esete tartozhat, a lehetséges esetek száma összeszorzódik, azaz k3=k1*k2;
    (4) az 's' darab selejtet az 'n' elemű mintában "bárhol" megkaphatjuk, vagyis k4=n alatt k*k3 (ismétléses permutáció, vagy ismétlés nélküli kombináció).
A kedvező esetek számára (némi számolás után) kΣ=(s alatt k)*(N-s alatt n-k)*n! adódik.
Az összes eset könnyen megkapható, mivel 'N' termékből 'n' darab mintaelemet veszünk egymás után, visszatevés nélkül (ismétlés nélküli variáció), vagyis nΣ=N!/(N-n)! adódik.
A valószínűség klasszikus kiszámítási módja alapján P(k)=kΣ/nΣ, ami, ha az n! értékét "átvisszük" a tört nevezőjébe, éppen a fenti képletet adja, vagyis a P(k) valségek kétféle kiszámítási módja ugyanahhoz az értékhez vezet.

Legyen kmax=min(n,s), ekkor világos, hogy az n elemű mintában 0≤k≤kmax selejt fordulhat elő. Tehát a valószínűségek

P(0), P(1), ..., P(kmax)

sorozata valószínűségi eloszlást alkot (ld. hipergeometrikus eloszlás).

Egy tipikus példa hipergeometrikus eloszlásra a lottóhúzás. Ekkor P(0) annak a valsége, hogy nem volt egy találatunk sem, P(1) annak a valsége, hogy egy találatunk volt, ..., és P(5) annak a valsége, hogy ötös találatunk lett a lottón.

visszatevéses mintavétel

Legyen 'N' darab termékünk, és legyen ezek között 's' darab selejt (1≤s≤N). Vegyünk ki a termékekből egymás után 'n' darabot (1≤n<<N), és a kivett terméket minden alkalommal tegyük is vissza. Határozzuk meg annak a valségét, hogy ezek között 'k' darab selejt lesz (0≤k≤s, 0≤k≤n) (Reimann-Tóth 1985: 27-28). A megoldás:

P(k)
( n ) sk (N−s)n−k
k
  Nn  

A fenti formulában ismétléses variációt használtunk, azaz ha s1 és s2 két különböző selejt, és m1, m2, ..., m(n−2) tetszőleges termékek, akkor pl. n=4, k=2 esetén az (s1,s2,m1,m2) és az (s2,s1,m1,m2) minták különbözőek lesznek.

A fenti formula számlálójában szereplő binomiális együttható n elem összes ismétléses permutációjának számát adja k és (n−k) azonos elem mellett. Ez a k darab selejtet és n−k darab nem selejtes terméket adó különböző minták számát adja meg, ha a mintavételek sorrendje számít, azaz pl. n=4, k=2 esetén az (s,s,n,n) és az (n,s,n,s) minták különbözőek lesznek.

Adott N, s és n mellett, továbbá kmax=min(n,s) jelöléssel az n elemű mintában 0≤k≤kmax selejt fordulhat elő. Tehát a valószínűségek

P(0), P(1), ..., P(kmax)

sorozata valószínűségi eloszlást alkot (ld. binomiális eloszlás).

Adjunk egy példát binomiális eloszlásra. Legyen egy akváriumban N darab hal, amelyek össze-vissza (azaz "véletlenszerűen") úszkálnak. A halak között van 's' darab aranyhal. Gondolatban válasszuk ki azokat a halakat, amelyek közel jönnek hozzánk, és addig figyeljük őket, amíg 'n' halat nem láttunk (tegyük fel, hogy s>n teljesül). Ekkor P(0) annak a valsége, hogy a megfigyelt halak közt nem volt aranyhal, P(1) annak a valsége, hogy a megfigyelt halak közt egy aranyhal volt, ..., P(n) pedig annak a valsége, hogy a megfigyelt halak közt 'n' darab aranyhal volt, azaz minden megfigyelt hal aranyhal volt. (Jegyezzük meg, hogy ha megfigyelt halakat kivennénk az akváriumból, hipergeometrikus eloszlást kapnánk.)

A binomiális eloszlás valószínűségi értékeit például az alábbi programmal írathatjuk ki:

/* binomiális eloszlás */

function hatvany(x,n) {
 // csak egész n-re
 if(n==0) {
  return 1; // feltétel: x nem 0
  }
 var i=1;
 var h=1;
 while(i<=n) {
  h=h*x;
  i=i+1;
  }
 return h;
 }

function fakt(n) {
 var f=1;
 var i=1;
 while(i<=n) {
  f=f*i;
  i=i+1;
  }
 return f;
 }

function n_alatt_k(n,k) {
 // csak viszonylag kis n és k esetén :)
 var a=fakt(n);
 var b=fakt(k)*fakt(n-k);
 return a/b;
 }

function binomialis(i) {
 var bn=n_alatt_k(n,i);
 bn=bn*hatvany(p,i)*hatvany(q,n-i);
 return bn;
 }

// főprogram

writeln("Binomiális eloszlás");

var n=6;
var p=0.3, q=0.7; // q=1-p;

writeln("n="+n+", p="+p);

var i=0;
var sb="";
var sumb=0;
while(i<=n) {
 sb+=binomialis(i).toFixed(2)+" ";
 sumb+=binomialis(i);
 i=i+1;
 }

writeln();
writeln("binomiális eloszlás:\n"+sb);

writeln();
writeln("összeg: "+sumb.toFixed(2));

writeln("___________");

Ábrázoljuk egy hisztogramon a binomiális eloszlás valószínűségértékeit (n=6 paraméter mellett).

p =

1.00
0.95
0.90
0.85
0.80
0.75
0.70
0.65
0.60
0.55
0.50
0.45
0.40
0.35
0.30
0.25
0.20
0.15
0.10
0.05
0.00
0 1 2 3 4 5 6

Gyakorló feladatok (vö. Szabó 1996: 89-90; Bognárné et al. 1971: 42-43)

(1) Válasszunk ki 10 számjegyet a {0,1,2,...,9} decimális számjegyek közül úgy, hogy megengedjük a számjegyek ismétlődését, és a számjegyek sorrendjét nem vesszük figyelembe.

(1.1) Határozza meg az elemi események halmazát!

(1.2) Ha A ⇋ "csupa páros számot választottunk" és B ⇋ "csupa prímszámot választottunk", mi a jelentése az A+B eseménynek?

(1.3) Ha B ⇋ "csupa prímszámot választottunk" és D ⇋ "csupa 5-tel osztható számot választottunk", mi a jelentése a B*D eseménynek?

(1.4) Ha A ⇋ "csupa páros számot választottunk" és C ⇋ "csupa páratlan számot választottunk", mi a jelentése az A+C eseménynek?

(1.5) Ha C ⇋ "csupa páratlan számot választottunk" és D ⇋ "csupa 5-tel osztható számot választottunk", mi a jelentése a C*D eseménynek?

(2) Egy osztályból véletlenszerűen kiválasztunk egy tanulót.

(2.1) Határozza meg az elemi események halmazát!

(2.2) Ha A ⇋ "a kiválasztott tanuló fiú", B ⇋ "a kiválasztott tanuló nem dohányzik" és C ⇋ "a kiválasztott tanuló kollégista", mi a jelentése az A*B*C eseménynek?

(2.3) Ha A ⇋ "a kiválasztott tanuló fiú", B ⇋ "a kiválasztott tanuló nem dohányzik" és C ⇋ "a kiválasztott tanuló kollégista", milyen feltételek mellett teljesül az
   A*B*C=A
összefüggés?

(2.4) Ha A ⇋ "a kiválasztott tanuló fiú" és B ⇋ "a kiválasztott tanuló nem dohányzik", milyen feltételek mellett teljesül az
    A=B
összefüggés?

(3) Ha két szabályos kockával dobunk, mennyi a valsége, hogy

(3.1) a dobott számok összege egyenlő 7-tel?

(3.2) a dobott számok összege nagyobb 9-nél?

(3.3) a dobott számok összege kisbb 5-nél?

(4) Egy 32 lapos magyar kártya csomagból véletlenszerűen kihúzunk egy lapot. Mekkora annak a valsége, hogy

(4.1) ászt húzunk?

(4.2) pirosat húzunk?

(4) Egy 32 lapos magyar kártya csomagból véletlenszerűen kihúzunk (kiosztunk) 8 lapot. Mekkora annak a valsége, hogy

(4.1) a piros ász a kihúzott lapok közt van?

(4.2) a lapok között mind a négy ász ott van?

(4.3) a lapok mind egy színűek?

(5) Az ötös lottóhúzáskor mekkora a valsége

(5.1) a kettes találatnak?

(5.2) a hármas találatnak?

(5.3) a négyes találatnak?

(5.4) az ötös találatnak?

Az (5.1) feladat egy lehetséges megoldása a következő:
Az öt lottószámot 90 alatt 5 féleképpen lehet kihúzni. Ha egy "feladott" szelvényen öt számot adtunk meg, a kérdés az, hogy elvileg hány olyan lottószelvény létezik, amelyen a megadott számokból legalább kettő szerepel (ti. ezek lesznek a számunkra "kedvező" esetek). Egyrészt az öt számból a két kihúzott számot 5 féleképpen tudjuk kiválasztani; másrészt pedig ezekhez a fennmaradó 88 számból 88 féleképpen választhatunk tetszőleges további három számot (megengedve azt is, ha pl. mind az öt számot eltaláljuk; ha csak a kettes találatokat vizsgáljuk, 88 helyett 85-öt kell írnunk). Az általunk megadott öt számból legalább két számot tartalmazó lottószelvények száma tehát 5*88 darab szelvény. Ezt osztva az összes lottószelvény számával, a keresett valséget kapjuk. Kiszámítva a legalább kettes találat valségére Pa≈0.025, a pontosan kettes találat valségére pedig Pb≈0.022 adódik (vagyis átlagosan kb. 40 szelvényenként várható egy nyeremény).

(6) Adja meg az ötös, a hatos és a skandináv lottóhúzáshoz tartozó valószínűségeloszlásokat!

(7) Egy családban két gyerek van. Feltéve, hogy az egyik gyerek fiú, mennyi a valsége, hogy mindkét gyerek fiú?

(8) Egy 5 piros és 5 fehér golyót tartalmazó urnából egymás után (visszatevés nélkül) kihúzunk 3 golyót. Feltéve, hogy az első két húzás eredménye ugyanaz, mennyi a valsége, hogy a harmadik húzás piros?


Valószínűségi változók

Legyen Ω = { ω1, ω2, ..., ωn } eseménytér. Ekkor az elemi események halmazán értelmezett

ξ : Ω → ℝ

függvényt valószínűségi változónak (röviden valségi változónak) nevezzük. Például az A⊆Ω eseményhez rendelt ξA indikátorváltozó, amelyet

ξA
{
1 ha A bekövetkezett
0 ha A nem következett be (azaz A következik be)
módon definiálunk, valószínűségi változó.

Egy ξ valségi változó leképezi az Ω eseményteret a valós számok halmazára. (Szemléletesen kifejezve a ξ valségi változó "számszerűsíti" az elemi eseményeket.) Ha ξ injektív leképezés, akkor a Rng(ξ)⊆ℝ értékkészlet minden elemének egyértelműen megfeleltethető egy elemi esemény. Például ha kockadobás esetében ξ(ω) ⇋ "az ω dobásnak megfelelő szám" akkor az {1, 2, 3, 4, 5, 6} halmaz minden eleme kölcsönösen egyértelműen megad egy elemi eseményt.

Ha viszont a ξ valségi változó nem injektív, akkor a Rng(ξ)⊆ℝ értékkészlet minden x∈Rng(ξ) elemének az Ω egy részhalmaza, azaz egy 'Ax' esemény feleltethető meg Ax−1(x)⊆Ω módon. (Vagyis az Ax eseményt azok az ω∈Ω elemi események alkotják, amelyekre ξ(ω)=x teljesül.)

Egy valószínűségi változót diszkrétnek nevezünk, ha értékkészlete véges, vagy megszámlálhatóan végtelen (azaz az általa felvett értékek sorozatba rendezhetőek). Egy valószínűségi változót folytonosnak nevezünk, ha a változó tetszőleges valós számértéket felvehet, értékkészlete "bármilyen valós számértéket tartalmazhat" (Wikipédia). (A folytonos valségi változók értékkészlete előállítható egy vagy (megszámlálhatóan) sok intervallum egyesítéseként (azaz az értékkészlet ún. Borel-halmazt alkot). Másképpen megfogalmazva tetszőleges x∈ℝ esetén a {ξ<x}={ω∈Ω | ξ(ω)<x} halmaz eseményt alkot, vö. Bíró-Vincze 2010: 367)

Legyen ξ : Ω → ℝ valségi változó, és legyen Ax⊆Ω az az esemény, amelyre
    Ax = { ω∈Ω | ξ(ω)=x }
teljesül. A továbbiakban az Ax eseményt { ξ=x } módon jelöljük. Hasonló módon definiálhatjuk a { ξ<x }, { a≤ξ<b } stb. eseményeket is. Az ilyen módon definiált események valségét röviden P(ξ=x), P(ξ<x) stb. módon fogjuk jelölni. Több esemény esetén az események szorzata (azaz metszete) helyett használni fogjuk a vessző operátort, például az
    { a≤ξ<b }*{ c≤ξ<d }
esemény valségét P( a≤ξ<b, c≤ξ<d ) módon fogjuk jelölni.

Legyenek ξ : Ω → ℝ és η : Ω → ℝ ugyanazon az eseménytéren értelmezett valségi változók. A ξ és η valségi változókat függetleneknek nevezzük, ha
    ∀ x∈ℝ ∀ y∈ℝ ( P(ξ<x, η<y)=P(ξ<x)*P(η<y) )
teljesül. Több valségi változó (teljes) függetlensége az egyes valségi változók páronkénti függetlenségét jelenti.


Eloszlásfüggvény

Legyen ξ : Ω → ℝ valségi változó. A ξ valségi változó eloszlásfüggvénye alatt azt az Fξ : ℝ → [0,1] függvényt értjük, amelyre minden x∈ℝ valós szám esetén Fξ(x)=P(ξ<x) teljesül.

Legyen ξ : Ω → ℝ valségi változó, Fξ(x) pedig ennek az eloszlásfüggvénye. Ekkor bármilyen a, b∈ℝ, a<b valós számok esetén
(1) P(ξ<a)=Fξ(a),
(2) P(ξ≥a)=1−Fξ(a),
(3) P(a≤ξ<b)=Fξ(b)−Fξ(a)
teljesül.

Emeljük ki, hogy tetszőleges a<b∈ℝ valós számok esetén
– a { ξ<b } esemény valószínűségét az eloszlásfüggvény ismeretében Fξ(b) módon, és
– az { a≤ξ<b } esemény valószínűségét az eloszlásfüggvény ismeretében Fξ(b)−Fξ(a) módon
kaphatjuk meg.

Legyen ξ : Ω → ℝ valségi változó, Fξ : ℝ → [0,1] pedig ennek az eloszlásfüggvénye. Ekkor az Fξ(x) valós függvényre teljesül, hogy
(a) monoton növekedő,
(b) az értelmezési tartomány minden pontjában balról folytonos,
(c) −∞-ben vett határértéke 0, és
(d) +∞-ben vett határértéke 1.

Az eloszlásfüggvényt egyes esetekben
    Fξ(x)=P(ξ≤x)
módon definiálják, azaz a P(ξ≤x) valószínűségben megengedik az egyenlőséget is. Ekkor a függvény jobbról folytonos lesz. Az angol és a német szakirodalom az eloszlásfüggvényeket rendszerint így értelmezi. Kolmogorov nyomán például Magyarországon általában a szigorú egyenlőtlenséget használják. (Wikipédia)

Az eloszlásfüggvény segítségével egyszerűen definiálhatjuk a folytonos valószínűségi változó fogalmát:
    Egy ξ : Ω → ℝ valószínűségi változót folytonosnak nevezünk, ha az Fξ : ℝ → [0,1] eloszlásfüggvénye folytonos (vö. Obádovics 1997: 66).

A valószínűségi változók jellemzésére meghatározott jellemzőket fogunk használni, például
– a valószínűségi változó várható értéke az az érték, amely körül feltételezésünk szerint nagy számú kísérletet elvégezve a valségi változó értéke ingadozni fog;
– a valószínűségi változó szórása pedig az az érték, amely körül feltételezésünk szerint nagy számú kísérletet elvégezve a valségi változó értékének a várható értéktől való eltérése (abszolút értékben) ingadozni fog.

Ha a ξ : Ω → { x1, x2, ..., xk, ... } valószínűségi változó diszkrét, akkor a {pi=P(ξ=xi) | i=1,2,...} számsorozat adja a ξ valségi változó eloszlását, amelynek segítségével definiálhatjuk a ξ változó jellemzőit (pl. várható értékét, szórásnégyzetét stb.). Egy diszkrét valségi változó eloszlása például hisztogram segítségével ábrázolható (pl. úgy, hogy a valségi változó lehetséges értékeit felvesszük az 'x' tengelyen, és az egyes értékek felett az értékek valószínűségeivel azonos (vagy arányos) magasságú téglalapokat rajzolunk).
Ha a ξ : Ω → ℝ valószínűségi változó Fξ : ℝ → [0,1] eloszlásfüggvénye folytonos, és (véges számú hely kivételével) differenciálható, akkor az f(x)=F'(x) deriváltfüggvényt a ξ valségi változó sűrűségfüggvényének nevezzük. A sűrűségfüggvény segítségével definiálhatjuk egy ξ folytonos valségi változó meghatározott jellemzőit (például várható értékét, szórásnégyzetét stb.). A folytonos valségi változókat, ha létezik a sűrűségfüggvényük, rendszerint nem az eloszlásfüggvényükkel, hanem a sűrűségfüggvényükkel definiáljuk.


Diszkrét valószínűségi változók

eloszlás, eloszlásfüggvény

Legyen ξ : Ω → { x1, x2, ..., xk, ... } diszkrét valségi változó. A ξ diszkrét valségi változó eloszlása alatt a

{ p1=P(ξ=x1), p2=P(ξ=x2), ..., pk=P(ξ=xk), ... }

számsorozatot értjük. Mivel az ωi={ ξ=xi } események diszjunktak, és
    Σi ωi
teljesül, az eloszlásértékek összege 1, azaz
    Σi pi=p1+p2+...+pk+...=1
teljesül.

Például ha három kockával dobunk, akkor az eseménytér
    Ω={(i,j,k) | 1≤i,j,k≤6}.
Ezen az eseménytéren definiálhatjuk a ξ : Ω→{3,4,...,18} diszkrét valségi változót
    ξ(i,j,k)=i+j+k
módon. Az elemi események száma, azaz összes lehetséges eset n=6*6*6=216. A definíció alapján például
    P(ξ=3)=1/n,
    P(ξ=4)=3/n (ugyanis az (1,1,2), (1,2,1) és (2,1,1) elemi események adják a kedvező eseteket),
    stb.

Ábrázoljuk a ξ valségi változó eloszlásának a hisztogramját. A diagram vízszintes tengelyén a valségi változó értékkészletének az elemeit, a függőleges tengelyen pedig az egyes értékek gyakoriságát ábrázoljuk. (Jegyezzük meg, hogy ha a függőleges tengelyen 1-re normáljuk a gyakoriságértékeket, azaz a ξ valségi változó lehetséges értékeinek valószínűségeit ábrázoljuk, akkor a ξ valségi változó sűrűségfüggvényét kapjuk. Ebben az esetben a diagram területe 1 lesz.)

három kockadobás eloszlásának hisztogramja
Forrás: Statisztika egyszerűen (2021-03-14)

Egy diszkrét valségi változó eloszlásfüggvényének szemléltetésére tekintsük például a kockadobást. Legyen a ξ valségi változó értéke a kockadobással kapott érték. Világos, hogy ξ : Ω → { 1, 2, 3, 4, 5, 6 } diszkrét valségi változó, amelynek eloszlása { p1=1/6, p2=1/6, ..., p6=1/6 }, eloszlásfüggvénye és grafikonja pedig a következő:

x Fξ(x)
x≤1 P(ξ<x)=0
1<x≤2 P(ξ<x)=1/6
2<x≤3 P(ξ<x)=2/6
3<x≤4 P(ξ<x)=3/6
4<x≤5 P(ξ<x)=4/6
5<x≤6 P(ξ<x)=5/6
6<x P(ξ<x)=1
diszkrét eloszlásfüggvény grafikonja

A táblázatból látszik, hogy a ξ diszkrét valségi változó eloszlásfüggvénye lépcsős függvény, amelynek a ξ valségi változó értékei mellett nem megszüntethető szakadása van. Az eloszlásfüggvény szakadási pontjaiban a függvény ugrásának nagysága megegyezik a ξ valószínűségi változó eloszlásának értékével az adott pontban, azaz
    P(ξ=xi)=F(xi+Δx)−F(xi) (0<Δx≪1, x1=1, x2=2, ..., x6=6),
ami megegyezik annak a valségével, hogy xi értéket dobunk. Annak a valsége pedig, hogy 3-nál kisebbet dobunk, az eloszlásfüggvény ismeretében P(ξ<3)=Fξ(3)=2/6 módon számítható ki.

Egy másik példa lehet a ξA indikátorváltozó eloszlásfüggvénye:

x FξA(x)
x≤0 P(ξA<x)=0
0<x≤1 P(ξA<x)=P(A)=1−P(A)
1<x P(ξA<x)=1

A fentieket általánosan is megfogalmazhatjuk. Legyen ξ : Ω → { x1, x2, ..., xk, ... } diszkrét valségi változó, amelynek eloszlása { p1, p2, ..., pk, ... }, ahol pi=P(ξ=xi) (i∈ℕ). Mivel a { ξ=x | x∈Rng(ξ) } események teljes eseményrendszert alkotnak, a ξ változó eloszlásfüggvényére

Fξ(x) = 
 
Σ
xi<x
P(ξ=xi) = 
 
Σ
xi<x
pi
teljesül. Vegyük észre, hogy az eloszlásfüggvény értékét az x∈ℝ pontban úgy kapjuk meg, hogy az összes olyan pi=P(ξ=xi) eloszlásértéket összegezzük, amelyre xi<x teljesül.

Például a ξA indikátorváltozó eloszlása az {x1=0, x2=1} függvényértékek mellett {p1=1−P(A), p2=P(A)}, tehát az FξA(x) eloszlásfüggvény értéke például az x=1 pontban
    FξA(1)= P(ξA<1)= p1= 1−P(A)
mivel egyedül az x1 értékre teljesül az x1<1 feltétel.


várható érték

Legyen ξ : Ω → { x1, x2, ..., xk, ... } diszkrét valségi változó, amelynek eloszlása { p1, p2, ..., pk, ... }. Ekkor a ξ változó várható értéke

M(ξ) = 
Σ
i=1
xi*pi

Megszámlálhatóan végtelen értékkészlet esetén csak akkor beszélhetünk a ξ valségi változó várható értékéről, ha a fenti összeg létezik (ti. a részletösszegekből álló sorozat konvergens).

Egy diszkrét valségi változó várható értékének szemléltetésére tekintsük ismét a kockadobást. Mivel ekkor a ξ valségi változó értéke a kockadobással kapott érték, a ξ : Ω → { 1, 2, 3, 4, 5, 6 } diszkrét valségi változó eloszlása { p1=1/6, p2=1/6, ..., p6=1/6 }. A várható érték ennek alapján
    M(ξ) = (1/6 + 2/6 + 3/6 + 4/6 + 5/6 + 6/6) = 3.5
módon számítható ki. (Hipotézisünk az, hogy elegendően sok kockadobást elvégezve a ξ valségi változó értékei az így kiszámolt érték körül ingadoznak.)

Egy másik példaként számítsuk ki a ξA indikátorváltozó várható értékét. Ha p=P(A), akkor definíció szerint
    M(ξA) = 1*p + 0*(1−p) = p
vagyis a ξA indikátorváltozó várható értéke éppen az 'A' esemény valószínűsége.

Legyenek ξ : Ω → { x1, x2, ..., xk, ... } és η : Ω → { x1, x2, ..., xk, ... } diszkrét valségi változók, amelyek várható értéke M(ξ) és M(η). Ekkor teljesülnek az alábbiak:

(1) Ha ξ=c (azaz ξ konstans, vagyis xi=c minden i∈ℕ esetén), akkor M(ξ)=c teljesül.

(2) Ha c∈ℝ tetszőleges valós szám, akkor M(c*ξ)=c*M(ξ) teljesül.

(3) M(ξ+η)=M(ξ)+M(η); (additivitás)

(4) Ha ξ és η független valségi változók, akkor M(ξ*η)=M(ξ)*M(η) teljesül.

Például modellezzük az 'n' elemű visszatevéses mintavételt egy
    ξ=ξA,1A,1+...+ξA,n
valségi változóval, ahol a ξA,i valségi változók az 'A' esemény (a selejtes termék választásának) indikátorváltozói az i-dik termék választása esetén (i=1,2,...,n). Ekkor M(ξA,i)=p (i=1,2,...,n) és a várható érték additivitása miatt M(ξ)=n*p teljesül.


szórás, szórásnégyzet

Legyen ξ : Ω → { x1, x2, ..., xk, ... } diszkrét valségi változó, amelynek várható értéke m=M(ξ). Ekkor a ξ valségi változó szórásnégyzete a (ξ−m)2 valségi változó várható értéke, azaz D2(ξ) = M((ξ−m)2). A várható érték definíciója alapján a szórásnégyzet

D2(ξ) = 
Σ
i=1
(xi−m)2*pi
módon számítható ki.

Megszámlálhatóan végtelen értékkészlet esetén csak akkor beszélhetünk a ξ valségi változó szórásnégyzetéről, ha a fenti összeg létezik (azaz a részletösszegekből álló sorozat konvergens).

Egy diszkrét valségi változó szórásnégyzetének szemléltetésére tekintsük ismét a kockadobást. Mivel ekkor a ξ valségi változó értéke a kockadobással kapott érték, a ξ : Ω → { 1, 2, 3, 4, 5, 6 } diszkrét valségi változó eloszlása { p1=1/6, p2=1/6, ..., p6=1/6 }. A szórásnégyzet a várható érték ismeretében (M(ξ)=m=3.5)
    D2(ξ) = (1−3.5)2*1/6 + (2−3.5)2*1/6 + (3−3.5)2*1/6 + (4−3.5)2*1/6 + (5−3.5)2*1/6 + (6−3.5)2*1/6 ≈ 2.92
módon számítható ki. (Hipotézisünk az, hogy elegendően sok kockadobást elvégezve a ξ valségi változó értékeinek a várható értéktől való (abszolút értékben vett) eltérései a D(ξ) ≈ 1.71 érték körül ingadoznak.)

Kockadobás esetén a ξ valségi változó várható értékét és szórásnégyzetét például az alábbi JavaScript programmal számíthatjuk ki:

/* kockadobás várható értéke és szórásnégyzete */

var sum=0;
for(var i=1;i<=6;i++) {
 sum+=i*(1/6);
 }

var m=sum;

writeln("a kockadobás várható értéke: "+m);
writeln();

sum=0;
for(var i=1;i<=6;i++) {
 sum+=i*i*(1/6);
 }

var m2=sum;

writeln("a kockadobás négyzetének várható értéke: "+m2);
writeln();

sum=0;
for(var i=1;i<=6;i++) {
 sum+=(m-i)*(m-i)*(1/6);
 }

var d2=sum;

writeln("a kockadobás szórásnégyzete: "+d2);
writeln();

writeln("-----");

Egy másik példaként számítsuk ki a ξA indikátorváltozó szórásnégyzetét. Korábban láttuk, hogy p=P(A) jelölés mellett az indikátorváltozó várható értékére m=M(ξA)=p teljesül, ezért a szórásnégyzet
    D2A) = (1−p)2*p + (0−p)2*(1−p) = p*(1−p) = p*q
módon számítható ki (q=1−p jelöléssel). Jegyezzük meg, hogy a szórásnégyzet p=q=0.5 esetén maximális (ekkor D2A)=1/4).

Legyen ξ : Ω → { x1, x2, ..., xk, ... } diszkrét valségi változó, amelynek várható értéke m=M(ξ). Ekkor teljesülnek az alábbiak:

(1) D2(ξ) = M(ξ2)−M2(ξ) = M(ξ2)−m2.

   (1.1) Mivel D2(ξ)≥0, ezért (1)-ből M(ξ2) ≥ M2(ξ) következik.

(2) Ha ξ=c (azaz ξ konstans), akkor D2(ξ) = 0 teljesül.

(3) Ha c∈ℝ tetszőleges szám, akkor, akkor D2(c*ξ) = c2*D2(ξ) teljesül.

Például (1) alapján a kockadobás szórásnégyzete M(ξ)=m=3.5 és
    M(ξ2) = (1*1)/6 + (2*2)/6 + (3*3)/6 + (4*4)/6 + (5*5)/6 + (6*6)/6 ≈ 15.17 miatt
    D2(ξ) ≈ 15.17 − 3.52 = 15.17 − 12.25 ≈ 2.92
módon számítható ki.

Legyenek ξ : Ω → { x1, x2, ..., xk, ... } és η : Ω → { x1, x2, ..., xk, ... } diszkrét és független valségi változók, amelyek szórásnégyzete D2(ξ) és D2(η). Ekkor D2(ξ+η)=D2(ξ)+D2(η) teljesül.


Kockadobások modellezése (alapértelmezés: 100 dobásból álló sorozatok végrehajtása 100-szor)

x tengely: kockadobások értéke: [1...6]
y tengely: kockadobások relatív gyakorisága: [0,1]

kék és piros vonások: egy dobás esetén a várható értéktől (3.5) való várható eltérés (szórás vagy "hiba") "elméleti" értéke (±1.71)

szürke pontsorok: az egyes dobások relatív gyakoriságai az egyes sorozatokban

piros pontok (zöld színnel összekötve): az egyes sorozatok empirikus várható értékeinek gyakorisága (1-re normálva)

a sorozatok várható értékének átlaga és hibája 100 dobás esetén:

Megjegyzés: a sorozatok átlagos várható értékének a hibája csak 1 dobásból álló sorozatok esetén közelíti meg a szórás "elméleti" értékét. Minél több dobásból áll egy sorozat, a várható érték hibájának az értéke egyre kisebb lesz.

kockadobások száma sorozatonként:

szimuláció újrakezdése:

Egy ξ valségi változó értékét nem tudjuk előre pontosan megmondani, mivel az a "véletlentől függ". Azonban elméletileg
– egy 'n' elemű mintavétel során ξ értéke az M(ξ) várható érték körül ingadozik;
– a ξ valségi változó értékének az M(ξ) várható értéktől való eltérése, azaz az |ξ−M(ξ)| érték (szemléletesen kifejezve a mintavétel során megfigyelt értékek "hibája") a D(ξ) szórás körül ingadozik.

A gyakorlatban (például egy 'n' elemből álló méréssorozat kiértékelésekor) általában feltételezzük, hogy a mintavételek ("mérések") során kapott ξi értékekre elegendően "nagy valószínűséggel"
    ξi∈(M(ξ)−D(ξ),M(ξ)+D(ξ))
teljesül (i=1,2,...,n), vagy másképpen megfogalmazva
    ξi=ξ±Δ
ahol ξ≈M(ξ) a mért eredmények középértéke (átlaga), és Δ≈D(ξ) a mérés hibája.

Egy 'n' elemű mintavétel esetén az M(ξ) várható értéket a mintavétel során megfigyelt ξ1, ξ2, ..., ξn értékek
    ξ=(ξ12+...+ξn)/n
empirikus középértékével, a D(ξ) szórást ("hibát") pedig az
    S2(ξ)=[(ξ1ξ)2+(ξ2ξ)2+...+(ξnξ)2]/n
módon kiszámítható empirikus szórásnégyzet négyzetgyökével közelíthetjük.


kovariancia, korreláció

Legyenek ξ : Ω → {x1, x2, ..., xn} és η : Ω → {y1, y2, ..., ym} diszkrét, véges értékkészletű valségi változók, amelyek várható értéke M(ξ) és M(η), továbbá szórásnégyzete D2(ξ) és D2(η), eloszlásuk pedig
    pi=P(ξ=xi) (1≤i≤n, i∈ℕ)
és
    qj=P(η=yi) (1≤j≤n, j∈ℕ).

Legyenek továbbá a
    pij=P(ξ=xi, η=yj) (1≤i≤n, 1≤j≤m, i,j∈ℕ)
értékek az
    {ω∈Ω | ξ(ω)=xi}*{ω∈Ω | η(ω)=yj}
események előfordulásának valószínűségei (1≤i≤n, 1≤j≤m, i,j∈ℕ).

Vezessük be a következő jelöléseket:

(1) A ξ és η valségi változók peremeloszlásának nevezzük a
    wξ : {x1, x2, ..., xn} → {pi | 1≤i≤n, i∈ℕ}
    wξ(xi)=pi (1≤i≤n, i∈ℕ)
és a
    wη : {y1, y2, ..., ym} → {qj | 1≤j≤m, i∈ℕ}
    wη(yj)=qj (1≤j≤m, j∈ℕ)
függvényeket.

(2) A ξ és η valségi változók együttes eloszlásának nevezzük a
    wξη : {x1, x2, ..., xn}Χ{y1, y2, ..., ym} → {pij | 1≤i≤n, 1≤j≤m, i,j∈ℕ}
    wξη(xi,yj)=pij (1≤i≤n, 1≤j≤m, i,j∈ℕ)
függvényt.

ξ és η valségi változók wξη együttes eloszlásának ismeretében a peremeloszlások meghatározhatók:

wξ(xi) = Σ(j=1;j≤m;j→j+1)wξη(xi,yj)

wη(yj) = Σ(i=1;i≤n;i→i+1)wξη(xi,yj)

A ξ és η valségi változók sztochasztikus kapcsolatának jellemzésére vezessük be a ξ és η valségi változók kovarianciáját és korrelációs együtthatóját.

(3) A ξ és η valségi változók kovarianciája a

Cov(ξ,η) = M[(ξ−M(ξ))*(η−M(η))] = M(ξ*η)−M(ξ)*M(η)

érték, amelyet a wξη(x,y) együttes eloszlás ismeretében

Cov(ξ,η) = 
 
Σ
i, j
xi*yj*wξη(xi,yj) − M(ξ)*M(η)
módon számíthatunk ki.

(4) A ξ és η valségi változók korrelációs együtthatója az

R(ξ,η) = Cov(ξ,η)/[D(ξ)*D(η)] = [M(ξ*η)−M(ξ)*M(η)]/[D(ξ)*D(η)]

érték.

Ha a ξ és η valségi változók függetlenek, akkor Cov(ξ,η) = 0 és R(ξ,η) = 0 teljesül. Azonban

Ha ξ és η valségi változók függetlenek, akkor az együttes eloszlásra wξη(xi,yj) = wξ(xi)*wη(yj) (1≤i≤n, 1≤j≤m) teljesül.

Ha a ξ és η valségi változók korrelációs együtthatójára R(ξ,η)=±1 teljesül, akkor a valószínűségi változók között lineáris függvénykapcsolat van, azaz
    ξ=a*η+b (a, b∈ℝ)
teljesül. (Mj.: a függetlenség "ellentéte", ha két változó között meghatározott függvénykapcsolat van.)


Tekintsük az alábbi példát (Obádovics 1997: 63-64)

ξ ↓ / η → y1=4 y2=10 Σ(sorok)
x1=2 wξη(x1,y1)=0 wξη(x1,y2)=0.5 wξ(x1)=0.5
x2=6 wξη(x2,y1)=0.5 wξη(x2,y2)=0 wξ(x2)=0.5
Σ(oszlopok) wη(y1)=0.5 wη(y2)=0.5

A ξ és η valségi változók várható értéke:
    M(ξ)=2*0.5+6*0.5=4
    M(η)=4*0.5+10*0.5=7

A ξ és η valségi változók szórásnégyzete:
    D2(ξ)=(2-4)2*0.5+(6-4)2*0.5=4 ⇒ D(ξ)=2
    D2(η)=(4-7)2*0.5+(10-7)2*0.5=9 ⇒ D(η)=3

A ξ és η valségi változók kovarianciája:

Cov(ξ,η)=(2*4*0+2*10*0.5+6*4*0.5+6*10*0)-(4*7)=22-28=-6

A ξ és η valségi változók korrelációs együtthatója:

R(ξ,η)=(-6)/(2*3)=-1

Mivel a ξ és η valségi változók korrelációs együtthatója −1, ezért a valségi változók közt lineáris kapcsolat áll fenn. Ennek alakja:

η=1.5*ξ+1

(Ellenőrzés: 1.5*2+1=3+1=4 és 1.5*6+1=9+1=10 teljesül.)


Valószínűségeloszlások

Binomiális eloszlás

A korábban említett példa visszatevéses mintavételre a következő volt: legyen N darab termékünk, és legyen ezek között 's' darab selejt. Vegyünk ki a termékekből egymás után 'n' darabot, és a kivett terméket minden alkalommal tegyük is vissza. Határozzuk meg annak a valségét, hogy ezek között k≤s darab selejt lesz.

Adjuk meg a ξ : Ω → {0, 1, ..., n}⊆ℕ valségi változóval a teljes (n elemű) mintában levő selejtek darabszámát (általánosan fogalmazva a mintavétel során vizsgált, "kedvező" esetek gyakoriságát). Jelöljük egy mintavétel során egy selejt kiválasztásának valségét (a "selejtarányt") p=s/N módon, és egy nem selejtes termék kiválasztásának valségét q=1−p módon. Ekkor az ún. binomiális eloszláshoz jutunk:

P(ξ=k)  =
( n ) pk (1−p)n−k
k
=
( n ) pk qn−k
k

Általánosítsuk a binomiális eloszláshoz vezető feladatot:

klasszikus valószínűségi mezőt tételezünk fel;
– egy 'n' elemű mintavétel során két kimenetel, A és B=A lehetséges, pA=p és pB=1−p=q valséggel;
– egy mintavétel nem befolyásolja a többi mintavételt: a mintavételek egymástól függetlenek és "visszatevéses" mintavétel történik (megjegyzés: ha pl. tőlünk független tömegjelenségeket figyelünk meg, ezt rendszerint feltételezzük);
– 'n' darab mintát veszünk, és keressük az A kimenetel (a "kedvező esetek") gyakoriságát (ξ) és az A esemény k-szor történő előfordulásának P(ξ=k) valségét, azaz a ξ diszkrét valségi változó eloszlását (k=0,1,...,n).

Legyen ξ : Ω → {0, 1, ..., n}⊆ℕ binomiális eloszlású valségi változó, amely az 'n' elemű mintavétel során a "kedvező" esetek gyakoriságát adja meg. Ekkor teljesülnek az alábbiak:

(1) A { ξ=k } események teljes eseményrendszert alkotnak (0≤k≤n).

(2) M(ξ) = n*p teljesül, vagyis a binomiális eloszlású ξ valségi változó esetén a "kedvező" eseteknek, azaz a 'p' valségű 'A' esemény bekövetkezéseinek ξ gyakorisága 'n' kísérlet során n*p körül, a "kedvező" esetek η=ξ/n relatív gyakorisága pedig a megfigyelt 'A' esemény pA=p valószínűsége körül ingadozik.

A fenti összefüggés abból is következik, hogy az egyes mintavételeket függetlennek tekintjük, és ha ξiA,i jelöli az 'A' esemény indikátorváltozóját az i-dik mintavétel során, akkor az 'A' bekövetkezéseinek gyakoriságát megadó ξ valségi változó ξ=ξ12+...+ξn módon állítható elő, ahol M(ξi)=M(ξA,i)=p, (i=1,2,...,n) teljesül.

(3) D2(ξ) = n*p*q teljesül.

A ξ valségi változó az 'A' esemény bekövetkezésének gyakoriságát adja meg 'n' elemű mintavétel esetén. Mivel egy mintavétel esetén az 'A' esemény bekövetkezését a ξA indikátorváltozó adja meg, 'n' elemű mintavétel esetén a ξA indikátorváltozó empirikus középértékének várható értékét és szórásnégyzetét
    M(ξA)=M[(ξ12+...+ξn)/n]=M(ξ/n)=M(ξ)/n=n*p/n=p és
    D2(ξA)=D2[(ξ12+...+ξn)/n]=D2(ξ)/n2=(n*p*q)/n2=p*q/n
módon számíthatjuk ki, ξA empirikus szórásnégyzetének várható értékét pedig
    M(S2A))= M{[(ξ1ξA)2+(ξ2ξA)2+... +(ξnξA)2]/n}= ... = (n−1)*p*q/n
módon (elegendően nagy 'n' esetén M(S2A))≈ p*q). Jegyezzük meg, hogy a korrigált empirikus szórásnégyzet várható értékére pontosan
    M(Sk2A))= p*q
adódik (bármilyen 'n' esetén).

A szórásnégyzet értéke abból következik, hogy
(1) tetszőleges i=1,2,...,n esetén M(ξi)=p és D2i)=p*q, valamint D2i)= M(ξi2)−M2i)= M(ξi2)−p2 és
(2) M(ξA)=p és D2(ξA)=p*q/n, valamint D2(ξA)= M(ξA2)−M2A)= M(ξA2)−p2 teljesül.
Tehát egyrészt
    M(ξi2)=p*q+p2,
másrészt
    M(ξA2)=p*q/n+p2
teljesül. Emellett
(3) tetszőleges i=1,2,...,n esetén M(ξi*ξA)= M[ξi*(ξ12+ ... +ξn)/n]= M[(ξi1i2+ ... +ξii+ ... +ξin)/n]= [M(ξi)*M(ξ1)+M(ξi)*M(ξ2)+ ... +M(ξi2)+ ... +M(ξi)*M(ξn)]/n= [(n−1)*p2+p*q+p2]/n= (n*p2+p*q)/n= p2+p*q/n teljesül. Vagyis
    M(ξi*ξA)=p2+p*q/n
teljesül. Ezeket behelyettesítve tetszőleges i-re (i=1,2,...,n) esetén
    M[(ξiξA)2]= M(ξi2−2*ξi*ξA+ξA2)= M(ξi2)−2*M(ξi*ξA)+M(ξA2)= p*q+p2−2*[p2+p*q/n]+p*q/n+p2= p*q−p*q/n= (n−1)*p*q/n
teljesül.

(4) D2(ξ) ≤ n/4 teljesül. (Mivel a másodfokú p*q=p*(1−p)=−p2+p függvény akkor a legnagyobb, ha p=0.5 és q=(1−p)=0.5, ezért D2(ξ)≤n*0.52=n/4 teljesül.)

A Weldon-féle kockadobási kísérlet a következő (Feller 1978: 150-151): Egy kísérlet során 12-szer dobunk egy kockával (vagyis n=12 elemű mintavétel történik), és vizsgáljuk, hányszor dobtunk ötöst vagy hatost. Vagyis az eseménytér Ω=Ω12x...xΩ12, ahol Ωi={ωi1, ωi2, ..., ωi6} az i-dik dobás eredménye (i=1,2,...,12). Világos, hogy az elemi események (ω1,j12,j2,...,ω12,j12) alakúak (ahol ωi,j azt jelenti, hogy az i-dik dobáskor j-t dobtunk).
Vezessük be a ξ:Ω→{0,1,...,12} valségi változót, amely azt adja meg, hogy egy 12 dobásos kísérlet (mintavétel) során hányszor fordultak elő a "jó esetek" (A), azaz hányszor dobtunk ötöst vagy hatost. Az 'A' esemény elméleti valsége egy dobáskor p=1/3, és egy szabályos ("nem cinkelt") kockával dobva a ξ valségi változóra binomiális eloszlást tételezhetünk fel.
A ξ valségi változó kifejezhető az 'A' esemény i-dik dobásra vonatkozó ξA,i (i=1,2,...,12) egymástól független indikátorváltozóinak segítségével ξ=ξA,1A,2+...+ξA,12 módon.
Az eredeti Weldon-féle kísérletet ("kézzel") 26306-szor hajtották végre. Modellezzük most ezt a kísérletet számítógéppel és adjuk meg egy táblázatban az 'A' esemény előfordulásának megfigyelt gyakoriságait, valamint a binomiális eloszlásból következő "elméleti" valószínűségeket (azaz a binomiális eloszlású ξ valségi változó k=0, k=1, ..., k=12 értékeinek valségét n=12, p=1/3, q=2/3 paraméterekkel).



A táblázat magyarázata:
– 'k' értéke azt adja meg, hogy egy n=12 dobásos kísérletben hányszor fordult elő a p=1/3 valségű 'A' esemény (azaz esetünkben az 5-ös vagy 6-os dobásnak megfelelő "jó esetek");
– az elméleti valószínűség (B) oszlopban a binomiális eloszlás P(ξ=k) valószínűségei szerepelnek n=12 és p=1/3, q=2/3 paraméterek mellett;
– a relatív gyakoriság (R) oszlopban az 'A' esemény 'k'-szori előfordulásának "megfigyelt" relatív gyakorisága szerepel (26306 kísérlet mellett);
– az utolsó, |B−R| oszlopban pedig az "elméleti" valószínűségek és a kapott relatív gyakoriságok abszolút értékben vett eltérése szerepel.

A táblázatban rózsaszínnel kiemeltük azt a sort, amely egy kísérlet során az elméletileg legvalószínűbb k=4 értékhez tartozik (ekkor P(ξ=4)≈0.2384). A k=4 gyakorisághoz tartozó sor alatt és felett világosabb színnel kiemeltük azokat a sorokat (k=3 és k=5, ill. k=2 és k=6), amelyek a kísérletek eredményeinek "szórása" miatt még várhatóan viszonylag nagyobb gyakorisággal elő fognak fordulni (n=12 és p=1/3 mellett a "jó" esetek száma M(ξ)=n*p=4 körül ingadozik D2(ξ)=n*p*q≈2.667 ⇒ D(ξ)≈1,633 átlagos hibával).

Az 'A' esemény bekövetkezésének "elméletileg" legvalószínűbb gyakoriságát egy kísérlet során a ξ valségi változó M(ξ)=4 várható értéke adja meg. Az ehhez az értékhez tartozó relatív gyakoriságot egy kísérlet során M(ξ)/n=4/12=1/3 módon számíthatjuk ki, amely az indikátorváltozók tulajdonságaiból következő P(A)=M(ξA,i) (i=1,2,...,12) miatt, továbbá az egyes dobásokhoz tartozó ξA,i indikátorváltozók függetlenségéből következő M(ξ)=M(ξA,1)+M(ξA,2)+...+M(ξA,12)=n*P(A) miatt megegyezik az 'A' esemény P(A)=1/3 valószínűségével.

Ha ξi-vel jelöljük azokat a valségi változókat, amelyek egy adott n=12 dobásos kísérletben megadják a "jó esetek", azaz az 'A' esemény gyakoriságát (ahol ξi∈{0,1,...,12}, i=1,2,...,26306), akkor az egyes kísérletek során megfigyelt ("empirikus") gyakoriságok átlagát a teljes Weldon-féle kockadobási kísérletben a
    ξ=(ξ12+...+ξ26306)/26306
empirikus várható érték kiszámításával kaphatjuk meg. Ennek megfelelően az 'A' esemény (átlagos) empirikus relatív gyakoriságát egy kísérlet során ξ/n módon számíthatjuk ki (ahol n=12). Az egyes kísérletek során kapott ξi gyakorisági értékeket a fenti tört számlálójában csoportosíthatjuk a gyakoriságok aktuális értéke szerint. Ha ηk jelöli azoknak a ξi gyakoriságoknak a számát, amelyekre ξi=k teljesül (k=0,1,...,n), akkor a fenti összefüggés
    ξ=(η0*0+η1*1+η2*2+...+ηn*n)/26306
módon is felírható (ahol n=12). A táblázat harmadik oszlopában az R=ηk/26306 értékeket ábrázoltuk (k=0,1,...,n).

Jegyezzük meg végül, hogy a ξ valségi változó megfigyelésével kapott átlagos (empirikus) gyakorisági értéknek a megfigyelések során tapasztalt (átlagos) hibáját az
    S2(ξ)=((ξ1ξ)2+(ξ2ξ)2+...+(ξ26306ξ)2)/26306
empirikus szórásnégyzet kiszámításával kaphatnánk meg (ez azonban a táblázatban nem szerepel).


Hipergeometrikus eloszlás

A korábban említett példa visszatevés nélküli mintavételre a következő volt: legyen N darab termékünk, és legyen ezek között s darab selejt. Vegyünk a termékekből egy n elemű mintát (egyszerre vagy egymás után, de visszatevés nélkül), és határozzuk meg annak a valségét, hogy ezek között k≤s darab selejt lesz.

Adjuk meg a ξ : Ω → {0, 1, ..., n}⊆ℕ valségi változóval a teljes (n elemű) mintában levő selejtek darabszámát. Tételezzük fel továbbá, hogy N (azonos valséggel kiválasztható) termékünk van, és ebben s darab selejt található (1≤s≤N, 1≤n≤N). Ekkor az ún. hipergeometrikus eloszláshoz jutunk:

P(ξ=k)
( s ) ( N−s )
k n−k
( N )
n

Általánosítva a hipergeometrikus eloszláshoz vezető feladatot:
klasszikus valószínűségi mezőt tételezünk fel;
– egy n elemű mintavétel során két kimenetel, A és B lehetséges;
– N termék között s darab A típusú és (N−s) darab B típusú termék található, így az A és B termék kiválasztásának valsége az első mintavétel során pA=p=s/N és qB=1−p=q;
– a mintavételek nem függetlenek, minden mintavétel befolyásolja a további mintavételeket, mert egy termék kiválasztásával a még választható termékek száma eggyel csökken ("visszatevés nélküli" mintavétel történik);
– n darab mintát veszünk, és keressük az A kimenetel gyakoriságát (ξ), valamint az A esemény k-szor történő előfordulásának P(ξ=k) valségét (k=0,1,...,n).

Legyen ξ : Ω → {0, 1, ..., n}⊆ℕ hipergeometrikus eloszlású valségi változó. Ekkor
(1) a { ξ=k } események teljes eseményrendszert alkotnak (0≤k≤n);
(2) M(ξ) = n*p (a hipergeometrikus eloszlás várható értéke megegyezik a binomiális eloszlás várható értékével);
(3) D2(ξ) = n*p*q*[1 − (n−1)/(N−1)];
(4) ha n<<N, akkor a hipergeometrikus eloszlás szórásnégyzete közelítőleg megegyezik a binomiális eloszlás szórásnégyzetével (ebben az esetben a hipergeometrikus eloszlást közelíthetjük a binomiális eloszlás segítségével).

Poisson-eloszlás

Legyen ξ : Ω → {0, 1, 2, ..., ∞}=ℕ valségi változó, λ>0 pozitív valós szám. Ekkor az ún. λ paraméterű Poisson eloszlást a következőképpen definiáljuk:

P(ξ=k) λk e−λ
k!

A Poisson-eloszlás "a diszkrét valószínűségeloszlások közül [...] a legfontosabb". Az eloszlást "a kis valószínűségű, vagyis ritka események eloszlástörvényének is nevezik" (Reimann-Tóth 1985: 85).

Legyen ξ : Ω → {0, 1, 2, ..., ∞}=ℕ Poisson-eloszlású valségi változó λ>0 paraméterrel. Ekkor
(1) a { ξ=k } események teljes eseményrendszert alkotnak (k∈ℕ);
(2) M(ξ) = λ (mivel a Poisson-eloszlás várható értéke megegyezik a λ paraméter értékével, a várható értékre vonatkozó becsléssel a λ paraméter statisztikailag megbecsülhető);
(3) D2(ξ) = λ;
(4) ha n→∞ p→0 és n*p=c∈ℝ állandó, akkor

lim   n→∞ ( n ) pk qn−k (np)k e−np
k k!
teljesül. (Nagy minták, azaz n≫0 esetén a binomiális eloszlást közelíthetjük λ=n*p paraméterű Poisson-eloszlás segítségével.)

Egyenletes eloszlás (diszkrét)

Legyen ξ : Ω → {x1, x2, ..., xn}⊆ℝ diszkrét valségi változó, n≥1 természetes szám. Ekkor az ún. egyenletes eloszlást a következőképpen definiáljuk:

P(ξ=xk) 1
n

Általánosítva az egyenletes eloszláshoz vezető feladatot:
– az eseménytér (az elemi események száma) véges;
– minden elemi esemény azonosan valószínű (azaz alkalmazható a valószínűség klasszikus kiszámítási módja).

Legyen ξ : Ω → {x1, x2, ..., xn}⊆ℝ egyenletes eloszlású valségi változó. Ekkor
(1) a { ξ=xk } események teljes eseményrendszert alkotnak (1≤k≤n);
(2) a ξ egyenletes eloszlású valségi változó várható értéke

M(ξ) =  1
n
Σ
i=1
xi
n
(3) a ξ egyenletes eloszlású valségi változó szórásnégyzete
D2(ξ) =  1
n
Σ
i=1
xi2  −m2
n
ahol m=M(ξ) a ξ valségi változó várható értékét jelöli.

Normális eloszlás

Legyen ξ : Ω → ℝ folytonos valségi változó, m∈ℝ tetszőleges valós szám, σ∈ℝ, σ>0 pozitív valós szám. Ekkor az ún. normális eloszlást a következő sűrűségfüggvénnyel definiálhatjuk:

a Gauss-eloszlásfüggvény képlete

Az 'm' paramétert a normális eloszlás várható értéke, és a 'σ' paraméter a normális eloszlás szórása. Ha m=0 és σ=1, akkor ún. standard normális eloszlásról szokás beszélni. A standard normális eloszlás sűrűségfüggvényét φ(x), eloszlásfüggvényét pedig Φ(x) módon jelöljük.

A standard normális eloszlás eloszlásfüggvénye nem fejezhető ki elemi függvények segítségével, ezért táblázatos formában szokás megadni. Ennek a táblázatnak egy részlete:

a standard normális eloszlás táblázata (részlet)

A Φ függvény értéke közelítőleg számítógéppel is kiszámítható. Például az alábbi weboldalon

    JavaScript - Normal Distribution Function

a megfelelő 'x' érték beírása után (m=0, σ=1 mellett) a "Calculate" gombra kattintva megkapjuk a Φ(x) függvény közelítő értékét ("Normal Probability").

Az 'm' és 'σ' paraméterű normális eloszlás eloszlásfüggvényét a standard normális eloszlás eloszlásfüggvényéből

    F(x)=Φ((x−m)/σ)

módon kaphatjuk meg. (Például a táblázatból Φ(1.34)≈0.9099, ebből az m=1, σ=0.5 paraméterű normális eloszlás esetén az eloszlásfüggvény értékére 1.34*σ+m=1.67 miatt F(1.67)≈0.9099 adódik.)

A normális eloszlás két fontos tulajdonsága:

(1) A binomiális eloszlás nagy 'n' és nem túl kis 'p' és 'q' (azaz "sem a 'p', sem a 'q' nem esik közel a 0-hoz", vö. Obádovics 1997: 91) esetén jól közelíthető az m=n*p várható értékű és σ2=n*p*q szórású normális eloszlással:

lim   n→∞ ( n ) pk qn−k = Φ ( x−n*p )
k n*p*q

(2) Legyenek ξi : Ω → ℝ (1≤i≤n) azonos eloszlású, m∈ℝ várható értékű és σ∈ℝ, σ>0 szórású, független valségi változók. Ezekre teljesül, hogy

lim   n→∞ P ( ξ12+...+ξn−n*m <x ) = Φ ( x )
σ*√n
vagyis elegendően sok, (a fentieknek megfelelően) azonos típusú és független valségi változó összege normális eloszlású (ún. centrális határeloszlás tétel).

Exponenciális eloszlás

A ξ : Ω → ℝ folytonos valószínűségi változót λ∈ℝ, λ>0 paraméterű exponenciális eloszlású valségi változónak nevezzük, ha sűrűségfüggvénye

f(x) = { λ*e−λ*x   ha x≥0
0   ha x<0
eloszlásfüggvénye pedig
F(x) = P(ξ<x) = { 1−e−λ*x   ha x≥0
0   ha x<0
alakú.

Legyen ξ : Ω → ℝ exponenciális eloszlású valségi változó λ>0 paraméterrel. Ekkor

(1) μ = M(ξ) = 1/λ
(2) σ2 = D2(ξ) = 1/λ2, vagyis σ = D(ξ) = 1/λ

teljesül ξ várható értékére (μ) és szórására (σ).

Egyenletes eloszlás (folytonos)

A ξ : Ω → ℝ folytonos valószínűségi változót egyenletes eloszlású valségi változónak nevezzük az (a,b) nyílt intervallumon, ha sűrűségfüggvénye

f(x) = { 0   ha x≤a
1/(b−a)   ha a<x≤b
0   ha b<x
eloszlásfüggvénye pedig
F(x) = P(ξ<x) = { 0   ha x≤a
(x−a)/(b−a)   ha a<x≤b
1   ha b<x
alakú.

Legyen ξ : Ω → ℝ egyenletes eloszlású valségi változó az (a,b) intervallumon. Ekkor

(1) μ = M(ξ) = (a+b)/2
(2) σ2 = D2(ξ) = (b−a)2/12, vagyis σ = D(ξ) = (b−a)/√12

teljesül ξ várható értékére (μ) és szórására (σ).


A nagy számok törvényei

(1) Legyen ξ : Ω → ℝ tetszőleges valószínűségi változó, amelynek várható értéke M(ξ) és legyen c>0 tetszőleges valós szám. Ekkor

P( ξ ≥ c ) ≤ M(ξ)/c, vagy λ=c/M(ξ) jelöléssel P( ξ ≥ λ*M(ξ) ) ≤ 1/λ

teljesül (ún. Markov-egyenlőtlenség).

Ha ξ diszkrét valségi változó, akkor

M(ξ) = Σ{xi|1≤i<∞}xi*piΣ{xi|1≤i<∞,xi≥c}xi*piΣ{xi|1≤i<∞,xi≥c}c*pi = c*Σ{xi|1≤i<∞,xi≥c}pi = c*P(ξ≥c),

tehát c≠0 miatt M(ξ)/c ≥ P(ξ≥c) teljesül. (q.e.d.)

Például kockadobás esetén annak a valsége, hogy c=2-nél nagyobbat vagy azzal egyenlőt dobjunk, P(ξ≥2)=5/6≈0.83. Mivel M(ξ)=3.5, ezért M(ξ)/2=1.75, vagyis P(ξ≥2)≤M(ξ)/2 nyilvánvalóan teljesül. Ha c=5, akkor P(ξ≥5)=2/6=1/3≈0.33, M(ξ)/5=0.7, vagyis P(ξ≥5)≤M(ξ)/5 ebben az esetben is teljesül.

(2) Legyen ξ : Ω → ℝ tetszőleges valószínűségi változó, amelynek várható értéke M(ξ) és szórásnégyzete D2(ξ). Ekkor tetszőleges λ>1 pozitív valós számra

P( ∣ξ−M(ξ)∣ ≥ λ*D(ξ) ) ≤ 1/λ2, vagy ε=λ*D(ξ) jelöléssel P( ∣ξ−M(ξ)∣ ≥ ε ) ≤ D2(ξ)/ε2

teljesül (ún. Csebisev-egyenlőtlenség).

(3) Legyen A∈Ω egy p=pA valószínűségű esemény, és legyen ηA : Ω → {0, 1, ..., n}⊆ℕ egy 'n' darabos visszatevéses, független mintavétel mellett az A esemény gyakoriságát megadó valószínűségi változó. Mivel tudjuk, hogy az ηA valségi változó binomiális eloszlású, ezért M(ηA)=n*p és D2A)=n*p*(1−p), ezért a Csebisev-egyenlőtlenségből következik, hogy tetszőleges ε>0 pozitív valós számra

P (∣ ηA  − p  ≥ ε ) ≤  p*(1−p)
n n*ε2
teljesül (Bernoulli tétele, a nagy számok törvénye).

A tételből következik, hogy bármilyen kis ε>0 és δ>0 számokhoz találhatunk olyan (elegendően nagy) Nε∈ℕ számot, amelyre teljesül, hogy
– ha a mintavételek számát Nε-nál nagyobbra választjuk (azaz n≥Nε), akkor
annak a valószínűsége, hogy az A esemény relatív gyakoriságának és valószínűségének abszolút eltérése az 'ε' értéket meghaladja,
– a 'δ' számnál kisebb lesz
.
Ezt úgy is megfogalmazhatjuk, hogy n → ∞ esetén a relatív gyakoriság és a valószínűség eltérésének valószínűsége a 0-hoz konvergál. A valószínűségek sorozatának ilyen értelmű konvergálását szokás sztochasztikus konvergenciának nevezni.

(4) Legyenek
   ξ1 : Ω → ℝ,
   ξ2 : Ω → ℝ,
   ...
   ξn : Ω → ℝ,
azonos eloszlású, azonos 'm' várható értékű, és azonos σ>0 szórású független valószínűségi változók (azaz M(ξk)=m és D2k)=σ2 teljesül, 1≤k≤n). Ekkor tetszőleges ε>0 pozitív valós számra

P (∣ ξ12+...+ξn  − m  ≥ ε ) ≤  σ2
n n*ε2
teljesül (a nagy számok gyenge törvénye).

Ebből következik, hogy 'n' darabos független mintavétel esetén az egyes mintavételek eredményét jelentő független, azonos eloszlású valségi változók számtani közepének és várható értékének az abszolút eltérése sztochasztikusan konvergál a 0-hoz. Másképpen megfogalmazva a minta ún. empirikus középértéke (mintaközepe, empirikus várható értéke) sztochasztikusan konvergál a minta alapjául szolgáló valószínűségi változó várható értékéhez.

Bevezetve a ξn=(ξ12+...+ξn)/n jelölést a minta empirikus középértékére, a nagy számok gyenge törvénye tetszőleges ε>0 pozitív valós szám esetén

    P(|ξn−m|≥ε)→0 vagy P(|ξn−m|<ε)→1

formában is kifejezhető (ahol a → jelöléssel a valószínűségek sorozatának sztochasztikus konvergenciáját fejeztük ki n→∞ mellett).

Statisztikai minták feldolgozása

A matematikai statisztikában egy jelenséget rendszerint egy (vagy több) valószínűségi változóval jellemzünk. A statisztikai mintavétel során az adott jelenségre vonatkozóan n darab (egymástól független) megfigyelést vagy kísérletet végzünk. A kísérletek során minden alkalommal meghatározzuk ("megmérjük") a minket érdeklő valószínűségi változó aktuális értékét. Ennek eredményeként egy n elemű számsorozatot, statisztikai mintát kapunk, amelyet a vizsgált valószínűségi változót reprezentáló 'n' darab azonos eloszlású és független valószínűségi változó megfigyelt értékének tekintünk.

A matematikai statisztika célja a vizsgált valószínűségi változó(k) jellemzőinek minél pontosabb (megbízhatóbb, hitelesebb stb.) meghatározása. A vizsgálatok során feltételezzük, hogy minél több kísérletet végzünk, eredményeink ("becsléseink") annál pontosabbak lesznek.

Legyen ξ : Ω → ℝ az általunk vizsgált valségi változó és ( ξ1=x1, ξ2=x2, ..., ξn=xn ) statisztikai mintavétellel kapott minta. A továbbiakban feltételezzük, hogy a ξi (1≤i≤n) valségi változók függetlenek, és eloszlás­függvényük, valamint minden egyéb paraméterük (várható értékük, szórásuk stb.) megegyezik a vizsgált ξ valségi változó eloszlásfüggvényével és egyéb paramétereivel.

A ξ megfigyelt valségi változó empirikus eloszlásfüggvénye a következő:

Fn(x) =  1
 
Σ
ξi<x
1
n

Rendezzük el az (x1, x2, ..., xn) minta elemeit nagyság szerint, és jelölje (X1, X2, ..., Xn) a rendezett mintaelemeket, valamint xmin=X1 és xmax=Xn a minta legkisebb és legnagyobb elemét. Ekkor az empirikus eloszlásfüggvény a következőképpen is megadható (vö. Obádovics 1997: 104-105):

   Fn(x) = 0, ha x≤xmin;
   Fn(x) = k/n, ha Xk<x≤Xk+1 (k=1,2,...,n−1);
   Fn(x) = 1, ha xmax<x.

A fenti formula alapján Fn(x) értéke az x-nél kisebb megfigyelések számának relatív gyakorisága. Ezért egy [a,b)⊆ℝ intervallumra, elegendően nagy mintaszám (n>>1) esetén, P(a≤ξ<b) ≈ Fn(b)−Fn(a) teljesül.

A ξ megfigyelt valségi változó (relatív) gyakorisági hisztogramját a következő eljárással kaphatjuk meg:

(1) Határozzuk meg azt az [a,b)⊆ℝ intervallunot, amely a mintaelemek mindegyikét tartalmazza (azaz xi∈[a,b), 1≤i≤n). Például a=inf{ xi | 1≤i≤n } és b=sup{ xi | 1≤i≤n } nyilvánvalóan megfelelő értékek.
(2) Osszuk fel az [a,b)⊆ℝ intervallumot 'r' darab részintervallumra a=d0 < d1 < ... < dr=b módon például úgy, hogy a kapott Di=[di−1,di) részintervallumok hossza megegyezik (azaz di−di−1=d, 1≤i≤r). Ebben az esetben r*d=b−a teljesül, azaz d=(b−a)/r.
(3) Legyen ki a Di részintervallumba eső mintaelemek száma (1≤i≤r). Ábrázoljuk a koordináta-rendszer x tengelyén az [a,b) intervallumot és ezen belül a Di részintervallumokat úgy, hogy minden Di részintervallumhoz egy 'd' széles és a ki értékkel arányos magasságú téglalapot rendelünk. Legyen a téglalap például
– y=ki vagy y=ki/n (Reimann-Tóth 1985: 131-132, Obádovics 1997: 106) vagy
– y=ki/d (Reimann-Tóth 1985: 130)
magasságú.

Mivel a gyakorisági hisztogram fenti módon történő készítése során 'd' a részintervallumok hosszát jelentette, az egyes Di részintervallumokhoz rendelt téglalapok területe a ki gyakoriságokkal, az ábrázolt téglalapok összegzett területe pedig a minta darabszámával (n=k1+k2+...+kn) arányos értéket fog megadni.

A ξ megfigyelt valségi változó sűrűségi hisztogramját a gyakorisági hisztogramhoz teljesen hasonlóan készíthetjük el, de az egyes Di részintervallumokhoz rendelt téglalapok magasságát
    ki/(d*n)
módon állapítjuk meg. Ebben az esetben az ábrázolt téglalapok összegzett területe 1-et fog adni.

Jelöljük azt a függvényt, amelyet a sűrűségi hisztogramban megrajzolt téglalapok rajzolnak ki, fn(x) módon. Az így kapott empirikus sűrűségfüggvény segítségével megbecsülhetjük, hogy a ξ valségi változó értéke mekkora valséggel esik egy adott intervallumba. Ha [a,b)⊆ℝ egy intervallum, elegendően nagy mintaszám (n>>1) és kis részintervallumok (d=di−di−1<<1, 1≤i≤r) esetén

P(a≤ξ<b) ≈ 
 
Σ
a≤di−1<di≤b
fn(di)*(di−di−1)
teljesül (a formulában az fn(di) tényezőben di helyett a Di intervallum bármelyik pontját választhatjuk).

Folytonos eloszlások esetében, folytonos f(x) sűrűségfüggvényt feltételezve a részintervallumok hosszát minden határon túl csökkentve (d→0) a fenti formula átmegy az f(x) (integrálható) sűrűségfüggvény [a,b) intervallumon vett határozott integráljába, amelynek kiszámításához az F(x) eloszlásfüggvényt mint primitív függvényt használhatjuk (F'(x)=f(x)).

Példaként hajtsuk végre a Weldon-féle kockadobási kísérletet m=10-szer megismételt dobássorozattal. Emlékeztetőül foglaljuk össze, hogy a korábban megadott mintapéldának megfeleltetve ez mit jelent:
– egy kísérlet egy kockadobás, amelyben N=6 "termékből" választunk;
– a kockával dobott minden érték (vagyis az egyes "termékek" kiválasztása) egyenlően valószínű (klasszikus valségi mező);
– a megfigyelt esemény (A) az 5-ös vagy 6-os dobás, azaz a termékek között s=2 darab "selejt" van (pA=2/6=1/3);
– egy kísérlet vagy dobássorozat (ξA) során n=12-szer dobunk, azaz 12 "terméket" választunk (visszatevéses mintavétellel) (Megjegyzés: itt 'n' nem a statisztikai mintavétel elemszámát jelenti, hanem egy kísérlet során a dobások számát; a statisztikai mintavétel elemszámát, azaz a kísérletek számát most 'm' jelöli);
– egy kísérlet során az A esemény ξA=k-szor következik be, azaz 'k' darab "selejtet" kapunk (0≤k≤12); ha egy adott kísérlet (mintavétel) során di≤k<di−1 teljesül, akkor a [di,di−1) intervallumhoz tartozó gyakoriság eggyel nő (Megjegyzés: a hisztogramkészítéshez szükséges intervallumokba eső minták számát az alábbi táblázatban χ-vel fogjuk jelölni, ahol 0≤χ≤m teljesül);
– a kísérleteket eredetileg m=26306-szor hajtották végre, amely megfelelt a ( ξA1=k1, ξA2=k2, ..., ξA26306=k26306 ) statisztikai mintavételnek; az alábbi példában azonban egy m=10 elemű mintát használunk.

Az empirikus eloszlásfüggvény, Fn(x) ábrázolása

Figyeljük meg, hogy az empirikus eloszlásfüggvénynek az értékkészlet különböző pontjaiban szakadása van. A görbe minden szakadáskor annyiszor emelkedik 1/n=0.1 értékkel, ahányszor az értékkészletben az adott érték előfordul.

A sűrűségi hisztogram ábrázolása

Figyeljük meg, hogy a különböző színű görbék alatti terület összege pontosan 1.
(az x tengely beosztása 1, az y tengely beosztása 0.1)

kék szín: d=2 hosszúságú intervallumok

sárga szín: d=1 hosszúságú intervallumok


A statisztikai mintavételben szereplő ( ξ1=x1, ξ2=x2, ..., ξn=xn ) valségi változók egy alkalmasan választott g(ξ12,...,ξn) függvényét statisztikai függvénynek vagy statisztikának nevezzük. Ilyen statisztikák például az (empirikus) mintaközép vagy az empirikus szórásnégyzet.

(1) A ξ valószínűségi változó megfigyelésével kapott ( ξ1=x1, ξ2=x2, ..., ξn=xn ) statisztikai minta számtani közepét, azaz a

ξ = (ξ12+ ... +ξn)/n

statisztikát mintaközépnek (empirikus középértéknek vagy empirikus várható értéknek) nevezzük. Ha a ξ megfigyelt valségi változó várható értéke M(ξ)=m és szórásnégyzete D2(ξ)=σ2, akkor a mintaközép várható értékére és szórásnégyzetére

M(ξ)=M(ξ)=m, és
D2(ξ)=D2(ξ)/n=σ2/n

teljesül. (Érdemes megjegyezni, hogy a mintaközép szórása 'n' növekedésével jelentősen csökken.)

(2) A ξ valószínűségi változó megfigyelésével kapott ( ξ1=x1, ξ2=x2, ..., ξn=xn ) statisztikai minta esetében az

S2(ξ) = ( (ξ1ξ)2 + (ξ2ξ)2 + ... + (ξnξ)2 )/n

statisztikát empirikus szórásnégyzetnek, a

Sk2(ξ) = ( (ξ1ξ)2 + (ξ2ξ)2 + ... + (ξnξ)2 )/(n−1)

statisztikát korrigált empirikus szórásnégyzetnek nevezzük.
Ha a ξ megfigyelt valségi változó szórásnégyzete D2(ξ)=σ2, akkor az empirikus és korrigált empirikus szórásnégyzet várható értékére

M(S2(ξ))=σ2*(n−1)/n és
M(Sk2(ξ))=σ2

teljesül. (Ha a mintaszám nagy, azaz n>>1, akkor az empirikus szórásnégyzet várható értéke közelítőleg a ξ valségi változó szórásnégyzetét adja.)

(3) A ξ és η valségi változók empirikus korrelációs együtthatója az

rξη = (ξ11+ ξ22+ ...+ ξnn)/n

jelöléssel

r = (rξηξ*η) / (S(ξ)*S(η))

módon számítható ki (Reiman-Tóth 1985: 231).


Példaként határozzuk meg a ξ és η valségi változók együttes eloszlásának ismeretében az empirikus mintaközepet, szórást és korrelációs együtthatót.

index ξ η

A ξ és η valségi változók empirikus mintaközepe:

ξ=

η=

A ξ és η valségi változók empirikus és korrigált empirikus szórásnégyzete:

S2(ξ)=
⇒ S(ξ)=

Sk2(ξ)=
⇒ Sk(ξ)=

S2(η)=
⇒ S(η)=

Sk2(η)=
⇒ Sk(η)=

A ξ és η valségi változók empirikus korrelációs együtthatója:

r(ξ,η)=

Ha a mintaelemek generálásakor a Mintavétel (1,2,3) gombra kattintottunk, akkor ellenőrzésként adjuk meg a
    ξ : Ω→{1,2,3}
és
    η : Ω→{1,2,3}
valségi változók együttes eloszlását az egyes értékek együttes előfordulásainak relatív gyakorisága alapján a korábbi példában szereplő táblázathoz hasonlóan. Ezután számoljuk ki a valségi változók peremeloszlását és a valségi változók főbb jellemzőit. Ha így járunk el, a fenti értékekkel megegyező értékeket kell kapnunk.

ξ ↓ / η → y1=1 y2=2 y3=3 Σ(sorok)
x1=1 wξη(x1,y1) wξη(x1,y2) wξη(x1,y3) wξ(x1)
x2=2 wξη(x2,y1) wξη(x2,y2) wξη(x2,y3) wξ(x2)
x3=3 wξη(x3,y1) wξη(x3,y2) wξη(x3,y3) wξ(x3)
Σ(oszlopok) wη(y1) wη(y2) wη(y3)

A ξ és η valségi változók várható értéke:
    M(ξ)=
    M(η)=

A ξ és η valségi változók szórásnégyzete:
    D2(ξ)= ⇒ D(ξ)=
    D2(η)= ⇒ D(η)=

A ξ és η valségi változók kovarianciája:

Cov(ξ,η)=

A ξ és η valségi változók korrelációs együtthatója:

R(ξ,η)=


Irodalom- és forrásjegyzék

Bíró Fatime; Vincze Szilvia 2010. A gazdasági matematika alapjai. Debrecen: Debreceni Egyetemi K.

Bognár Jánosné et al. 1971. Valószínűségszámítás feladatgyűjtemény. Budapest: Tankönyvk.

Csatlósné Fülöp Sára 1996. Kombinatorika, valószínűségszámítás. In: Pappné Ádám Györgyi (szerk.) 1996. 155-174.

Cser Andor; L. Ziermann Margit; Reményi Gusztáv 1962. Matematikai zsebkönyv. Budapest: Tankönyvk.

Feller, William 1978. Bevezetés a valószínűségszámításba és alkalmazásaiba. Budapest: Műszaki K.

Obádovics J. Gyula 1997. Valószínűségszámítás és matematikai statisztika. Budapest: Scolar K.

Obádovics J. Gyula; Szarka Zoltán 2009. Felsőbb matematika. Budapest: Scolar K.

Pappné Ádám Györgyi (szerk.) 1996. Matematika az általános képzéshez a tanítóképző főiskolák számára. Budapest: Nemzeti Tankönyvk.

Reimann József; Tóth Julianna 1985. Valószínűségszámítás és matematikai statisztika. Budapest: Tankönyvk.

Rényi Alfréd 1973. Valószínűségszámítás. Budapest: Tankönyvk.

Solt György 1971. Valószínűségszámítás. Példatár. Budapest: Műszaki K.

Szabó István 1996. Kombinatorika, valószínűségszámítás. In: Balassa Zsófia (szerk.) 1996. Matematika feladatgyűjtemény az általános képzéshez a tanítóképző főiskolák számára. Budapest: Nemzeti Tankönyvk. 82-91.

Vilenkin, N. J. 1987. Kombinatorika. Budapest: Műszaki K.

Vincze Szilvia, Bíró Fatime 2000. Bevezetés az alkalmazott matematikába. Debrecen: Debreceni Egyetem Debreceni Egyetem Agrártudományi Centrum.

Závoti József 2010. Matematika III. 4. A valószínűségi változó és jellemzői. Sopron: Nyugat-magyarországi Egyetem, Geoinformatikai Kar.

Internetes források

Csallner András Erik – Vincze Nándor 2015. Bevezetés a valószínűség-számításba és a matematikai statisztikába.
http://www.jgypk.hu/tamop15e/tananyag_html/... (2021-03-14)

Binomiális eloszlás. Wikipédia.
https://hu.wikipedia.org/wiki/... (2021-03-15)

Eloszlásfüggvény. Wikipédia.
https://hu.wikipedia.org/wiki/... (2021-03-13)

JavaScript - Normal Distribution Function.
https://www.math.ucla.edu/~tom/... (2021-03-14)

Normális eloszlás. Wikipédia.
https://hu.wikipedia.org/wiki/... (2021-03-15)

Miért fordul elő a normál eloszlás olyan gyakran a természetben? – Statiszika egyszerűen.
https://statisztikaegyszeruen.blog.hu/... (2019-03-21)


Boda István, 2021.