Alkalmazott matematika 3

Legyen H egy tetszőleges halmaz. Válasszuk ki és rögzítsük a H halmaz n∈ℕ⁺ darab különböző elemét (feltéve, hogy H elemszáma legalább 'n'). Speciálisan megengedjük az n=1 esetet is. Ekkor az
(a₁, a₂, ..., a_n)
véges elemsorozatot ("rendezett elem n-est") az a_i elemek egy ismétlés nélküli permutációjának nevezzük.

Legyen
H_n={a_i∈H | 1≤i≤n}
a kiválasztott elemekből álló ('n' elemű) halmaz. Ekkor a H_n halmaz elemeinek egy ismétlés nélküli permutációján a H_n halmaznak egy "önmagára vett bijektív leképezését értjük" (Wikipédia). Ebben az értelemben a H_n halmaz elemeinek összes permutációját a H_n halmaz önmagára vett összes lehetséges bijektív leképezése adja meg.

Például, ha n=5 és H_n={1,2,3,4,5}, akkor egy lehetséges 'p' bijektív leképezést

Dom(p)	1	2	3	4	5
Rng(p)	5	2	1	3	4

módon adhatunk meg, ahol a leképezés értelmezési tartományának (Dom(p)) elemeit a táblázat felső sorában, értékkészletét (Rng(p)) pedig a táblázat alsó sorában soroljuk fel (az elemek egymáshoz rendelését pedig a táblázat megfelelő oszlopai mutatják).

Megjegyzés: a H_n (n elemű) halmaz elemeinek egy permutációját úgy is megkaphatjuk, hogy a H_n halmaz összes elemét egy adott sorrendben, egymás után kiválasztjuk (és minden elemet csak egyszer, azaz az elemet kiválasztása után "nem tesszük vissza"). Az összes lehetséges (különböző) kiválasztások száma ebben az esetben megegyezik az n elem n-ed osztályú (vagy rendű) ismétlés nélküli variációinak a számával (ld. később).

Az (a₁, a₂, ..., a_n) és (b₁, b₂, ..., b_n) permutációk megegyeznek, ha minden elemre a_i=b_i (1≤i≤n) teljesül. Egy ismétlés nélküli permutációban minden elem különböző, tehát két tetszőleges elemet felcserélve egy másik, az előzőtől különböző permutációt kapunk.

Rögzített n∈ℕ⁺ elemszám esetén az összes különböző ismétlés nélküli permutáció száma

A fentieknek megfelelően egy véges, n elemű H_n halmaz elemeinek összes ismétlés nélküli permutációját
{ (i₁,i₂,...,i_n) | i_j∈H_n, 1≤j≤n; i_j≠i_k, 1≤j<k≤n }
módon kaphatjuk meg.

Például az (1,2,3) számok ismétlés nélküli permutációi a következőképpen állíthatók elő:

Jegyezzük meg, hogy
– a permutációkat a H_n={1,2,3} halmaz elemeinek egymás utáni kiválasztásával kapjuk meg;
– a programban szereplő 'for' ciklusok ciklusváltozói (i,j,k) a H_n halmaz elemeit veszik fel;
– minden egyes 'for' ciklus egy elem "kiválasztását" valósítja meg a H_n halmazból.

Ismétléses permutációk

Legyen H egy tetszőleges halmaz. Válasszuk ki és rögzítsük a H halmaz n∈ℕ⁺ darab (nem feltétlenül különböző) elemét (a_i∈H, 1≤i≤n). Ekkor az
(a₁, a₂, ..., a_n)
véges elemsorozatot ("rendezett elem n-est") az a_i elemek ismétléses permutációjának nevezzük.

Egy ismétléses permutációban két elemet felcserélve csak akkor kapunk az előzőtől különböző permutációt, ha a felcserélt elemek különbözőek.

Tegyük fel, hogy az (a₁, a₂, ..., a_n) ismétléses permutációban s≤n darab különböző elem van. Jelöljük ezeket az elemeket b_j (1≤j≤s) módon. Ezekre teljesül, hogy az (a₁, a₂, ..., a_n) permutációban
   a b₁ elem k₁-szer ismétlődik (1≤k₁≤n),
   a b₂ elem k₂-szer ismétlődik (1≤k₂≤n),
   ...,
   a b_s elem k_s-szer ismétlődik (1≤k_s≤n).
Mivel a permutációban összesen 'n' darab elem van, az egyes elemek ismétlődéseinek összegére
    k₁+k₂+...+k_s=n
teljesül. Ebben az esetben az 'n' elem összes k₁, k₂, ..., k_s-ad rendű (különböző) ismétléses permutációjának száma

Emeljük ki, hogy 's' értéke a különböző elemek számát adja meg, 'n' értéke pedig az ismétléses permutációban levő különböző "helyek" (vagy pozíciók) számát adja meg, amely csak ismétlés nélküli permutációk esetén egyezik meg a permutációban levő különböző elemek számával. Ebben az esetben ugyanis k₁=k₂=...=k_s=1 miatt egyrészt s=n, másrészt pedig
P_n^1,1,...,1,i= n!= P_n
teljesül.

Egy ismétléses permutáció elemeit a
    { (b₁,k₁), (b₂,k₂), ... , (b_n,k_n) }
véges multihalmaz (vagy "zsák") segítségével adhatjuk meg, ahol a fenti jelölésnek megfelelően a (b_j,k_j) számpárok ("tupletek") azt jelölik, hogy a multihalmazban a b_j elem pontosan k_j≥0 gyakorisággal fordul elő (1≤j≤n), és a gyakoriságokra
    k₁+k₂+...+k_n=n
teljesül. Vegyük észre, hogy most megengedtük a gyakoriságokra a nulla értéket is (ez azonban 0!=1 miatt ugyanazt az eredményt adja az ismétléses permutációk számára, mint a fenti képlet).

Egy ismétléses permutációt a multihalmaz összes elemének a multihalmazban szereplő gyakorisággal történő kiválasztásával kaphatunk meg (az elemeket tetszőleges sorrendben választva).

A fentiekből következik, hogy
    (1) az összes lehetséges multihalmaz számát 'n' elem 'n'-ed rendű ismétléses kombinációja adja meg;
    (2) ha a multihalmaz összesen két elemet (s=2) tartalmaz k₁>0 és k₂>0 gyakorisággal, és az összes többi elem gyakorisága zérus (vagyis k₁+k₂=n teljesül), akkor 'n' elem k₁ és k₂ rendű ismétleses permutációja megegyezik 'n' elem k=k₁ rendű (vagy 'n' elem k=k₂=(n−k₁) rendű) ismétlés nélküli kombinációjával, azaz
    P_n^k₁,k₂,i= n!/(k₁!*k₂!)= C_n^k= (ⁿ _k)= (ⁿ _n−k)= C_n^n−k
teljesül.
    A feladat egy lehetséges modellje: hányféleképpen állíthatunk össze 'k' darab fehér és (n−k) darab fekete golyóból egy sorozatot (permutáció), illetve hányféleképpen oszthatjuk fel az 'n' természetes számból álló (alap)halmazt egy 'k' elemű, és egy (n−k) elemű részhalmazra (kombináció)?

Például a { (1,2), (2,1), (3,2) } multihalmaznak megfelelő számok, azaz az (1,2,3) számok 5 elemből álló (2,1,2) osztályú ismétléses permutációi a következőképpen állíthatók elő:

Megjegyzés: a fenti program az (1,2,3) számokból képzett 5 elemű, (2,1,2) osztályú ismétléses permutációkat úgy állítja elő, hogy előállítja az (1,2,3) számok összes 5-öd osztályú (vagy rendű) ismétléses variációit (ld. később), és ezekből kiszűri azokat az "érvényes" permutációkat, amelyekben pontosan 2 db 1-es, 1 db. 2-es és 2 db. 3-as szám szerepel.

Variációk

Ismétlés nélküli variációk

Legyen H egy tetszőleges, 'n' elemű halmaz, és válasszuk ki ennek k∈ℕ⁺ darab különböző elemét (a_i, a_j∈H, a_i≠a_j, 1≤i<j≤k≤n); speciálisan megengedjük a k=1 (és k=n) esetet is. Ekkor az
(a₁, a₂, ..., a_k)
véges elemsorozatot az a_i elemek egy ismétlés nélküli variációjának nevezzük.

Rögzített k∈ℕ⁺ elemszám esetén az n elem összes különböző k-ad osztályú ismétlés nélküli variációjának száma

Például az (1,2,3,4) számok 3-ad osztályú ismétlés nélküli variációi a következőképpen állíthatók elő:

Ismétléses variációk

Legyen H egy tetszőleges, 'n' elemű halmaz, és válasszuk ki ennek k∈ℕ⁺ darab elemét úgy, hogy egy elemet többször is kiválaszthatunk (a_i∈H, 1≤i≤k). Ekkor az
(a₁, a₂, ..., a_k)
véges elemsorozatot az a_i elemek egy ismétléses variációjának nevezzük (mivel egy elemet többször is kiválaszthatunk, k>n is lehetséges).

Rögzített k∈ℕ⁺ elemszám esetén az 'n' elem összes különböző k-ad osztályú ismétléses variációjának száma

Például az (1,2,3) számok 3-ad osztályú ismétléses variációi a következőképpen állíthatók elő:

Kombinációk

Ismétlés nélküli kombinációk

Legyen H egy tetszőleges, 'n' elemű halmaz, és válasszuk ki ennek k∈ℕ darab különböző elemét (a_i, a_j∈H, a_i≠a_j, 1≤i<j≤k≤n) úgy, hogy nem számít a kiválasztott elemek sorrendje; speciálisan megengedjük a k=1 (és k=n) esetet is. Ekkor az
{ a₁, a₂, ..., a_k }
véges elemhalmazt az a_i elemek egy ismétlés nélküli kombinációjának nevezzük.
(Az ismétlés nélküli kombinációkat úgy is felfoghatjuk, hogy az ismétlés nélküli variációknál megismerteknek megfelelően kiválasztunk egy 'k' elemből álló elemsorozatot, és ezek lehetséges permutációi között nem teszünk különbséget. Ez számok esetében a legegyszerűbben úgy oldható meg, hogy a kiválasztott számokat növekvő sorrendben elrendezzük, ez ugyanis az azonos számokból álló variációk közül minden esetben csak azt az egy permutációt "hagyja meg", amelyben a számok rendezettek, és a többi permutációt kiszűri.)

Rögzített k∈ℕ elemszám esetén az n elem összes különböző k-ad osztályú ismétlés nélküli kombinációjának száma

Például az (1,2,3,4) számok 3-ad osztályú ismétlés nélküli kombinációi a következőképpen állíthatók elő:

Vegyük észre, hogy a kombinációk egyes elemeinek kiválasztását végző 'for' ciklusok ciklusváltozóinak (i, j és k) kezdőértéke biztosítja, hogy az {i,j,k} alakú kombinációk mindegyikében i<j<k teljesüljön, vagyis az elemek a kombinációban növekvő sorrendben szerepeljenek.

Ismétléses kombinációk

Legyen H egy tetszőleges, 'n' elemű halmaz, és válasszuk ki ennek k∈ℕ⁺ darab a_i∈H elemét (1≤i≤k) úgy, hogy nem számít a kiválasztott elemek sorrendje, és egy elemet többször is kiválaszthatunk. Ekkor az
{ (a₁,k₁), (a₂,k₂), ... , (a_n,k_n) }
véges multihalmazt (vagy "zsákot") a k_i≥0 gyakorisággal előforduló a_i elemek (1≤i≤n) egy ismétléses kombinációjának nevezzük. Mivel az ismétléses kombináció során pontosan 'k' darab elemet választunk, a zsákban levő elemek gyakoriságára minden választás esetén
k₁+k₂+k₃+ ... +k_n=k
teljesül (mivel egy elemet többször is kiválaszthatunk, k>n is lehetséges).
(Az ismétléses kombinációkat úgy is felfoghatjuk, hogy az ismétléses variációknál megismerteknek megfelelően kiválasztunk egy k elemből álló elemsorozatot, és ezek lehetséges ismétléses permutációi között nem teszünk különbséget. Ez számok esetében a legegyszerűbben úgy oldható meg, hogy a kiválasztott számokat nem csökkenő sorrendben elrendezzük, ez ugyanis az azonos számokból álló variációk közül minden esetben csak azt az egy permutációt "hagyja meg", amelyben a számok nem csökkenő sorrendben állnak, és a többi permutációt kiszűri. Tehát például az első 'n' természetes szám k-ad osztályú ismétléses kombinációit a számokból képezhető 'k' elemű rendezett számsorozatok (szám n-esek) adják meg, amelyekben egy szám többször is előfordulhat.)

Rögzített k∈ℕ⁺ elemszám esetén az 'n' elem összes különböző k-ad osztályú ismétléses kombinációjának száma

Egy { (a₁,k₁), (a₂,k₂), ... , (a_n,k_n) } ismétléses kombinációt kizárólag a k_i≥0 gyakoriságok határoznak meg, ahol k₁+k₂+...+k_n=k miatt nyilvánvalóan k_i≤n is teljesül (1≤i≤n). Az ismétléses kombináció az (a_i,k_i) elempárokból álló multihalmaz (1≤i≤n), amelyek sorrendje tetszőlegesen megválasztható. Rögzítsünk ezért egy meghatározott sorrendet (például úgy, hogy az (a_i,k_i) elempárokat az a_i elemek szerint növekvő sorrendben elrendezzük).

Ezután kódoljuk az elempárokat a következőképpen:
   (0) legyen i←1,
   (1) az a_i elemet helyettesítsük egy rögzített B értékkel és írjuk le,
   (2) B után írjunk annyi X-t, amennyi k_i értéke,
   (3) legyen i←i+1 (azaz növeljük i értékét 1-gyel), és
   (4) folytassuk az algoritmust az (1) lépésben, amíg i≤n fennáll.

Az algoritmus eredményeként minden ismétléses kombinációhoz kölcsönösen egyértelműen hozzárendeltünk egy B-vel kezdődő, a B és X karakterek csoportjaiból álló sorozatot, amelyben pontosan 'n' darab B és 'k' darab X érték található (ahol az i-dik B után szereplő X karakterek száma meghatározza az i-dik elem k_i gyakoriságát).

Az első B elemet változatlanul hagyva (n+k−1) darab elem marad, amelyekben (n−1) darab B és 'k' darab X elem ismétlődik. Ezeknek az elemeknek minden különböző ismétléses permutációja külcsönösen egyértelműen megfeleltethető 'n' elem egy 'k'-ad rendű ismétléses kombinációjának (és megfordítva).

Tehát az (n−1) darab B és 'k' darab X elemből álló sorozatok, vagyis összesen (n+k−1) elem összes (n−1) és k-ad rendű ismétléses permutációja megadja az 'n' elem k-ad osztályú ismétléses kombinációinak számát. Ez a korábbiaknak megfelelően
    (n+k−1)!/((n−1)!*k!)
ami éppen a bizonyítandó formulát adja (vö. Cser et al. 1962: 458-459; Vilenkin 1987: 50-51).

Például az (1,2,3,4) számok 3-ad osztályú ismétléses kombinációi a következőképpen állíthatók elő:

Vegyük észre, hogy a kombinációk egyes elemeinek kiválasztását végző 'for' ciklusok ciklusváltozóinak (i, j és k) kezdőértéke biztosítja, hogy az {i,j,k} alakú kombinációk mindegyikében i≤j≤k teljesüljön, vagyis az elemek a kombinációban nem csökkenő sorrendben szerepeljenek.

A fenti program eredményei formálisan "halmazok", de az ismétlődő elemek jelzik, hogy valójában multihalmazokat kaptunk. Ezeket például az alábbi programmal tudjuk megjeleníteni:

/* ismétléses kombinációk, C4,3,i (1,2,3,4) multihalmazként megjelenítve*/

function mh(x) {
 var y=0;
 if(x==i) y++;
 if(x==j) y++;
 if(x==k) y++;
 return "("+x+","+y+")";
 }

var i,j,k;
var sorszam=0;

for(var i=1;i<=4;i++) {
 for(var j=i;j<=4;j++) {
  for(var k=j;k<=4;k++) {
   write("["+i+","+j+","+k+"] = {");
   writeln(mh(1)+","+mh(2)+","+mh(3)+","+mh(4)+"}");
   sorszam++;
   }
  }
 }
writeln();
writeln("Az ismétléses kombinációk száma: "+sorszam);

writeln("-----");

A program futásának eredménye:

Gyakorló feladatok (vö. Szabó 1996: 82-87)

(1.1) Egyfordulós körmérkőzés esetén hányféle sorrendben végezhetnek a csapatok?

(2) Hány 19-cel kezdődő, ötjegyű szám készíthető az {1,3,5,7,9} számjegyekből, ha

(3) Hány páros, négyjegyű szám képezhető az {1,2,3,4} számjegyekből, ha

(4) Hány 3-mal osztható, négyjegyű szám képezhető az {1,2,3,4} számjegyekből, ha

(5) Hány 6-tal osztható, négyjegyű szám képezhető az {1,2,3,4} számjegyekből, ha

(6) Hány 10-zel osztható, négyjegyű szám képezhető a {0,1,2,3,4} számjegyekből, ha

(7) Egy 6 főből álló baráti társaság az étteremben egy kör alakú asztal körül elhelyezett 6 széken akar helyet foglalni. Hányféleképpen történhet ez meg, ha két elhelyezkedést akkor és csak akkor tekintünk különbözőnek, ha a társaságnak van legalább egy olyan tagja, akinek vagy a bal oldali, vagy a jobb oldali szomszédja a két esetben különböző?

(8) 10 ember ül le egy kerek asztal mellé. Hányféleképpen helyezkedhetnek el, ha azt akarjuk, hogy

(9) 10 ember ül le egymás mellé egy egyenes asztal egyik oldalán. Hányféleképpen helyezkedhetnek el, ha azt akarjuk, hogy

(10) 10 ember ül le egymás mellé egy egyenes asztal mindkét oldalán (az asztalfőn egyik oldalon sem ül senki). Hányféleképpen helyezkedhetnek el, ha azt akarjuk, hogy

(11) 6 piros, 3 fehér, 2 kék golyót hányféleképpen lehet egymás mellé helyezni, hogy a hat piros golyó nem kerüljön egymás mellé?

Megoldás: P₁₁^2,3,6,i−P₆^1,2,3,i= 11!/(2!*3!*6!)−6!/(2!*3!)= 4620−60= 4560

(13.1) a gyöngysor két végét nem kötjük össze, és 10 fehér és 10 kék gyöngyünk van?

(13.2) a gyöngysor két végét nem kötjük össze, és 10 fehér, 5 kék és 5 piros gyöngyünk van?

(13.3) a gyöngysor két végét összekötjük, és 5 fehér és 15 kék gyöngyünk van?

(13.4) a gyöngysor két végét összekötjük, és 10 fehér, 5 kék és 5 piros gyöngyünk van?

(14) Az {1,2,3,...,14,15} számokat sorozatba rendezzük. Hány olyan eset van, amelyben az {1,2} számok csökkenő sorrendben kerülnek egymás mellé?

(15) 10 tanuló között hányféleképpen lehet kiosztani 3 különböző tárgyat, ha egy tanuló több tárgyat is kaphat?

(16) Hány olyan hatjegyű szám van, amelynek minden számjegye 6-nál nagyobb és 9-nél kisebb?

(17) Hány olyan ötjegyű szám van, amelynek a második és a harmadik jegye 3-as, és a szám 5-tel osztható?

(18) 15 betűből és 10 számból autórendszámot készítünk úgy, hogy a rendszámban először 3 betű, majd 3 számjegy szerepeljen (pl. ABC 123). Hány autót tudunk így megkülönböztetni?

(19) Egy dobókockával ötször dobunk egymás után. Hányféle dobássorozat lehetséges?

(21.1) Egy jó ebédet akarunk főzni. Hányféleképpen választhatunk ki egy kacsát és egy tyúkot?

(21.2) Egy jó és bőséges ebédet akarunk főzni. Hányféleképpen választhatunk hozzá ki két kacsát és két tyúkot,

A fenti feladat példa hipergeometrikus eloszlásra N=34, s=10, n=4 és k=2 paraméterekkel, ahol az összes eset számát C_Nⁿ= (^N _n)= (³⁴ ₄)= (34*11*4*31)= 46376 adja meg.

Megoldás: P₄^2,2,i*V₁₀²*V₂₄²= [4!/(2!*2!)]*[10!/(10−2)!]*[24!/(24−2)!]= (4*3/2)*(10*9)*(24*23)= 298080

Ebben az esetben az összes eset számát V₃₄⁴= 34!/(34−4)!= 34*33*32*31= 1113024 adja meg.

(21.2) Főzés előtt meg szeretnénk vizsgálni a háziállatok minőségét. Hányféleképpen választhatunk ki két kacsát és két tyúkot úgy, hogy egy kacsát vagy egy tyúkot többször is kiválaszthatunk (azaz minden véletlen kiválasztás után "visszatesszük" a kiválasztott madarakat),

Megoldás: C₁₀^2,i*C₂₄^2,i= (¹¹ ₂)*(²⁵ ₂)= (5*11)*(12*25)= 16500

Ebben az esetben az összes eset számát C₃₄^4,i= 37!/(4!*33!)= 37*3*35*17= 66045 adja meg.

Megoldás: P₂^2,2,i*V₁₀^2,i*V₂₄^2,i= (⁴ ₂)*10²*24²= 6*100*576= 345600

A fenti feladat példa binomiális eloszlásra N=34, s=10, n=4 és k=2 paraméterekkel, ahol az összes eset számát Nⁿ= 34⁴= 1336336 adja meg.

(22) Egy biológiadolgozatban 10 kérdés szerepel. Az egyes válaszokat kérdésenként {A,B,C,D,E} betűk jelölik (minden kérdésre öt lehetséges választ sorolunk fel).

(22.1) Ha minden kérdésre pontosan egy jó választ adhatunk, hányféle különböző választássorozat lehetséges?

(22.2) Ha minden kérdésre legalább egy és legfeljebb négy jó választ adhatunk (amerikai stílusú teszt), hányféle különböző választássorozat lehetséges?

(23) Hányféleképpen lehet 90 számból 5 számot kihúznunk (lottóhúzás), ha a számok sorrenje nem számít?

(24) 100 darab tévékészülék köztt 10 hibás (selejtes) darab van. Hányféleképpen tudunk 15 készüléket úgy kiválasztani, hogy a kiválasztott készülékek között

(25) 5 lány és 3 fiú röplabdázni szeretne. Hányféleképpen alkothatunk két, négyfős csapatot, ha azt szeretnénk, hogy mindkét csapatban legyen legalább egy fiú?

(26) Egy csomag 52 lapos franciakártya csomagból 10 lapot húzunk ki. Hány esetben lesz ezek között

(27) Egy rekeszben 20 üveg sor van. 15 üvegben világos sör, 5 üvegben barna sör van. Hányféleképpen választhatunk ki 6 üveg sört úgy, hogy pontosan két barna sörünk legyen?

(28) Egy osztályban 14 fiú és 16 lány van. Hányféleképpen lehet 4 fiút és 4 lányt kiválasztani, akik együtt mennek moziba?

(29) Egy urnában húsz cédula van 1-től 20-ig megszámozva. Húzzunk ki 5 cédulát úgy, hogy minden húzás után a kihúzott cédulát visszatesszük. Hány esetben lesz a kihúzott legkisebb szám nagyobb 6-nál?

Eseményalgebra

A valószínűségszámítás ún. véletlen tömegjelenségekkel foglalkozik, amelyek hasonló körülmények között (legalábbis elvileg) tetszőleges sokszor megfigyelhetők, vagy kísérletek formájában bármikor kiválthatóak vagy előállíthatóak, és ezáltal vizsgálhatóak. A vizsgált véletlen tömegjelenség egy bekövetkezését a továbbiakban kísérletnek nevezzük, egy kísérlet lehetséges, egymást kölcsönösen kizáró kimeneteleit elemi eseményeknek, az elemi események összességét pedig eseménytérnek nevezzük. Ha egyazon véletlen jelenség vizsgálatakor n darab kísérletet végzünk el, (n darabos) mintavételről beszélünk.

Például ha egy kockával dobunk, kísérletről beszélhetünk, ahol az eseményteret alkotó elemi események a dobások lehetséges értékei (vagyis ekkor az eseményteret hat elemi esemény alkotja). Ha egymás után 10-szer dobunk, 10 darabos mintavételt végeztünk.

Jelöljük az eseménytért Ω módon. Az eseménytér A⊆Ω részhalmazait (véletlen) eseményeknek nevezzük. A következő eseményeket fogjuk megkülönböztetni:
– az A⊆Ω esemény lehetetlen esemény, ha egyetlen elemet sem tartalmaz, azaz A=∅ (vagy |A|=0);
– az A⊆Ω esemény elemi esemény, ha pontosan egy elemet tartalmaz, azaz A_ω={ ω∈Ω } (megjegyzés: ha nem okoz félreértést, az elemi eseményekre az A_ω={ ω∈Ω } halmaz helyett egyszerűen ω∈Ω módon hivatkozunk);
– az A⊆Ω esemény összetett esemény, ha egynél több elemet tartalmaz, azaz ∣A∣>1 teljesül;
– az A⊆Ω esemény biztos esemény, ha Ω összes elemét tartalmazza, azaz A=Ω teljesül.

Például ha egy kockával dobunk, az elemi események halmaza Ω = {ω₁, ω₂, ..., ω₆} ahol ω_i jelenti azt az elemi eseményt, hogy a kockával 'i'-t dobtunk (1≤i≤6). Ekkor például az
A = {a dobás eredménye páros szám} = {ω₂, ω₄, ω₆}
összetett esemény pontosan akkor következik be, ha az ω₂, ω₄ és ω₆ (egymást kizáró) elemi események közül az egyik bekövetkezik.

Ha az A, B⊆Ω események egyenlőek (A=B), akkor A pontosan akkor következik be, amikor B bekövetkezik. Az A⊆Ω esemény B=Ω∖A kiegészítő vagy komplementer eseménye pontosan akkor következik be, amikor A nem következik be. A B⊆Ω esemény maga után vonja az A⊆Ω eseményt (másképpen a B eseményből következik az A esemény), ha B⊆A teljesül. Ebben az esetben ha B bekövetkezik, akkor A is bekövetkezik (de ha B nem következik be, akkor ebből A bekövetkezésére vonatkozóan semmilyen következtetést nem tudunk levonni).

A "B-ből következik A" relációt például a logikában megszokott módon B⊃A vagy B⇒A formában jelölhetjük. A valószínűségszímítás szakirodalmában szokásos a B⊂A jelölés is, de a jelölések inkonzisztenciájának elkerülése miatt a halmazelméletben megszokott B⊆A jelölés sokkal jobb választásnak tűnik.

Az eseményalgebrában az események közötti műveleteket mint (rész)halmazok közötti műveleteket értelmezzük, és a következőképpen nevezzük, ill. jelöljük:
– az A, B⊆Ω események összege az A+B = { ω∈Ω | ω∈A ∨ ω∈B} esemény;
– az A, B⊆Ω események szorzata az A*B = { ω∈Ω | ω∈A ∧ ω∈B} esemény (megjegyzés: az A és B események szorzatát a szakirodalomban AB módon is jelölik);
– az A, B⊆Ω események különbsége az A−B = { ω∈Ω | ω∈A ∧ ω∉B} esemény.
(Két esemény különbsége A−B=A*B módon is kifejezhető.)

Az A, B⊆Ω események egymást (kölcsönösen) kizáró események, ha A*B=∅ teljesül.

Az A₁, A₂, ..., A_k⊆Ω események teljes eseményrendszert alkotnak, ha
– A₁+A₂+ ... +A_k=Ω és
– A_i*A_j=∅ (1≤i<j≤k)
teljesül. A definícióból következik, hogy egy teljes eseményrendszert alkotó események közül mindig pontosan egy következik be.

Intuitíven két eseményt függetlennek nevezünk, ha az egyik bekövetkezése "nem befolyásolja" a másik bekövetkezését. Azonban pusztán eseményalgebrai eszközökkel ezt nem tudjuk egzakt módon értelmezni.

A valószínűség fogalma

Ha egy kísérletet n-szer megfigyelünk vagy végrehajtunk, és a kísérlet eseményalgebrai modelljében az A esemény k-szor következik be, a k_A értéket az A esemény gyakoriságának, az

A valószínűségre vonatkozó axiómák a következők (A. N. Kolmogorov nyomán, 1933):

(1) Legyen Ω egy eseménytér. Az eseménytér minden A⊆Ω eseményéhez hozzárendelünk egy P(A) valós számot, amelyet az esemény valószínűségének nevezünk. A valószínűség 0 és 1 közötti érték, azaz bármely A⊆Ω esemény esetén 0≤P(A)≤1 teljesül.

(2) A biztos esemény valószínűsége 1, azaz P(Ω)=1 teljesül.

(3) Ha A₁, A₂, ..., A_k egymást páronként kizáró események (azaz A_i*A_j=∅, 1≤i<j≤k), akkor P(A₁+A₂+ ... +A_k) = P(A₁)+P(A₂)+ ... +P(A_k) teljesül.

Megjegyzés: a továbbiakban a "valószínűség" helyett néha használni fogjuk a rövidebb "valség" megnevezést is.

Az axiómákból számos fontos összefüggés levezethető. Legyenek A, B⊆Ω tetszőleges események. Ekkor teljesülnek az alábbi összefüggések:

Az utolsó összefüggés levezetése:

P(A+B)=P(A−B)+P(B−A)+P(A*B), de mivel
P(A−B)=P(A)−P(A*B) és
P(B−A)=P(B)−P(A*B) teljesül, ezért
P(A+B)=P(A)−P(A*B)+P(B)−P(A*B)+P(A*B), ezt egyszerűsítve
P(A+B)=P(A)+P(B)−P(A*B), q.e.d.

Események függetlensége

Az A, B⊆Ω eseményeket függetleneknek nevezzük, ha P(A*B) = P(A)*P(B) teljesül. Ebből következik, hogy a biztos és a lehetetlen esemény minden eseménytől független; továbbá az, hogy az egymást kizáró és pozitív valségű események nem lehenek függetlenek.

Legyenek A, B⊆Ω események, és legyen B egy pozitív valószínűségű esemény (azaz P(B)>0 teljesül). Tegyük fel, hogy a B esemény bekövetkezett; ilyen feltétel mellett az A esemény bekövetkezését jelöljük A|B-vel.

Az A|B esemény az A esemény leszűkítését jelenti az Ω|B eseménytérre, azaz B = { ω₁, ω₂, ..., ω_m } esetén
A|B = { ω∈A | ω∈ B }
teljesül. Ez értelemszerűen megfelel az Ω eseménytéren az
A*B = { ω∈Ω | ω∈A ∧ ω∈ B }
eseménynek.

Megjegyzések:
(1) Legyen az Ω eseménytéren a B esemény valsége P(B) (a B esemény az Ω|B eseménytéren a biztos esemény, tehát a B esemény valsége P_B=1.) Ekkor az Ω|B eseménytér elemi eseményeinek valsége P_B(ω)=P(ω)/P(B), mivel az Ω|B eseménytéren az elemi események valségének az összege 1 kell, hogy legyen. (Feltételezzük, hogy a B esemény bekövetkezése nem befolyásolja az ω_i elemi események valségét.)
(2) Az Ω_B=Ω|B eseménytérre való leszűkítés minden A⊆Ω eseménynek az A*B⊆Ω ↔ A|B⊆Ω_B eseményt felelteti meg. Ebből azonban nyilvánvalóan nem következik az, hogy P_B(A|B)=P(A*B), mivel az A|B és A*B eseményeket, valamint a P_B és P valószínűségeket más eseménytéren értelmezzük.

Az A esemény B eseményre vonatkozó feltételes valószínűsége alatt az A|B eseménynek az Ω|B eseménytéren vett valószínűségét, azaz P_B(A|B)-t értjük, és P_B(A|B)=P(A*B)/P(B) módon definiáljuk. (Ez a definíció teljes összhangban van a valószínűség klasszikus kiszámítási módjával (ld. később; vö. Csatlósné 1996: 173-174). Ez azonban hallgatólagosan feltételezi, hogy az Ω eseménytér leszűkítése az Ω_B eseménytérre, azaz a B esemény megfigyelése nem változtatja meg a valószínűségi viszonyokat.) A továbbiakban, ha nem okoz félreértést, P_B(A|B) helyett egyszerűen P(A|B)-t írunk.

A feltételes valószínűség definíciójából P(A*B)=P(A|B)*P(B) következik. Ebből viszont az következik, hogy független események esetén (P(A*B)=P(A)*P(B) és P(B)>0 miatt) P(A|B)=P(A) teljesül.

Tekintsük a következő példát: legyen 3 tyúkunk (ezek halmaza {A,B,C}) és 2 kacsánk (ezek halmaza pedig {X,Y}). Válasszunk két állatot egymás után úgy, hogy a kiválasztott állatot mindig visszatesszük. Mivel egymás után választunk, a kiválasztás sorrendje számít, azaz pl. (A,X) és (X,A) különböző elemi események. Ezért összesen 5*5=25 lehetséges elemi eseményünk van.
Legyen például a 'D' esemény az, hogy egy tyúkot és egy kacsát választottunk (a kiválasztás sorrendjétől függetlenül). A 'D' esemény 3*2+2*3=12 választás esetén következhet be, vagyis P(D)=12/25.
Ezek után legyen az 'E' esemény az, hogy elsőre tyúkot választottunk. Az 'E' esemény 3*5=15 választás esetén következhet be, vagyis P(E)=15/25=3/5.
Az 'F' esemény pedig legyen az, hogy az első kiválasztott állat megegyezik a másodikkal (azaz a két választás megegyezik). Az 'F' esemény 5 választás esetén következhet be, vagyis P(F)=5/25=1/5.
Mivel az E*F esemény nyilvánvalóan 3 választás esetén következhet be, ezért P(E*F)=3/25. De P(E)=3/5 és P(F)=1/5 miatt P(E*F)=P(E)*P(F), vagyis az 'E' és az 'F' események egymástól függetlenek.
Vizsgáljuk meg az E|F feltételes eseményt. Mivel Ω_F 5 elemi eseményből áll, amiből az (A,A), (B,B) és (C,C) elemi események alkotják az E|F eseményt, ezért P(E|F)=3/5, ami megegyezik P(E)-vel.
Vizsgáljuk meg az F|E feltételes eseményt is. Mivel Ω_E 15 elemi eseményből áll, amiből az (A,A), (B,B) és (C,C) elemi események alkotják az F|E eseményt, ezért P(E|F)=3/15=1/5, ami megegyezik P(F)-vel.

Írjuk a P(A*B)=P(A|B)*P(B) képletbe az A*B esemény helyett az A₂*A₁ eseményt, ekkor
P(A₂*A₁)=P(A₂|A₁)*P(A₁)
adódik. Ezt három eseményre általánosítva P(A₃*A₂*A₁) = P(A₃|A₂*A₁)*P(A₂*A₁) miatt
P(A₃*A₂*A₁) = P(A₃|A₂*A₁)*P(A₂|A₁)*P(A₁)
adódik (és ez könnyen tovább általánosítható akár 'n' eseményre is). A képlet egy lehetséges alkalmazására később egy példát is adunk.

Ha az A, B⊆Ω események függetlenek, akkor P(A*B)=P(A)*P(B) teljesül, tehát a feltételes valószínűség definíciójából P_B(A|B)=P(A) és P_A(B|A)=P(B) következik.

Tegyük fel, hogy a B₁, B₂, ..., B_k⊆Ω események teljes eseményrendszert alkotnak, és az A⊆Ω eseményre ismertek a P(A|B_i) feltételes valószínűségek (1≤i≤k). Ekkor

Tegyük fel, hogy a B₁, B₂, ..., B_k⊆Ω események teljes eseményrendszert alkotnak, P(B_i)>0 (1≤i≤k), A⊆Ω tetszőleges esemény, amelyre P(A)>0, és ismertek a P(A|B_i) feltételes valószínűségek (1≤i≤k). Ekkor

Tekintsük az alábbi példát (Bíró-Vincze 2010: 364-365). Egy üzemben egy terméket négy különböző géppel állítanak elő. Az első gép a termékek 20 százalékát, a második és harmadik 25 százalákát, a negyedik pedig 30 százalékát álltja elő. Emellett még azt is tudjuk, hogy az első gép selejtszázaléka 2%, a másodiké 1.5%, a harmadiké 2.5%, a negyediké pedig 1%.
Jelentse 'A' azt az eseményt, hogy egy kiválasztott termék selejtes. Keressük 'A' valségét, továbbá annak a valségét, hogy a kiválasztott terméket a negyedik gép gyártotta.
    (1) Ha B_i jelenti azt, hogy a kihúzott terméket az i-dik gép állította elő (1≤i≤4), akkor P(B₁)=0.20, P(B₂)=0.25, P(B₃)=0.25, P(B₄)=0.30 teljesül.
    (2) Mivel az első gép selejtszázaléka 2% (=0.02), a másodiké 1.5% (=0.015), a harmadiké 2.5% (=0.025), a negyediké 1% (=0.01), ezért az 'A' selejtes termék kihúzásának feltételes valsége P(A|B₁)=0.020, P(A|B₂)=0.015, P(A|B₃)=0.025, P(A|B₄)=0.010 gépenként.
    (3) A fentieket felhasználva az 'A' selejtes termék valségére a teljes valószínűség tétele alapján P(A) = P(A|B₁)*P(B₁) + P(A|B₂)*P(B₂) + P(A|B₃)*P(B₃) + P(A|B₄)*P(B₄) = 0.017 adódik.
    (4) Annak a valsége, hogy az 'A' esemény teljesülése mellett a kiválasztott selejtes terméket a negyedik gép gyártotta, a Bayes-tétel alapján számítható ki P(B₄|A) = P(A|B₄)*P(B₄) / P(A) ≈ 0.176 módon.

Klasszikus valószínűségi mező

Az Ω = { ω₁, ω₂, ..., ω_n } véges, n elemből álló eseményteret és a rajta értelmezett P : 2^Ω → [0,1]⊆ℝ valószínűséget klasszikus valószínűségi mezőnek nevezzük, ha minden elemi esemény azonosan valószínű, azaz P(ω_i)=P(ω_j) (0≤i<j≤n) teljesül.

Ha Ω klasszikus valószínűségi mező, amelyre ∣Ω∣=n, akkor minden ω∈Ω elemi eseményre P(ω)=1/n teljesül.
Ha pedig A={ ω₁, ω₂, ..., ω_k }⊆Ω tetszőleges esemény, amelyre ∣A∣=k, akkor az A esemény valószínűsége

Az előzőek alkalmazására tekintsük a következő példát. Egy 32 lapos magyar kártyából egymás után három lapot húzunk (visszatevés nélkül). Számítsuk ki annak a valségét, hogy az első kihúzott lap hetes lesz (A₁), a második kilences lesz (A₂), és a harmadik hetes lesz (A₃)? (Solt 1971: 134-135).
Első megoldás:
    (1) Mivel a 32 lapos magyar kártyában 4 db. hetes van, ezért a valség klasszikus kiszámítási módja alapján P(A₁)=4/32=1/8 adódik. (Ha a klasszikus Ω={(ω_i,ω_j,ω_k) | 1≤i,j,k≤32} eseménytérben minden elemi esemény azonos 32*32*32 valségű, akkor ebben az esetben is P(A₁)=4*32*32/(32*32*32)=1/8 adódik.)
    (2) Mivel a 32 lapos magyar kártyában 4 db. kilences van, ezért a hetes kihúzása (A₁) után a valség klasszikus kiszámítási módja alapján P(A₂|A₁)=4/31 adódik.
    (3) Mivel a 32 lapos magyar kártyában 4 db. hetes van, ezért a hetes és a kilences kihúzása (A₁*A₂) után a valség klasszikus kiszámítási módja alapján P(A₃|A₁*A₂)=3/30=1/10 adódik.
    Tehát a keresett valószínűségre P(A₃*A₂*A₁) = P(A₃|A₂*A₁)*P(A₂|A₁)*P(A₁) = (1/10)*(4/31)*(1/8) = 1/620 adódik.
Második megoldás:
A valség klasszikus kiszámítási módja alapján a kedvező esetek száma k=4*4*3, az összes eset száma pedig n=32*31*30, amiből közvetlenül adódik a P=k/n=1/620 valószínűség.

Egy másik példa a következő. Egy kockadobás során jelölje 'A' azt az eseményt, hogy 6-nál kisebbet dobunk, azaz legyen A={1,2,3,4,5}. Másrészt jelölje 'B' azt az eseményt, hogy páros számot dobunk, azaz B={2,4,6}. Mekkora a valószínűsége annak, hogy ha páros számot dobunk, akkor az eredmény 6-nál kisebb lesz? (Bíró-Vincze 2010: 360)
Megoldás:
    A valség klasszikus kiszámítási módja alapján P(B)=1/2 és P(A*B)=2/6=1/3, ezért a feltételes valség definíciója alapján a keresett valségre P(A|B)=P(A*B)/P(B)=2/3 adódik.
(A feladat értelmezésekor először leszűkítettük az eseményteret a páros számokra, és feltettük, hogy ezek azonos valószínűségű elemi eseményeket jelentenek. Figyeljük meg, hogy a következő valószínűségeloszlás (ld. később) mellett
    P(1)=0, P(2)=1/3, P(3)=0, P(4)=1/3, P(5)=0, P(6)=1/3
P(A*B)=P(2)+P(4)=2/3 adódik, vagyis ugyanarra a megoldásra jutunk.)
A feladat megfordítása:
    A feladat értelmezésekor nagyon fontos, hogy melyik az az esemény, amelynek alapján a feltételes valséget képezzük. Ha ugyanis annak a valségét keressük, hogy ha 6-nál kisebb számot dobunk (A), akkor az eredmény páros lesz (B), más eredményre jutunk. A valség klasszikus kiszámítási módja alapján P(A)=5/6 és P(A*B)=2/6, ezért a keresett valségre a feltételes valség definíciója alapján P(B|A)=P(A*B)/P(A)=2/5 adódik.
(A feladat értelmezésekor először leszűkítettük az eseményteret a 6-nál kisebb számokra, és feltettük, hogy ezek azonos valószínűségű elemi eseményeket jelentenek. Figyeljük meg, hogy a következő valószínűségeloszlás (ld. később) mellett
    P(1)=1/5, P(2)=1/5, P(3)=1/5, P(4)=1/5, P(5)=1/5, P(6)=0
P(A*B)=P(2)+P(4)=2/5 adódik, vagyis ugyanarra a megoldásra jutunk.)
Kiegészítés:
    Ha annak a valségét keressük, hogy páros és 6-nál kisebb számot fogunk dobni, a valségre a klasszikus kiszámítási mód alapján (feltéve, hogy minden dobás azonosan valószínű) egyszerűen P(A*B)=2/6=1/3 adódik.

Klasszikus valószínűségeloszlások

Legyen A₁, A₂, ..., A_k⊆Ω teljes eseményrendszer. A teljes eseményrendszer valószínűségeinek sorozatát valószínűségeloszlásnak (vagy ha nem okoz félreértést, egyszerűen eloszlásnak) nevezzük (Rényi 1973: 83). Ennek megfelelően a

p₁=P(A₁), p₂=P(A₂), ..., p_k=P(A_k)

valószínűségek sorozata egy valószínűségeloszlás, amelyre

Korábban láttuk, hogy ha az Ω = { ω₁, ω₂, ..., ω_n } véges eseménytér klasszikus valószínűségi mező, akkor az ω₁, ω₂, ..., ω_n elemi események valószínűségeire p₁ = p₂ = ... = p_n = 1/n teljesül. Ilyenkor egyenletes eloszlásról beszélünk.

Nézzünk meg két típusfeladatot, amelyek a gyakorlatban jól használható valószínűségeloszlásokhoz vezetnek.

visszatevés nélküli mintavétel

Legyen 'N' darab termékünk, és legyen ezek között 's' darab selejt (1≤s≤N). Vegyünk a termékekből egy 'n' elemű mintát (1≤n<<N) egyszerre vagy egymás után, de visszatevés nélkül. Határozzuk meg annak a valségét, hogy ezek között 'k' darab selejt lesz (0≤k≤s, 0≤k≤n) (Reimann-Tóth 1985: 26-27). A megoldás:

(a) Ha az 'n' elemű minta elemeit egyszerre ("közvetlenül") vesszük ki (vagyis a kiválasztott elemek sorrendje nem számít), a képlet a valség klasszikus kiszámítási módja alapján a következőképpen kapható meg:
– a mintában 'k' darab különböző selejtes termék van, amelyeket az összes 's' darab selejtes termékből választunk; a kiválasztott selejtek sorrendje nem lényeges, ezért az összes kiválasztás számát 's' k-ad rendű ismétlés nélküli kombinációja adja, vagyis k1=(^s _k);
– az 'n' elemű mintában (n−k) darab különböző nem selejtes termék van; ezeket az összes (N−s) darab nem selejtes termékből választjuk ki úgy, hogy a kiválasztott termékek sorrendje nem lényeges, ezért az összes ilyen kiválasztás számát (N−s) (n−k)-ad rendű ismétlés nélküli kombinációja adja, vagyis k2=(^N−s _n−k);
– minden lehetséges 'k' elemű selejtcsoporthoz tartozhat minden lehetséges (n−k) elemű nem selejtes termékcsoport; az összes variációs lehetőséget a kiválasztások számának szorzata adja, vagyis k1*k2;
– a kedvező esetek száma tehát (^s _k)*(^N−s _n−k);
– az 'n' elemű mintában különböző termékek vannak, és ezek sorrendje nem lényeges, ezért az összes minta (az összes eset) számát 'N' elem n-ed rendű ismétlés nélküli kombinációja adja, vagyis (^N _n);
– ha a kedvező esetek számát elosztjuk az összes esetek számával, a fenti képlet adódik.

(b) Ha egyenként, visszatevés nélkül vesszük ki a mintaelemeket (és a kiválasztott elemek sorrendje számít), akkor a következőképpen számolhatunk:
    (1) Ha először egymás után 'k' darab selejtet húzunk, akkor ezt k₁=s!/(s−k)! módon tehetjük meg (ismétlés nélküli variáció);
    (2) Ha ezután egymás után (n−k) darab minőségi (nem selejtes) terméket húzunk, akkor ezt k₂=(N−s)!/((N−s)−(n−k))! módon tehetjük meg (ismétlés nélküli variáció);
    (3) mivel (1) minden lehetséges esetéhez (2) minden lehetséges esete tartozhat, a lehetséges esetek száma összeszorzódik, azaz k₃=k₁*k₂;
    (4) az 's' darab selejtet az 'n' elemű mintában "bárhol" megkaphatjuk, vagyis k₄= n alatt k

*k₃ (ismétléses permutáció, vagy ismétlés nélküli kombináció).
A kedvező esetek számára (némi számolás után) k_Σ=*n! adódik.
Az összes eset könnyen megkapható, mivel 'N' termékből 'n' darab mintaelemet veszünk egymás után, visszatevés nélkül (ismétlés nélküli variáció), vagyis n_Σ=N!/(N-n)! adódik.
A valószínűség klasszikus kiszámítási módja alapján P(k)=k_Σ/n_Σ, ami, ha az n! értékét "átvisszük" a tört nevezőjébe, éppen a fenti képletet adja, vagyis a P(k) valségek kétféle kiszámítási módja ugyanahhoz az értékhez vezet.

Legyen k_max=min(n,s), ekkor világos, hogy az n elemű mintában 0≤k≤k_max selejt fordulhat elő. Tehát a valószínűségek

P(0), P(1), ..., P(k_max)

sorozata valószínűségi eloszlást alkot (ld. hipergeometrikus eloszlás).

Egy tipikus példa hipergeometrikus eloszlásra a lottóhúzás. Ekkor P(0) annak a valsége, hogy nem volt egy találatunk sem, P(1) annak a valsége, hogy egy találatunk volt, ..., és P(5) annak a valsége, hogy ötös találatunk lett a lottón.

visszatevéses mintavétel

Legyen 'N' darab termékünk, és legyen ezek között 's' darab selejt (1≤s≤N). Vegyünk ki a termékekből egymás után 'n' darabot (1≤n<<N), és a kivett terméket minden alkalommal tegyük is vissza. Határozzuk meg annak a valségét, hogy ezek között 'k' darab selejt lesz (0≤k≤s, 0≤k≤n) (Reimann-Tóth 1985: 27-28). A megoldás:

A fenti formulában ismétléses variációt használtunk, azaz ha s₁ és s₂ két különböző selejt, és m₁, m₂, ..., m_(n−2) tetszőleges termékek, akkor pl. n=4, k=2 esetén az (s₁,s₂,m₁,m₂) és az (s₂,s₁,m₁,m₂) minták különbözőek lesznek.

A fenti formula számlálójában szereplő binomiális együttható n elem összes ismétléses permutációjának számát adja k és (n−k) azonos elem mellett. Ez a k darab selejtet és n−k darab nem selejtes terméket adó különböző minták számát adja meg, ha a mintavételek sorrendje számít, azaz pl. n=4, k=2 esetén az (s,s,n,n) és az (n,s,n,s) minták különbözőek lesznek.

Adott N, s és n mellett, továbbá k_max=min(n,s) jelöléssel az n elemű mintában 0≤k≤k_max selejt fordulhat elő. Tehát a valószínűségek

P(0), P(1), ..., P(k_max)

sorozata valószínűségi eloszlást alkot (ld. binomiális eloszlás).

Adjunk egy példát binomiális eloszlásra. Legyen egy akváriumban N darab hal, amelyek össze-vissza (azaz "véletlenszerűen") úszkálnak. A halak között van 's' darab aranyhal. Gondolatban válasszuk ki azokat a halakat, amelyek közel jönnek hozzánk, és addig figyeljük őket, amíg 'n' halat nem láttunk (tegyük fel, hogy s>n teljesül). Ekkor P(0) annak a valsége, hogy a megfigyelt halak közt nem volt aranyhal, P(1) annak a valsége, hogy a megfigyelt halak közt egy aranyhal volt, ..., P(n) pedig annak a valsége, hogy a megfigyelt halak közt 'n' darab aranyhal volt, azaz minden megfigyelt hal aranyhal volt. (Jegyezzük meg, hogy ha megfigyelt halakat kivennénk az akváriumból, hipergeometrikus eloszlást kapnánk.)

A binomiális eloszlás valószínűségi értékeit például az alábbi programmal írathatjuk ki:

Ábrázoljuk egy hisztogramon a binomiális eloszlás valószínűségértékeit (n=6 paraméter mellett).

Gyakorló feladatok (vö. Szabó 1996: 89-90; Bognárné et al. 1971: 42-43)

(1) Válasszunk ki 10 számjegyet a {0,1,2,...,9} decimális számjegyek közül úgy, hogy megengedjük a számjegyek ismétlődését, és a számjegyek sorrendjét nem vesszük figyelembe.

(1.2) Ha A ⇋ "csupa páros számot választottunk" és B ⇋ "csupa prímszámot választottunk", mi a jelentése az A+B eseménynek?

(1.3) Ha B ⇋ "csupa prímszámot választottunk" és D ⇋ "csupa 5-tel osztható számot választottunk", mi a jelentése a B*D eseménynek?

(1.4) Ha A ⇋ "csupa páros számot választottunk" és C ⇋ "csupa páratlan számot választottunk", mi a jelentése az A+C eseménynek?

(1.5) Ha C ⇋ "csupa páratlan számot választottunk" és D ⇋ "csupa 5-tel osztható számot választottunk", mi a jelentése a C*D eseménynek?

(2.2) Ha A ⇋ "a kiválasztott tanuló fiú", B ⇋ "a kiválasztott tanuló nem dohányzik" és C ⇋ "a kiválasztott tanuló kollégista", mi a jelentése az A*B*C eseménynek?

(2.3) Ha A ⇋ "a kiválasztott tanuló fiú", B ⇋ "a kiválasztott tanuló nem dohányzik" és C ⇋ "a kiválasztott tanuló kollégista", milyen feltételek mellett teljesül az
A*B*C=A
összefüggés?

(2.4) Ha A ⇋ "a kiválasztott tanuló fiú" és B ⇋ "a kiválasztott tanuló nem dohányzik", milyen feltételek mellett teljesül az
A=B
összefüggés?

(4) Egy 32 lapos magyar kártya csomagból véletlenszerűen kihúzunk egy lapot. Mekkora annak a valsége, hogy

(4) Egy 32 lapos magyar kártya csomagból véletlenszerűen kihúzunk (kiosztunk) 8 lapot. Mekkora annak a valsége, hogy

Az (5.1) feladat egy lehetséges megoldása a következő:
Az öt lottószámot 90 alatt 5

féleképpen lehet kihúzni. Ha egy "feladott" szelvényen öt számot adtunk meg, a kérdés az, hogy elvileg hány olyan lottószelvény létezik, amelyen a megadott számokból legalább kettő szerepel (ti. ezek lesznek a számunkra "kedvező" esetek). Egyrészt az öt számból a két kihúzott számot

féleképpen tudjuk kiválasztani; másrészt pedig ezekhez a fennmaradó 88 számból

féleképpen választhatunk tetszőleges további három számot (megengedve azt is, ha pl. mind az öt számot eltaláljuk; ha csak a kettes találatokat vizsgáljuk, 88 helyett 85-öt kell írnunk). Az általunk megadott öt számból legalább két számot tartalmazó lottószelvények száma tehát

darab szelvény. Ezt osztva az összes lottószelvény számával, a keresett valséget kapjuk. Kiszámítva a legalább kettes találat valségére P_a≈0.025, a pontosan kettes találat valségére pedig P_b≈0.022 adódik (vagyis átlagosan kb. 40 szelvényenként várható egy nyeremény).

(6) Adja meg az ötös, a hatos és a skandináv lottóhúzáshoz tartozó valószínűségeloszlásokat!

(7) Egy családban két gyerek van. Feltéve, hogy az egyik gyerek fiú, mennyi a valsége, hogy mindkét gyerek fiú?

(8) Egy 5 piros és 5 fehér golyót tartalmazó urnából egymás után (visszatevés nélkül) kihúzunk 3 golyót. Feltéve, hogy az első két húzás eredménye ugyanaz, mennyi a valsége, hogy a harmadik húzás piros?

Valószínűségi változók

Legyen Ω = { ω₁, ω₂, ..., ω_n } eseménytér. Ekkor az elemi események halmazán értelmezett

ξ : Ω → ℝ

függvényt valószínűségi változónak (röviden valségi változónak) nevezzük. Például az A⊆Ω eseményhez rendelt ξ_A indikátorváltozó, amelyet

Egy ξ valségi változó leképezi az Ω eseményteret a valós számok halmazára. (Szemléletesen kifejezve a ξ valségi változó "számszerűsíti" az elemi eseményeket.) Ha ξ injektív leképezés, akkor a Rng(ξ)⊆ℝ értékkészlet minden elemének egyértelműen megfeleltethető egy elemi esemény. Például ha kockadobás esetében ξ(ω) ⇋ "az ω dobásnak megfelelő szám" akkor az {1, 2, 3, 4, 5, 6} halmaz minden eleme kölcsönösen egyértelműen megad egy elemi eseményt.

Ha viszont a ξ valségi változó nem injektív, akkor a Rng(ξ)⊆ℝ értékkészlet minden x∈Rng(ξ) elemének az Ω egy részhalmaza, azaz egy 'A_x' esemény feleltethető meg A_x=ξ⁻¹(x)⊆Ω módon. (Vagyis az A_x eseményt azok az ω∈Ω elemi események alkotják, amelyekre ξ(ω)=x teljesül.)

Egy valószínűségi változót diszkrétnek nevezünk, ha értékkészlete véges, vagy megszámlálhatóan végtelen (azaz az általa felvett értékek sorozatba rendezhetőek). Egy valószínűségi változót folytonosnak nevezünk, ha a változó tetszőleges valós számértéket felvehet, értékkészlete "bármilyen valós számértéket tartalmazhat" (Wikipédia). (A folytonos valségi változók értékkészlete előállítható egy vagy (megszámlálhatóan) sok intervallum egyesítéseként (azaz az értékkészlet ún. Borel-halmazt alkot). Másképpen megfogalmazva tetszőleges x∈ℝ esetén a {ξ<x}={ω∈Ω | ξ(ω)<x} halmaz eseményt alkot, vö. Bíró-Vincze 2010: 367)

Legyen ξ : Ω → ℝ valségi változó, és legyen A_x⊆Ω az az esemény, amelyre
A_x = { ω∈Ω | ξ(ω)=x }
teljesül. A továbbiakban az A_x eseményt { ξ=x } módon jelöljük. Hasonló módon definiálhatjuk a { ξ<x }, { a≤ξ<b } stb. eseményeket is. Az ilyen módon definiált események valségét röviden P(ξ=x), P(ξ<x) stb. módon fogjuk jelölni. Több esemény esetén az események szorzata (azaz metszete) helyett használni fogjuk a vessző operátort, például az
{ a≤ξ<b }*{ c≤ξ<d }
esemény valségét P( a≤ξ<b, c≤ξ<d ) módon fogjuk jelölni.

Legyenek ξ : Ω → ℝ és η : Ω → ℝ ugyanazon az eseménytéren értelmezett valségi változók. A ξ és η valségi változókat függetleneknek nevezzük, ha
∀ x∈ℝ ∀ y∈ℝ ( P(ξ<x, η<y)=P(ξ<x)*P(η<y) )
teljesül. Több valségi változó (teljes) függetlensége az egyes valségi változók páronkénti függetlenségét jelenti.

Eloszlásfüggvény

Legyen ξ : Ω → ℝ valségi változó. A ξ valségi változó eloszlásfüggvénye alatt azt az F_ξ : ℝ → [0,1] függvényt értjük, amelyre minden x∈ℝ valós szám esetén F_ξ(x)=P(ξ<x) teljesül.

Legyen ξ : Ω → ℝ valségi változó, F_ξ(x) pedig ennek az eloszlásfüggvénye. Ekkor bármilyen a, b∈ℝ, a<b valós számok esetén
(1) P(ξ<a)=F_ξ(a),
(2) P(ξ≥a)=1−F_ξ(a),
(3) P(a≤ξ<b)=F_ξ(b)−F_ξ(a)
teljesül.

Emeljük ki, hogy tetszőleges a<b∈ℝ valós számok esetén
– a { ξ<b } esemény valószínűségét az eloszlásfüggvény ismeretében F_ξ(b) módon, és
– az { a≤ξ<b } esemény valószínűségét az eloszlásfüggvény ismeretében F_ξ(b)−F_ξ(a) módon
kaphatjuk meg.

Legyen ξ : Ω → ℝ valségi változó, F_ξ : ℝ → [0,1] pedig ennek az eloszlásfüggvénye. Ekkor az F_ξ(x) valós függvényre teljesül, hogy
(a) monoton növekedő,
(b) az értelmezési tartomány minden pontjában balról folytonos,
(c) −∞-ben vett határértéke 0, és
(d) +∞-ben vett határértéke 1.

Az eloszlásfüggvényt egyes esetekben
F_ξ(x)=P(ξ≤x)
módon definiálják, azaz a P(ξ≤x) valószínűségben megengedik az egyenlőséget is. Ekkor a függvény jobbról folytonos lesz. Az angol és a német szakirodalom az eloszlásfüggvényeket rendszerint így értelmezi. Kolmogorov nyomán például Magyarországon általában a szigorú egyenlőtlenséget használják. (Wikipédia)

A valószínűségi változók jellemzésére meghatározott jellemzőket fogunk használni, például
– a valószínűségi változó várható értéke az az érték, amely körül feltételezésünk szerint nagy számú kísérletet elvégezve a valségi változó értéke ingadozni fog;
– a valószínűségi változó szórása pedig az az érték, amely körül feltételezésünk szerint nagy számú kísérletet elvégezve a valségi változó értékének a várható értéktől való eltérése (abszolút értékben) ingadozni fog.

Ha a ξ : Ω → { x₁, x₂, ..., x_k, ... } valószínűségi változó diszkrét, akkor a {p_i=P(ξ=x_i) | i=1,2,...} számsorozat adja a ξ valségi változó eloszlását, amelynek segítségével definiálhatjuk a ξ változó jellemzőit (pl. várható értékét, szórásnégyzetét stb.). Egy diszkrét valségi változó eloszlása például hisztogram segítségével ábrázolható (pl. úgy, hogy a valségi változó lehetséges értékeit felvesszük az 'x' tengelyen, és az egyes értékek felett az értékek valószínűségeivel azonos (vagy arányos) magasságú téglalapokat rajzolunk).
Ha a ξ : Ω → ℝ valószínűségi változó F_ξ : ℝ → [0,1] eloszlásfüggvénye folytonos, és (véges számú hely kivételével) differenciálható, akkor az f(x)=F'(x) deriváltfüggvényt a ξ valségi változó sűrűségfüggvényének nevezzük. A sűrűségfüggvény segítségével definiálhatjuk egy ξ folytonos valségi változó meghatározott jellemzőit (például várható értékét, szórásnégyzetét stb.). A folytonos valségi változókat, ha létezik a sűrűségfüggvényük, rendszerint nem az eloszlásfüggvényükkel, hanem a sűrűségfüggvényükkel definiáljuk.

Diszkrét valószínűségi változók

eloszlás, eloszlásfüggvény

Legyen ξ : Ω → { x₁, x₂, ..., x_k, ... } diszkrét valségi változó. A ξ diszkrét valségi változó eloszlása alatt a

{ p₁=P(ξ=x₁), p₂=P(ξ=x₂), ..., p_k=P(ξ=x_k), ... }

számsorozatot értjük. Mivel az ω_i={ ξ=x_i } események diszjunktak, és
Σ_i ω_i=Ω
teljesül, az eloszlásértékek összege 1, azaz
Σ_i p_i=p₁+p₂+...+p_k+...=1
teljesül.

Például ha három kockával dobunk, akkor az eseménytér
    Ω={(i,j,k) | 1≤i,j,k≤6}.
Ezen az eseménytéren definiálhatjuk a ξ : Ω→{3,4,...,18} diszkrét valségi változót
    ξ(i,j,k)=i+j+k
módon. Az elemi események száma, azaz összes lehetséges eset n=6*6*6=216. A definíció alapján például
    P(ξ=3)=1/n,
    P(ξ=4)=3/n (ugyanis az (1,1,2), (1,2,1) és (2,1,1) elemi események adják a kedvező eseteket),
    stb.

Ábrázoljuk a ξ valségi változó eloszlásának a hisztogramját. A diagram vízszintes tengelyén a valségi változó értékkészletének az elemeit, a függőleges tengelyen pedig az egyes értékek gyakoriságát ábrázoljuk. (Jegyezzük meg, hogy ha a függőleges tengelyen 1-re normáljuk a gyakoriságértékeket, azaz a ξ valségi változó lehetséges értékeinek valószínűségeit ábrázoljuk, akkor a ξ valségi változó sűrűségfüggvényét kapjuk. Ebben az esetben a diagram területe 1 lesz.)

Egy diszkrét valségi változó eloszlásfüggvényének szemléltetésére tekintsük például a kockadobást. Legyen a ξ valségi változó értéke a kockadobással kapott érték. Világos, hogy ξ : Ω → { 1, 2, 3, 4, 5, 6 } diszkrét valségi változó, amelynek eloszlása { p₁=1/6, p₂=1/6, ..., p₆=1/6 }, eloszlásfüggvénye és grafikonja pedig a következő:

x	F_ξ(x)
x≤1	P(ξ<x)=0
1<x≤2	P(ξ<x)=1/6
2<x≤3	P(ξ<x)=2/6
3<x≤4	P(ξ<x)=3/6
4<x≤5	P(ξ<x)=4/6
5<x≤6	P(ξ<x)=5/6
6<x	P(ξ<x)=1

A táblázatból látszik, hogy a ξ diszkrét valségi változó eloszlásfüggvénye lépcsős függvény, amelynek a ξ valségi változó értékei mellett nem megszüntethető szakadása van. Az eloszlásfüggvény szakadási pontjaiban a függvény ugrásának nagysága megegyezik a ξ valószínűségi változó eloszlásának értékével az adott pontban, azaz
P(ξ=x_i)=F(x_i+Δx)−F(x_i) (0<Δx≪1, x₁=1, x₂=2, ..., x₆=6),
ami megegyezik annak a valségével, hogy x_i értéket dobunk. Annak a valsége pedig, hogy 3-nál kisebbet dobunk, az eloszlásfüggvény ismeretében P(ξ<3)=F_ξ(3)=2/6 módon számítható ki.

x	F_{ξ_A}(x)
x≤0	P(ξ_A<x)=0
0<x≤1	P(ξ_A<x)=P(A)=1−P(A)
1<x	P(ξ_A<x)=1

A fentieket általánosan is megfogalmazhatjuk. Legyen ξ : Ω → { x₁, x₂, ..., x_k, ... } diszkrét valségi változó, amelynek eloszlása { p₁, p₂, ..., p_k, ... }, ahol p_i=P(ξ=x_i) (i∈ℕ). Mivel a { ξ=x | x∈Rng(ξ) } események teljes eseményrendszert alkotnak, a ξ változó eloszlásfüggvényére

Például a ξ_A indikátorváltozó eloszlása az {x₁=0, x₂=1} függvényértékek mellett {p₁=1−P(A), p₂=P(A)}, tehát az F_{ξ_A}(x) eloszlásfüggvény értéke például az x=1 pontban
F_{ξ_A}(1)= P(ξ_A<1)= p₁= 1−P(A)
mivel egyedül az x₁ értékre teljesül az x₁<1 feltétel.

várható érték

Legyen ξ : Ω → { x₁, x₂, ..., x_k, ... } diszkrét valségi változó, amelynek eloszlása { p₁, p₂, ..., p_k, ... }. Ekkor a ξ változó várható értéke

Megszámlálhatóan végtelen értékkészlet esetén csak akkor beszélhetünk a ξ valségi változó várható értékéről, ha a fenti összeg létezik (ti. a részletösszegekből álló sorozat konvergens).

Egy diszkrét valségi változó várható értékének szemléltetésére tekintsük ismét a kockadobást. Mivel ekkor a ξ valségi változó értéke a kockadobással kapott érték, a ξ : Ω → { 1, 2, 3, 4, 5, 6 } diszkrét valségi változó eloszlása { p₁=1/6, p₂=1/6, ..., p₆=1/6 }. A várható érték ennek alapján
M(ξ) = (1/6 + 2/6 + 3/6 + 4/6 + 5/6 + 6/6) = 3.5
módon számítható ki. (Hipotézisünk az, hogy elegendően sok kockadobást elvégezve a ξ valségi változó értékei az így kiszámolt érték körül ingadoznak.)

Egy másik példaként számítsuk ki a ξ_A indikátorváltozó várható értékét. Ha p=P(A), akkor definíció szerint
M(ξ_A) = 1*p + 0*(1−p) = p
vagyis a ξ_A indikátorváltozó várható értéke éppen az 'A' esemény valószínűsége.

Legyenek ξ : Ω → { x₁, x₂, ..., x_k, ... } és η : Ω → { x₁, x₂, ..., x_k, ... } diszkrét valségi változók, amelyek várható értéke M(ξ) és M(η). Ekkor teljesülnek az alábbiak:

(1) Ha ξ=c (azaz ξ konstans, vagyis x_i=c minden i∈ℕ esetén), akkor M(ξ)=c teljesül.

Például modellezzük az 'n' elemű visszatevéses mintavételt egy
ξ=ξ_A,1+ξ_A,1+...+ξ_A,n
valségi változóval, ahol a ξ_A,i valségi változók az 'A' esemény (a selejtes termék választásának) indikátorváltozói az i-dik termék választása esetén (i=1,2,...,n). Ekkor M(ξ_A,i)=p (i=1,2,...,n) és a várható érték additivitása miatt M(ξ)=n*p teljesül.

szórás, szórásnégyzet

Legyen ξ : Ω → { x₁, x₂, ..., x_k, ... } diszkrét valségi változó, amelynek várható értéke m=M(ξ). Ekkor a ξ valségi változó szórásnégyzete a (ξ−m)² valségi változó várható értéke, azaz D²(ξ) = M((ξ−m)²). A várható érték definíciója alapján a szórásnégyzet

Megszámlálhatóan végtelen értékkészlet esetén csak akkor beszélhetünk a ξ valségi változó szórásnégyzetéről, ha a fenti összeg létezik (azaz a részletösszegekből álló sorozat konvergens).

Egy diszkrét valségi változó szórásnégyzetének szemléltetésére tekintsük ismét a kockadobást. Mivel ekkor a ξ valségi változó értéke a kockadobással kapott érték, a ξ : Ω → { 1, 2, 3, 4, 5, 6 } diszkrét valségi változó eloszlása { p₁=1/6, p₂=1/6, ..., p₆=1/6 }. A szórásnégyzet a várható érték ismeretében (M(ξ)=m=3.5)
D²(ξ) = (1−3.5)²*1/6 + (2−3.5)²*1/6 + (3−3.5)²*1/6 + (4−3.5)²*1/6 + (5−3.5)²*1/6 + (6−3.5)²*1/6 ≈ 2.92
módon számítható ki. (Hipotézisünk az, hogy elegendően sok kockadobást elvégezve a ξ valségi változó értékeinek a várható értéktől való (abszolút értékben vett) eltérései a D(ξ) ≈ 1.71 érték körül ingadoznak.)

Kockadobás esetén a ξ valségi változó várható értékét és szórásnégyzetét például az alábbi JavaScript programmal számíthatjuk ki:

Egy másik példaként számítsuk ki a ξ_A indikátorváltozó szórásnégyzetét. Korábban láttuk, hogy p=P(A) jelölés mellett az indikátorváltozó várható értékére m=M(ξ_A)=p teljesül, ezért a szórásnégyzet
D²(ξ_A) = (1−p)²*p + (0−p)²*(1−p) = p*(1−p) = p*q
módon számítható ki (q=1−p jelöléssel). Jegyezzük meg, hogy a szórásnégyzet p=q=0.5 esetén maximális (ekkor D²(ξ_A)=1/4).

Legyen ξ : Ω → { x₁, x₂, ..., x_k, ... } diszkrét valségi változó, amelynek várható értéke m=M(ξ). Ekkor teljesülnek az alábbiak:

(3) Ha c∈ℝ tetszőleges szám, akkor, akkor D²(c*ξ) = c²*D²(ξ) teljesül.

Például (1) alapján a kockadobás szórásnégyzete M(ξ)=m=3.5 és
M(ξ²) = (1*1)/6 + (2*2)/6 + (3*3)/6 + (4*4)/6 + (5*5)/6 + (6*6)/6 ≈ 15.17 miatt
D²(ξ) ≈ 15.17 − 3.5² = 15.17 − 12.25 ≈ 2.92
módon számítható ki.

Legyenek ξ : Ω → { x₁, x₂, ..., x_k, ... } és η : Ω → { x₁, x₂, ..., x_k, ... } diszkrét és független valségi változók, amelyek szórásnégyzete D²(ξ) és D²(η). Ekkor D²(ξ+η)=D²(ξ)+D²(η) teljesül.

Kockadobások modellezése (alapértelmezés: 100 dobásból álló sorozatok végrehajtása 100-szor)

x tengely: kockadobások értéke: [1...6]
y tengely: kockadobások relatív gyakorisága: [0,1]

kék és piros vonások: egy dobás esetén a várható értéktől (3.5) való várható eltérés (szórás vagy "hiba") "elméleti" értéke (±1.71)

szürke pontsorok: az egyes dobások relatív gyakoriságai az egyes sorozatokban

Megjegyzés: a sorozatok átlagos várható értékének a hibája csak 1 dobásból álló sorozatok esetén közelíti meg a szórás "elméleti" értékét. Minél több dobásból áll egy sorozat, a várható érték hibájának az értéke egyre kisebb lesz.

kovariancia, korreláció

Legyenek ξ : Ω → {x₁, x₂, ..., x_n} és η : Ω → {y₁, y₂, ..., y_m} diszkrét, véges értékkészletű valségi változók, amelyek várható értéke M(ξ) és M(η), továbbá szórásnégyzete D²(ξ) és D²(η), eloszlásuk pedig
p_i=P(ξ=x_i) (1≤i≤n, i∈ℕ)
és
q_j=P(η=y_i) (1≤j≤n, j∈ℕ).

Legyenek továbbá a
p_ij=P(ξ=x_i, η=y_j) (1≤i≤n, 1≤j≤m, i,j∈ℕ)
értékek az
{ω∈Ω | ξ(ω)=x_i}*{ω∈Ω | η(ω)=y_j}
események előfordulásának valószínűségei (1≤i≤n, 1≤j≤m, i,j∈ℕ).

(1) A ξ és η valségi változók peremeloszlásának nevezzük a
    w_ξ : {x₁, x₂, ..., x_n} → {p_i | 1≤i≤n, i∈ℕ}
    w_ξ(x_i)=p_i (1≤i≤n, i∈ℕ)
és a
    w_η : {y₁, y₂, ..., y_m} → {q_j | 1≤j≤m, i∈ℕ}
    w_η(y_j)=q_j (1≤j≤m, j∈ℕ)
függvényeket.

(2) A ξ és η valségi változók együttes eloszlásának nevezzük a
w_ξη : {x₁, x₂, ..., x_n}Χ{y₁, y₂, ..., y_m} → {p_i_j | 1≤i≤n, 1≤j≤m, i,j∈ℕ}
w_ξη(x_i,y_j)=p_i_j (1≤i≤n, 1≤j≤m, i,j∈ℕ)
függvényt.

A ξ és η valségi változók sztochasztikus kapcsolatának jellemzésére vezessük be a ξ és η valségi változók kovarianciáját és korrelációs együtthatóját.

(3) A ξ és η valségi változók kovarianciája a

Cov(ξ,η) = M[(ξ−M(ξ))*(η−M(η))] = M(ξ*η)−M(ξ)*M(η)

érték, amelyet a w_ξη(x,y) együttes eloszlás ismeretében

(4) A ξ és η valségi változók korrelációs együtthatója az

R(ξ,η) = Cov(ξ,η)/[D(ξ)*D(η)] = [M(ξ*η)−M(ξ)*M(η)]/[D(ξ)*D(η)]

érték.

Ha a ξ és η valségi változók függetlenek, akkor Cov(ξ,η) = 0 és R(ξ,η) = 0 teljesül. Azonban

Ha ξ és η valségi változók függetlenek, akkor az együttes eloszlásra w_ξη(x_i,y_j) = w_ξ(x_i)*w_η(y_j) (1≤i≤n, 1≤j≤m) teljesül.

Ha a ξ és η valségi változók korrelációs együtthatójára R(ξ,η)=±1 teljesül, akkor a valószínűségi változók között lineáris függvénykapcsolat van, azaz
ξ=a*η+b (a, b∈ℝ)
teljesül. (Mj.: a függetlenség "ellentéte", ha két változó között meghatározott függvénykapcsolat van.)

A ξ és η valségi változók várható értéke:
M(ξ)=2*0.5+6*0.5=4
M(η)=4*0.5+10*0.5=7

A ξ és η valségi változók szórásnégyzete:
D²(ξ)=(2-4)²*0.5+(6-4)²*0.5=4 ⇒ D(ξ)=2
D²(η)=(4-7)²*0.5+(10-7)²*0.5=9 ⇒ D(η)=3

Mivel a ξ és η valségi változók korrelációs együtthatója −1, ezért a valségi változók közt lineáris kapcsolat áll fenn. Ennek alakja:

Valószínűségeloszlások

Binomiális eloszlás

A korábban említett példa visszatevéses mintavételre a következő volt: legyen N darab termékünk, és legyen ezek között 's' darab selejt. Vegyünk ki a termékekből egymás után 'n' darabot, és a kivett terméket minden alkalommal tegyük is vissza. Határozzuk meg annak a valségét, hogy ezek között k≤s darab selejt lesz.

Adjuk meg a ξ : Ω → {0, 1, ..., n}⊆ℕ valségi változóval a teljes (n elemű) mintában levő selejtek darabszámát (általánosan fogalmazva a mintavétel során vizsgált, "kedvező" esetek gyakoriságát). Jelöljük egy mintavétel során egy selejt kiválasztásának valségét (a "selejtarányt") p=s/N módon, és egy nem selejtes termék kiválasztásának valségét q=1−p módon. Ekkor az ún. binomiális eloszláshoz jutunk:

Legyen ξ : Ω → {0, 1, ..., n}⊆ℕ binomiális eloszlású valségi változó, amely az 'n' elemű mintavétel során a "kedvező" esetek gyakoriságát adja meg. Ekkor teljesülnek az alábbiak:

(2) M(ξ) = n*p teljesül, vagyis a binomiális eloszlású ξ valségi változó esetén a "kedvező" eseteknek, azaz a 'p' valségű 'A' esemény bekövetkezéseinek ξ gyakorisága 'n' kísérlet során n*p körül, a "kedvező" esetek η=ξ/n relatív gyakorisága pedig a megfigyelt 'A' esemény p_A=p valószínűsége körül ingadozik.

A fenti összefüggés abból is következik, hogy az egyes mintavételeket függetlennek tekintjük, és ha ξ_i=ξ_A,i jelöli az 'A' esemény indikátorváltozóját az i-dik mintavétel során, akkor az 'A' bekövetkezéseinek gyakoriságát megadó ξ valségi változó ξ=ξ₁+ξ₂+...+ξ_n módon állítható elő, ahol M(ξ_i)=M(ξ_A,i)=p, (i=1,2,...,n) teljesül.

(4) D²(ξ) ≤ n/4 teljesül. (Mivel a másodfokú p*q=p*(1−p)=−p²+p függvény akkor a legnagyobb, ha p=0.5 és q=(1−p)=0.5, ezért D²(ξ)≤n*0.5²=n/4 teljesül.)

A Weldon-féle kockadobási kísérlet a következő (Feller 1978: 150-151): Egy kísérlet során 12-szer dobunk egy kockával (vagyis n=12 elemű mintavétel történik), és vizsgáljuk, hányszor dobtunk ötöst vagy hatost. Vagyis az eseménytér Ω=Ω₁xΩ₂x...xΩ₁₂, ahol Ω_i={ω_i1, ω_i2, ..., ω_i6} az i-dik dobás eredménye (i=1,2,...,12). Világos, hogy az elemi események (ω_1,j₁,ω_2,j₂,...,ω_12,j₁₂) alakúak (ahol ω_i,j azt jelenti, hogy az i-dik dobáskor j-t dobtunk).
Vezessük be a ξ:Ω→{0,1,...,12} valségi változót, amely azt adja meg, hogy egy 12 dobásos kísérlet (mintavétel) során hányszor fordultak elő a "jó esetek" (A), azaz hányszor dobtunk ötöst vagy hatost. Az 'A' esemény elméleti valsége egy dobáskor p=1/3, és egy szabályos ("nem cinkelt") kockával dobva a ξ valségi változóra binomiális eloszlást tételezhetünk fel.
A ξ valségi változó kifejezhető az 'A' esemény i-dik dobásra vonatkozó ξ_A,i (i=1,2,...,12) egymástól független indikátorváltozóinak segítségével ξ=ξ_A,1+ξ_A,2+...+ξ_A,12 módon.
Az eredeti Weldon-féle kísérletet ("kézzel") 26306-szor hajtották végre. Modellezzük most ezt a kísérletet számítógéppel és adjuk meg egy táblázatban az 'A' esemény előfordulásának megfigyelt gyakoriságait, valamint a binomiális eloszlásból következő "elméleti" valószínűségeket (azaz a binomiális eloszlású ξ valségi változó k=0, k=1, ..., k=12 értékeinek valségét n=12, p=1/3, q=2/3 paraméterekkel).

A táblázat magyarázata:
– 'k' értéke azt adja meg, hogy egy n=12 dobásos kísérletben hányszor fordult elő a p=1/3 valségű 'A' esemény (azaz esetünkben az 5-ös vagy 6-os dobásnak megfelelő "jó esetek");
– az elméleti valószínűség (B) oszlopban a binomiális eloszlás P(ξ=k) valószínűségei szerepelnek n=12 és p=1/3, q=2/3 paraméterek mellett;
– a relatív gyakoriság (R) oszlopban az 'A' esemény 'k'-szori előfordulásának "megfigyelt" relatív gyakorisága szerepel (26306 kísérlet mellett);
– az utolsó, |B−R| oszlopban pedig az "elméleti" valószínűségek és a kapott relatív gyakoriságok abszolút értékben vett eltérése szerepel.

A táblázatban rózsaszínnel kiemeltük azt a sort, amely egy kísérlet során az elméletileg legvalószínűbb k=4 értékhez tartozik (ekkor P(ξ=4)≈0.2384). A k=4 gyakorisághoz tartozó sor alatt és felett világosabb színnel kiemeltük azokat a sorokat (k=3 és k=5, ill. k=2 és k=6), amelyek a kísérletek eredményeinek "szórása" miatt még várhatóan viszonylag nagyobb gyakorisággal elő fognak fordulni (n=12 és p=1/3 mellett a "jó" esetek száma M(ξ)=n*p=4 körül ingadozik D²(ξ)=n*p*q≈2.667 ⇒ D(ξ)≈1,633 átlagos hibával).

Az 'A' esemény bekövetkezésének "elméletileg" legvalószínűbb gyakoriságát egy kísérlet során a ξ valségi változó M(ξ)=4 várható értéke adja meg. Az ehhez az értékhez tartozó relatív gyakoriságot egy kísérlet során M(ξ)/n=4/12=1/3 módon számíthatjuk ki, amely az indikátorváltozók tulajdonságaiból következő P(A)=M(ξ_A,i) (i=1,2,...,12) miatt, továbbá az egyes dobásokhoz tartozó ξ_A,i indikátorváltozók függetlenségéből következő M(ξ)=M(ξ_A,1)+M(ξ_A,2)+...+M(ξ_A,12)=n*P(A) miatt megegyezik az 'A' esemény P(A)=1/3 valószínűségével.

Ha ξ_i-vel jelöljük azokat a valségi változókat, amelyek egy adott n=12 dobásos kísérletben megadják a "jó esetek", azaz az 'A' esemény gyakoriságát (ahol ξ_i∈{0,1,...,12}, i=1,2,...,26306), akkor az egyes kísérletek során megfigyelt ("empirikus") gyakoriságok átlagát a teljes Weldon-féle kockadobási kísérletben a
    ξ=(ξ₁+ξ₂+...+ξ₂₆₃₀₆)/26306
empirikus várható érték kiszámításával kaphatjuk meg. Ennek megfelelően az 'A' esemény (átlagos) empirikus relatív gyakoriságát egy kísérlet során ξ/n módon számíthatjuk ki (ahol n=12). Az egyes kísérletek során kapott ξ_i gyakorisági értékeket a fenti tört számlálójában csoportosíthatjuk a gyakoriságok aktuális értéke szerint. Ha η_k jelöli azoknak a ξ_i gyakoriságoknak a számát, amelyekre ξ_i=k teljesül (k=0,1,...,n), akkor a fenti összefüggés
    ξ=(η₀*0+η₁*1+η₂*2+...+η_n*n)/26306
módon is felírható (ahol n=12). A táblázat harmadik oszlopában az R=η_k/26306 értékeket ábrázoltuk (k=0,1,...,n).

Jegyezzük meg végül, hogy a ξ valségi változó megfigyelésével kapott átlagos (empirikus) gyakorisági értéknek a megfigyelések során tapasztalt (átlagos) hibáját az
    S²(ξ)=((ξ₁−ξ)²+(ξ₂−ξ)²+...+(ξ₂₆₃₀₆−ξ)²)/26306
empirikus szórásnégyzet kiszámításával kaphatnánk meg (ez azonban a táblázatban nem szerepel).

Hipergeometrikus eloszlás

A korábban említett példa visszatevés nélküli mintavételre a következő volt: legyen N darab termékünk, és legyen ezek között s darab selejt. Vegyünk a termékekből egy n elemű mintát (egyszerre vagy egymás után, de visszatevés nélkül), és határozzuk meg annak a valségét, hogy ezek között k≤s darab selejt lesz.

Adjuk meg a ξ : Ω → {0, 1, ..., n}⊆ℕ valségi változóval a teljes (n elemű) mintában levő selejtek darabszámát. Tételezzük fel továbbá, hogy N (azonos valséggel kiválasztható) termékünk van, és ebben s darab selejt található (1≤s≤N, 1≤n≤N). Ekkor az ún. hipergeometrikus eloszláshoz jutunk:

Általánosítva a hipergeometrikus eloszláshoz vezető feladatot:
– klasszikus valószínűségi mezőt tételezünk fel;
– egy n elemű mintavétel során két kimenetel, A és B lehetséges;
– N termék között s darab A típusú és (N−s) darab B típusú termék található, így az A és B termék kiválasztásának valsége az első mintavétel során p_A=p=s/N és q_B=1−p=q;
– a mintavételek nem függetlenek, minden mintavétel befolyásolja a további mintavételeket, mert egy termék kiválasztásával a még választható termékek száma eggyel csökken ("visszatevés nélküli" mintavétel történik);
– n darab mintát veszünk, és keressük az A kimenetel gyakoriságát (ξ), valamint az A esemény k-szor történő előfordulásának P(ξ=k) valségét (k=0,1,...,n).

Legyen ξ : Ω → {0, 1, ..., n}⊆ℕ hipergeometrikus eloszlású valségi változó. Ekkor
(1) a { ξ=k } események teljes eseményrendszert alkotnak (0≤k≤n);
(2) M(ξ) = n*p (a hipergeometrikus eloszlás várható értéke megegyezik a binomiális eloszlás várható értékével);
(3) D²(ξ) = n*p*q*[1 − (n−1)/(N−1)];
(4) ha n<<N, akkor a hipergeometrikus eloszlás szórásnégyzete közelítőleg megegyezik a binomiális eloszlás szórásnégyzetével (ebben az esetben a hipergeometrikus eloszlást közelíthetjük a binomiális eloszlás segítségével).

Poisson-eloszlás

Legyen ξ : Ω → {0, 1, 2, ..., ∞}=ℕ valségi változó, λ>0 pozitív valós szám. Ekkor az ún. λ paraméterű Poisson eloszlást a következőképpen definiáljuk:

A Poisson-eloszlás "a diszkrét valószínűségeloszlások közül [...] a legfontosabb". Az eloszlást "a kis valószínűségű, vagyis ritka események eloszlástörvényének is nevezik" (Reimann-Tóth 1985: 85).

Legyen ξ : Ω → {0, 1, 2, ..., ∞}=ℕ Poisson-eloszlású valségi változó λ>0 paraméterrel. Ekkor
(1) a { ξ=k } események teljes eseményrendszert alkotnak (k∈ℕ);
(2) M(ξ) = λ (mivel a Poisson-eloszlás várható értéke megegyezik a λ paraméter értékével, a várható értékre vonatkozó becsléssel a λ paraméter statisztikailag megbecsülhető);
(3) D²(ξ) = λ;
(4) ha n→∞ p→0 és n*p=c∈ℝ állandó, akkor

Egyenletes eloszlás (diszkrét)

Legyen ξ : Ω → {x₁, x₂, ..., x_n}⊆ℝ diszkrét valségi változó, n≥1 természetes szám. Ekkor az ún. egyenletes eloszlást a következőképpen definiáljuk:

Általánosítva az egyenletes eloszláshoz vezető feladatot:
– az eseménytér (az elemi események száma) véges;
– minden elemi esemény azonosan valószínű (azaz alkalmazható a valószínűség klasszikus kiszámítási módja).

Legyen ξ : Ω → {x₁, x₂, ..., x_n}⊆ℝ egyenletes eloszlású valségi változó. Ekkor
(1) a { ξ=x_k } események teljes eseményrendszert alkotnak (1≤k≤n);
(2) a ξ egyenletes eloszlású valségi változó várható értéke

Normális eloszlás

Legyen ξ : Ω → ℝ folytonos valségi változó, m∈ℝ tetszőleges valós szám, σ∈ℝ, σ>0 pozitív valós szám. Ekkor az ún. normális eloszlást a következő sűrűségfüggvénnyel definiálhatjuk:

Az 'm' paramétert a normális eloszlás várható értéke, és a 'σ' paraméter a normális eloszlás szórása. Ha m=0 és σ=1, akkor ún. standard normális eloszlásról szokás beszélni. A standard normális eloszlás sűrűségfüggvényét φ(x), eloszlásfüggvényét pedig Φ(x) módon jelöljük.

A standard normális eloszlás eloszlásfüggvénye nem fejezhető ki elemi függvények segítségével, ezért táblázatos formában szokás megadni. Ennek a táblázatnak egy részlete:

A Φ függvény értéke közelítőleg számítógéppel is kiszámítható. Például az alábbi weboldalon

JavaScript - Normal Distribution Function

a megfelelő 'x' érték beírása után (m=0, σ=1 mellett) a "Calculate" gombra kattintva megkapjuk a Φ(x) függvény közelítő értékét ("Normal Probability").

Az 'm' és 'σ' paraméterű normális eloszlás eloszlásfüggvényét a standard normális eloszlás eloszlásfüggvényéből

F(x)=Φ((x−m)/σ)

módon kaphatjuk meg. (Például a táblázatból Φ(1.34)≈0.9099, ebből az m=1, σ=0.5 paraméterű normális eloszlás esetén az eloszlásfüggvény értékére 1.34*σ+m=1.67 miatt F(1.67)≈0.9099 adódik.)

(1) A binomiális eloszlás nagy 'n' és nem túl kis 'p' és 'q' (azaz "sem a 'p', sem a 'q' nem esik közel a 0-hoz", vö. Obádovics 1997: 91) esetén jól közelíthető az m=n*p várható értékű és σ²=n*p*q szórású normális eloszlással:

(2) Legyenek ξ_i : Ω → ℝ (1≤i≤n) azonos eloszlású, m∈ℝ várható értékű és σ∈ℝ, σ>0 szórású, független valségi változók. Ezekre teljesül, hogy

Exponenciális eloszlás

A ξ : Ω → ℝ folytonos valószínűségi változót λ∈ℝ, λ>0 paraméterű exponenciális eloszlású valségi változónak nevezzük, ha sűrűségfüggvénye

Legyen ξ : Ω → ℝ exponenciális eloszlású valségi változó λ>0 paraméterrel. Ekkor

(1) μ = M(ξ) = 1/λ
(2) σ² = D²(ξ) = 1/λ², vagyis σ = D(ξ) = 1/λ

teljesül ξ várható értékére (μ) és szórására (σ).

Egyenletes eloszlás (folytonos)

A ξ : Ω → ℝ folytonos valószínűségi változót egyenletes eloszlású valségi változónak nevezzük az (a,b) nyílt intervallumon, ha sűrűségfüggvénye

Legyen ξ : Ω → ℝ egyenletes eloszlású valségi változó az (a,b) intervallumon. Ekkor

(1) μ = M(ξ) = (a+b)/2
(2) σ² = D²(ξ) = (b−a)²/12, vagyis σ = D(ξ) = (b−a)/√12

teljesül ξ várható értékére (μ) és szórására (σ).

A nagy számok törvényei

(1) Legyen ξ : Ω → ℝ tetszőleges valószínűségi változó, amelynek várható értéke M(ξ) és legyen c>0 tetszőleges valós szám. Ekkor

P( ξ ≥ c ) ≤ M(ξ)/c, vagy λ=c/M(ξ) jelöléssel P( ξ ≥ λ*M(ξ) ) ≤ 1/λ

teljesül (ún. Markov-egyenlőtlenség).

Ha ξ diszkrét valségi változó, akkor

M(ξ) = Σ_{{x_i|1≤i<∞}}x_i*p_i ≥ Σ_{{x_i|1≤i<∞,x_i≥c}}x_i*p_i ≥ Σ_{{x_i|1≤i<∞,x_i≥c}}c*p_i = c*Σ_{{x_i|1≤i<∞,x_i≥c}}p_i = c*P(ξ≥c),

tehát c≠0 miatt M(ξ)/c ≥ P(ξ≥c) teljesül. (q.e.d.)

Például kockadobás esetén annak a valsége, hogy c=2-nél nagyobbat vagy azzal egyenlőt dobjunk, P(ξ≥2)=5/6≈0.83. Mivel M(ξ)=3.5, ezért M(ξ)/2=1.75, vagyis P(ξ≥2)≤M(ξ)/2 nyilvánvalóan teljesül. Ha c=5, akkor P(ξ≥5)=2/6=1/3≈0.33, M(ξ)/5=0.7, vagyis P(ξ≥5)≤M(ξ)/5 ebben az esetben is teljesül.

(2) Legyen ξ : Ω → ℝ tetszőleges valószínűségi változó, amelynek várható értéke M(ξ) és szórásnégyzete D²(ξ). Ekkor tetszőleges λ>1 pozitív valós számra

P( ∣ξ−M(ξ)∣ ≥ λ*D(ξ) ) ≤ 1/λ², vagy ε=λ*D(ξ) jelöléssel P( ∣ξ−M(ξ)∣ ≥ ε ) ≤ D²(ξ)/ε²

teljesül (ún. Csebisev-egyenlőtlenség).

(3) Legyen A∈Ω egy p=p_A valószínűségű esemény, és legyen η_A : Ω → {0, 1, ..., n}⊆ℕ egy 'n' darabos visszatevéses, független mintavétel mellett az A esemény gyakoriságát megadó valószínűségi változó. Mivel tudjuk, hogy az η_A valségi változó binomiális eloszlású, ezért M(η_A)=n*p és D²(η_A)=n*p*(1−p), ezért a Csebisev-egyenlőtlenségből következik, hogy tetszőleges ε>0 pozitív valós számra

A tételből következik, hogy bármilyen kis ε>0 és δ>0 számokhoz találhatunk olyan (elegendően nagy) N_ε∈ℕ számot, amelyre teljesül, hogy
– ha a mintavételek számát N_ε-nál nagyobbra választjuk (azaz n≥N_ε), akkor
– annak a valószínűsége, hogy az A esemény relatív gyakoriságának és valószínűségének abszolút eltérése az 'ε' értéket meghaladja,
– a 'δ' számnál kisebb lesz.
Ezt úgy is megfogalmazhatjuk, hogy n → ∞ esetén a relatív gyakoriság és a valószínűség eltérésének valószínűsége a 0-hoz konvergál. A valószínűségek sorozatának ilyen értelmű konvergálását szokás sztochasztikus konvergenciának nevezni.

(4) Legyenek
   ξ₁ : Ω → ℝ,
   ξ₂ : Ω → ℝ,
   ...
   ξ_n : Ω → ℝ,
azonos eloszlású, azonos 'm' várható értékű, és azonos σ>0 szórású független valószínűségi változók (azaz M(ξ_k)=m és D²(ξ_k)=σ² teljesül, 1≤k≤n). Ekkor tetszőleges ε>0 pozitív valós számra

Ebből következik, hogy 'n' darabos független mintavétel esetén az egyes mintavételek eredményét jelentő független, azonos eloszlású valségi változók számtani közepének és várható értékének az abszolút eltérése sztochasztikusan konvergál a 0-hoz. Másképpen megfogalmazva a minta ún. empirikus középértéke (mintaközepe, empirikus várható értéke) sztochasztikusan konvergál a minta alapjául szolgáló valószínűségi változó várható értékéhez.

Statisztikai minták feldolgozása

A matematikai statisztikában egy jelenséget rendszerint egy (vagy több) valószínűségi változóval jellemzünk. A statisztikai mintavétel során az adott jelenségre vonatkozóan n darab (egymástól független) megfigyelést vagy kísérletet végzünk. A kísérletek során minden alkalommal meghatározzuk ("megmérjük") a minket érdeklő valószínűségi változó aktuális értékét. Ennek eredményeként egy n elemű számsorozatot, statisztikai mintát kapunk, amelyet a vizsgált valószínűségi változót reprezentáló 'n' darab azonos eloszlású és független valószínűségi változó megfigyelt értékének tekintünk.

A matematikai statisztika célja a vizsgált valószínűségi változó(k) jellemzőinek minél pontosabb (megbízhatóbb, hitelesebb stb.) meghatározása. A vizsgálatok során feltételezzük, hogy minél több kísérletet végzünk, eredményeink ("becsléseink") annál pontosabbak lesznek.

Legyen ξ : Ω → ℝ az általunk vizsgált valségi változó és ( ξ₁=x₁, ξ₂=x₂, ..., ξ_n=x_n ) statisztikai mintavétellel kapott minta. A továbbiakban feltételezzük, hogy a ξ_i (1≤i≤n) valségi változók függetlenek, és eloszlásfüggvényük, valamint minden egyéb paraméterük (várható értékük, szórásuk stb.) megegyezik a vizsgált ξ valségi változó eloszlásfüggvényével és egyéb paramétereivel.

A ξ megfigyelt valségi változó empirikus eloszlásfüggvénye a következő:

Rendezzük el az (x₁, x₂, ..., x_n) minta elemeit nagyság szerint, és jelölje (X₁, X2, ..., X_n) a rendezett mintaelemeket, valamint x_min=X₁ és x_max=X_n a minta legkisebb és legnagyobb elemét. Ekkor az empirikus eloszlásfüggvény a következőképpen is megadható (vö. Obádovics 1997: 104-105):

   F_n(x) = 0, ha x≤x_min;
   F_n(x) = k/n, ha X_k<x≤X_k+1 (k=1,2,...,n−1);
   F_n(x) = 1, ha x_max<x.

A fenti formula alapján F_n(x) értéke az x-nél kisebb megfigyelések számának relatív gyakorisága. Ezért egy [a,b)⊆ℝ intervallumra, elegendően nagy mintaszám (n>>1) esetén, P(a≤ξ<b) ≈ F_n(b)−F_n(a) teljesül.

A ξ megfigyelt valségi változó (relatív) gyakorisági hisztogramját a következő eljárással kaphatjuk meg:

(1) Határozzuk meg azt az [a,b)⊆ℝ intervallunot, amely a mintaelemek mindegyikét tartalmazza (azaz x_i∈[a,b), 1≤i≤n). Például a=inf{ x_i | 1≤i≤n } és b=sup{ x_i | 1≤i≤n } nyilvánvalóan megfelelő értékek.
(2) Osszuk fel az [a,b)⊆ℝ intervallumot 'r' darab részintervallumra a=d₀ < d₁ < ... < d_r=b módon például úgy, hogy a kapott D_i=[d_i−1,d_i) részintervallumok hossza megegyezik (azaz d_i−d_i−1=d, 1≤i≤r). Ebben az esetben r*d=b−a teljesül, azaz d=(b−a)/r.
(3) Legyen k_i a D_i részintervallumba eső mintaelemek száma (1≤i≤r). Ábrázoljuk a koordináta-rendszer x tengelyén az [a,b) intervallumot és ezen belül a D_i részintervallumokat úgy, hogy minden D_i részintervallumhoz egy 'd' széles és a k_i értékkel arányos magasságú téglalapot rendelünk. Legyen a téglalap például
– y=k_i vagy y=k_i/n (Reimann-Tóth 1985: 131-132, Obádovics 1997: 106) vagy
– y=k_i/d (Reimann-Tóth 1985: 130)
magasságú.

Mivel a gyakorisági hisztogram fenti módon történő készítése során 'd' a részintervallumok hosszát jelentette, az egyes D_i részintervallumokhoz rendelt téglalapok területe a k_i gyakoriságokkal, az ábrázolt téglalapok összegzett területe pedig a minta darabszámával (n=k₁+k₂+...+k_n) arányos értéket fog megadni.

A ξ megfigyelt valségi változó sűrűségi hisztogramját a gyakorisági hisztogramhoz teljesen hasonlóan készíthetjük el, de az egyes D_i részintervallumokhoz rendelt téglalapok magasságát
k_i/(d*n)
módon állapítjuk meg. Ebben az esetben az ábrázolt téglalapok összegzett területe 1-et fog adni.

Jelöljük azt a függvényt, amelyet a sűrűségi hisztogramban megrajzolt téglalapok rajzolnak ki, f_n(x) módon. Az így kapott empirikus sűrűségfüggvény segítségével megbecsülhetjük, hogy a ξ valségi változó értéke mekkora valséggel esik egy adott intervallumba. Ha [a,b)⊆ℝ egy intervallum, elegendően nagy mintaszám (n>>1) és kis részintervallumok (d=d_i−d_i−1<<1, 1≤i≤r) esetén

Folytonos eloszlások esetében, folytonos f(x) sűrűségfüggvényt feltételezve a részintervallumok hosszát minden határon túl csökkentve (d→0) a fenti formula átmegy az f(x) (integrálható) sűrűségfüggvény [a,b) intervallumon vett határozott integráljába, amelynek kiszámításához az F(x) eloszlásfüggvényt mint primitív függvényt használhatjuk (F'(x)=f(x)).

Példaként hajtsuk végre a Weldon-féle kockadobási kísérletet m=10-szer megismételt dobássorozattal. Emlékeztetőül foglaljuk össze, hogy a korábban megadott mintapéldának megfeleltetve ez mit jelent:
– egy kísérlet egy kockadobás, amelyben N=6 "termékből" választunk;
– a kockával dobott minden érték (vagyis az egyes "termékek" kiválasztása) egyenlően valószínű (klasszikus valségi mező);
– a megfigyelt esemény (A) az 5-ös vagy 6-os dobás, azaz a termékek között s=2 darab "selejt" van (p_A=2/6=1/3);
– egy kísérlet vagy dobássorozat (ξ_A) során n=12-szer dobunk, azaz 12 "terméket" választunk (visszatevéses mintavétellel) (Megjegyzés: itt 'n' nem a statisztikai mintavétel elemszámát jelenti, hanem egy kísérlet során a dobások számát; a statisztikai mintavétel elemszámát, azaz a kísérletek számát most 'm' jelöli);
– egy kísérlet során az A esemény ξ_A=k-szor következik be, azaz 'k' darab "selejtet" kapunk (0≤k≤12); ha egy adott kísérlet (mintavétel) során d_i≤k<d_i−1 teljesül, akkor a [d_i,d_i−1) intervallumhoz tartozó gyakoriság eggyel nő (Megjegyzés: a hisztogramkészítéshez szükséges intervallumokba eső minták számát az alábbi táblázatban χ-vel fogjuk jelölni, ahol 0≤χ≤m teljesül);
– a kísérleteket eredetileg m=26306-szor hajtották végre, amely megfelelt a ( ξ_A₁=k₁, ξ_A₂=k₂, ..., ξ_{A₂₆₃₀₆}=k₂₆₃₀₆ ) statisztikai mintavételnek; az alábbi példában azonban egy m=10 elemű mintát használunk.

Figyeljük meg, hogy az empirikus eloszlásfüggvénynek az értékkészlet különböző pontjaiban szakadása van. A görbe minden szakadáskor annyiszor emelkedik 1/n=0.1 értékkel, ahányszor az értékkészletben az adott érték előfordul.

Figyeljük meg, hogy a különböző színű görbék alatti terület összege pontosan 1.
(az x tengely beosztása 1, az y tengely beosztása 0.1)

A statisztikai mintavételben szereplő ( ξ₁=x₁, ξ₂=x₂, ..., ξ_n=x_n ) valségi változók egy alkalmasan választott g(ξ₁,ξ₂,...,ξ_n) függvényét statisztikai függvénynek vagy statisztikának nevezzük. Ilyen statisztikák például az (empirikus) mintaközép vagy az empirikus szórásnégyzet.

(1) A ξ valószínűségi változó megfigyelésével kapott ( ξ₁=x₁, ξ₂=x₂, ..., ξ_n=x_n ) statisztikai minta számtani közepét, azaz a

ξ = (ξ₁+ξ₂+ ... +ξ_n)/n

statisztikát mintaközépnek (empirikus középértéknek vagy empirikus várható értéknek) nevezzük. Ha a ξ megfigyelt valségi változó várható értéke M(ξ)=m és szórásnégyzete D²(ξ)=σ², akkor a mintaközép várható értékére és szórásnégyzetére

M(ξ)=M(ξ)=m, és
D²(ξ)=D²(ξ)/n=σ²/n

teljesül. (Érdemes megjegyezni, hogy a mintaközép szórása 'n' növekedésével jelentősen csökken.)

(2) A ξ valószínűségi változó megfigyelésével kapott ( ξ₁=x₁, ξ₂=x₂, ..., ξ_n=x_n ) statisztikai minta esetében az

S²(ξ) = ( (ξ₁−ξ)² + (ξ₂−ξ)² + ... + (ξ_n−ξ)² )/n

statisztikát empirikus szórásnégyzetnek, a

S_k²(ξ) = ( (ξ₁−ξ)² + (ξ₂−ξ)² + ... + (ξ_n−ξ)² )/(n−1)

statisztikát korrigált empirikus szórásnégyzetnek nevezzük.
Ha a ξ megfigyelt valségi változó szórásnégyzete D²(ξ)=σ², akkor az empirikus és korrigált empirikus szórásnégyzet várható értékére

M(S²(ξ))=σ²*(n−1)/n és
M(S_k²(ξ))=σ²

teljesül. (Ha a mintaszám nagy, azaz n>>1, akkor az empirikus szórásnégyzet várható értéke közelítőleg a ξ valségi változó szórásnégyzetét adja.)

(3) A ξ és η valségi változók empirikus korrelációs együtthatója az

r_ξη = (ξ₁*η₁+ ξ₂*η₂+ ...+ ξ_n*η_n)/n

jelöléssel

r = (r_ξη − ξ*η) / (S(ξ)*S(η))

módon számítható ki (Reiman-Tóth 1985: 231).

Példaként határozzuk meg a ξ és η valségi változók együttes eloszlásának ismeretében az empirikus mintaközepet, szórást és korrelációs együtthatót.

A ξ és η valségi változók empirikus mintaközepe:

ξ=

η=

A ξ és η valségi változók empirikus és korrigált empirikus szórásnégyzete:

S²(ξ)=
⇒ S(ξ)=

S_k²(ξ)=
⇒ S_k(ξ)=

S²(η)=
⇒ S(η)=

S_k²(η)=
⇒ S_k(η)=

A ξ és η valségi változók empirikus korrelációs együtthatója:

r(ξ,η)=

Ha a mintaelemek generálásakor a Mintavétel (1,2,3) gombra kattintottunk, akkor ellenőrzésként adjuk meg a
ξ : Ω→{1,2,3}
és
η : Ω→{1,2,3}
valségi változók együttes eloszlását az egyes értékek együttes előfordulásainak relatív gyakorisága alapján a korábbi példában szereplő táblázathoz hasonlóan. Ezután számoljuk ki a valségi változók peremeloszlását és a valségi változók főbb jellemzőit. Ha így járunk el, a fenti értékekkel megegyező értékeket kell kapnunk.

A ξ és η valségi változók szórásnégyzete:
D²(ξ)= ⇒ D(ξ)=
D²(η)= ⇒ D(η)=

Irodalom- és forrásjegyzék

Bíró Fatime; Vincze Szilvia 2010. A gazdasági matematika alapjai. Debrecen: Debreceni Egyetemi K.

Bognár Jánosné et al. 1971. Valószínűségszámítás feladatgyűjtemény. Budapest: Tankönyvk.

Csatlósné Fülöp Sára 1996. Kombinatorika, valószínűségszámítás. In: Pappné Ádám Györgyi (szerk.) 1996. 155-174.

Cser Andor; L. Ziermann Margit; Reményi Gusztáv 1962. Matematikai zsebkönyv. Budapest: Tankönyvk.

Feller, William 1978. Bevezetés a valószínűségszámításba és alkalmazásaiba. Budapest: Műszaki K.

Obádovics J. Gyula 1997. Valószínűségszámítás és matematikai statisztika. Budapest: Scolar K.

Obádovics J. Gyula; Szarka Zoltán 2009. Felsőbb matematika. Budapest: Scolar K.

Pappné Ádám Györgyi (szerk.) 1996. Matematika az általános képzéshez a tanítóképző főiskolák számára. Budapest: Nemzeti Tankönyvk.

Reimann József; Tóth Julianna 1985. Valószínűségszámítás és matematikai statisztika. Budapest: Tankönyvk.

Solt György 1971. Valószínűségszámítás. Példatár. Budapest: Műszaki K.

Szabó István 1996. Kombinatorika, valószínűségszámítás. In: Balassa Zsófia (szerk.) 1996. Matematika feladatgyűjtemény az általános képzéshez a tanítóképző főiskolák számára. Budapest: Nemzeti Tankönyvk. 82-91.

Vincze Szilvia, Bíró Fatime 2000. Bevezetés az alkalmazott matematikába. Debrecen: Debreceni Egyetem Debreceni Egyetem Agrártudományi Centrum.

Závoti József 2010. Matematika III. 4. A valószínűségi változó és jellemzői. Sopron: Nyugat-magyarországi Egyetem, Geoinformatikai Kar.

	0	1	2	3	4	5	6
1.00
0.95
0.90
0.85
0.80
0.75
0.70
0.65
0.60
0.55
0.50
0.45
0.40
0.35
0.30
0.25
0.20
0.15
0.10
0.05
0.00

ξ ↓ / η →	y₁=4	y₂=10	Σ_(sorok)
x₁=2	w_ξη(x₁,y₁)=0	w_ξη(x₁,y₂)=0.5	w_ξ(x₁)=0.5
x₂=6	w_ξη(x₂,y₁)=0.5	w_ξη(x₂,y₂)=0	w_ξ(x₂)=0.5
Σ_(oszlopok)	w_η(y₁)=0.5	w_η(y₂)=0.5

lim n→∞	(	n	)	p^k q^n−k =	(np)^k	e^−np
		k			k!

lim n→∞	(	n	)	p^k q^n−k = Φ	(	x−n*p	)
		k				√npq

lim n→∞	P	(	ξ₁+ξ₂+...+ξ_n−n*m	<x	)	= Φ	(	x	)
			σ*√n