BIOMATEMATIKA ELŐADÁS


1 BIOMATEMATIKA ELŐADÁS 9. Együttes eloszlás, kovarianca, nevezetes eloszlások Debreceni Egyetem, 2015 Dr. Bérczes At...
Author:  Ödön Balla

0 downloads 0 Views 278KB Size

Recommend Documents


Biomatematika 2 Orvosi biometria
1 Biomatematika 2 Orvosi biometria Diszkrét és folytonos valószínűségi eloszlások 12 Valószínű...

[Biomatematika 2] Orvosi biometria
1 [Biomatematika 2] Orvosi biometria Visegrády Balázs J J 92 Regresszióanalízis. Legkisebb négyzetek elve.3 Regress...



˝ B IOMATEMATIKA EL OADÁS

9. Együttes eloszlás, kovarianca, nevezetes eloszlások

Debreceni Egyetem, 2015 Dr. Bérczes Attila, Bertók Csanád

A diasor tartalma 1

Bevezetés, definíciók Együttes eloszlás Függetlenség Kovariancia Példa Korreláció

2

Nevezetes abszolút folytonos eloszlások Folytonos eloszlás Exponenciális eloszlás Normális eloszlás Lognormális eloszlás

3

Biológiai példák

Bevezetés, definíciók

A természettudományokban gyakori, hogy a tulajdonságok hatnak egymásra (a testtömeg gyakran hatással van a falkabeli rangsorra, testmagasságra, stb.), így elengedhetetlen beszélnünk a valószín˝uségi változók együttes eloszlásáról, függetlenségér˝ol, egymástól való függésér˝ol. Definíció Legyenek ξ és η diszkrét valószín˝uségi változók, melyek értékkészlete rendre x1 , x2 , . . . és y1 , y2 , . . .. Ekkor ξ és η együttes eloszlásán a pij = P(ξ = xi , η = yj ), i, j = 1, 2, . . . számokat értjük.

Definíciók Megjegyzés A fenti definíció vonatkozásában a ξ és η külön-külön tekintett eloszlása ún. marginális (más szóval perem-) eloszlásként jelenik ∞ meg, ahol pi = P(ξ = xi ) = ∑∞ j=1 pij és qj = P(η = yj ) = ∑i=1 pij . Tétel A ξ és η együttes eloszlása meghatározza a peremeloszlásokat, de a peremeloszlások nem határozzák meg egyértelm˝uen az együttes eloszlást. Megjegyzés A peremeloszlások lényegében úgy adhatóak meg, hogy az egyik valószín˝uségi változó értékét rögzítjük és megnézzük az ahhoz tartozó valószín˝uségeket. Pl. ha ξ értéke −2, −1, 0 lehet, η értéke pedig 5, 6, 7, akkor pl. a ξ = −2-höz tartozó eloszlás: P(ξ = −2, η = 5) + P(ξ = −2, η = 6) + P(ξ = −2, η = 7).

Definíciók Definíció Azt mondjuk, hogy a ξ és η valószín˝uségi változók függetlenek, ha P(ξ = xi , η = yj ) = P(ξ = xi )P(η = yj ), i, j = 1, 2, . . . A ξ1 , ξ2 , . . . valószín˝uségi változókat páronként függetlennek nevezzük, ha közülük bármely 2 független. A ξ1 , ξ2 , . . . valószín˝uségi változókat teljesen függetlennek nevezzük, ha P(ξ1 = xi1 , ξ2 = xi2 , . . . , ξn = xin ) = P(ξ1 = xi1 )P(ξ2 = xi2 ) . . . P(ξn = xin ).

Tétel Ha ξ és η független valószín˝uségi változók, melyeknek létezik a véges E(ξ ) és E(η) várható értéke, úgy E(ξ η) is létezik és véges és E(ξ η) = E(ξ )E(η).

Kovariancia Az el˝oz˝o alkalommal szó volt a szórásnégyzetr˝ol (vagy más szóval varianciáról), mely megmutatta, hogy egy adott valószín˝uségi változó mennyire térhet el a várható értékét˝ol. Két valószín˝uségi változó esetében beszélhetünk az ún. kovarianciáról (a képlet hasonló a varianciához, hisz ott E(ξ 2 ) − E(ξ )2 -tel számoltunk). Definíció Két diszkrét valószín˝uségi változó kovarianciája alatt a Cov(ξ , η) = E(ξ η) − E(ξ )E(η) értéket értjük. Megjegyzés A definícióból látszik, hogy ha a két valószín˝uségi változó független, akkor a kovariancia értéke 0. Ugyanez visszafelé viszont nem igaz.

Példa Példaként tekintsük az alábbi, ún. kontingenciatáblázatot: HH H

ξ

η

HH −1 H

−1 0 2

p 2p 2p

0

2

3p 3p p

p p p

Feladat: Adjuk meg p értékét! Adjuk meg ξ és η peremeloszlását! Független-e ξ és η? Adjuk meg ξ és η várható értékét és varianciáját (szórásnégyzetét)! Számoljuk ki Cov(ξ , η) értékét!

Példa Mivel tudjuk, hogy a valószín˝uségek összegének 1-et kell kiadnia, így 1 = p + 3p + p + 2p + 3p + p + 2p + p + p = 15p, így 1 p = 15 . 5 A peremeloszlások: P(ξ = −1) = p + 3p + p = 15 , 4 6 . P(ξ = 0) = 2p + 3p + p = 15 , P(ξ = 2) = 2p + p + p = 15 5 7 Hasonlóan adódik, hogy P(η = −1) = 15 , P(η = 0) = 15 , 3 P(η = 2) = 15 .

A függetlenséghez meg kell nézni, hogy a két peremeloszlás szorzata megegyezik-e az adott cellában lév˝o értékkel (pl. P(ξ = 0)P(η = 2) egyenl˝o-e a "0-s sor, 2-es oszlop" elemével). Ha akár csak egyetlen esetben is ellentmondást kapunk, akkor nem függetlenek, ha mindenhol egyenl˝oség adódik, akkor függetlenek. A példánk esetén: 6 3 2 1 P(ξ = 0)P(η = 2) = 15 · 15 = 25 6= 15 , így nem függetlenek.

Példa Csak ξ esetén számoljuk ki az összes szükséges értéket, η esetében csupán a várható értéket adjuk meg. 6 4 5 +0· +2· = 15 15 15 5 6 4 E(ξ 2 ) = (−1)2 · + (0)2 · + (2)2 · = 15 15 15 9 21 − = D2 (ξ ) = E(ξ 2 ) − E(ξ )2 = 15 225 7 3 5 E(η) = −1 · + 0 · + 2 · = 15 15 15 E(ξ ) =

−1 ·

3 15 21 15 34 25 1 15

A kovariancához szükségünk van az E(ξ η) várható értékre: E(ξ η) = −2 · Cov(ξ , η) =

3 10 1 1 1 + 0 · + 1 · + 4 · = − , így 15 15 15 15 15 1 3 1 2 − − · =− . 15 15 15 25

Korreláció Könnyen átgondolható, hogy két vizsgált mennyiség között fennálhat valamiféle kapcsolat (pl. a fekete hajú emberek szeme általában barna. Sokkal több kék szem˝u egyén van a sz˝oke hajúak között, stb.) Ezt a kapcsolatot sokféleképp lehet vizsgálni és leírni. Az egyik elterjedt mér˝oszám az ún. korrelációs együttható, mely a tulajdonságok (valószín˝uségi változók) közötti (lineáris) kapcsolat "szorosságát" mutatja meg. Definíció A ξ és η valószín˝uségi változók korrelációs együtthatója alatt az R(ξ , η) = számot értjük.

Cov(ξ , η) D(ξ )D(η)

Nevezetes abszolút folytonos eloszlások Folytonos egyenletes eloszlás Adott a, b ∈ R, a < b paraméterek mellett a ξ valószín˝uségi változót az [a, b] intervallumon egyenletes eloszlásúnak nevezzük, ha s˝ur˝uségfüggvénye ( 1 , ha x ∈ [a, b] fξ (x) = b−a 0, egyébként. Az eloszlásfüggvénye:   0, ha x < a x−a Fξ (x) = b−a , ha x ∈ [a, b[   1, ha x ≥ b. A várható értéke és varianciája: a+b E(ξ ) = , 2

D2 (ξ ) =

(b − a)2 . 12

Nevezetes abszolút folytonos eloszlások Megjegyzés A biológiában ez a típusú eloszlás viszonylag ritka, például akkor beszélhetnénk ilyen típusú eloszlásról ha egy egyed a rendelkezésre álló él˝ohely bármelyik szegmensét egyenl˝o eséllyel választaná saját vadászterületének. De mivel ilyen a természetben általában nem fordul el˝o (állatkertekben, ahol ellen˝orzött körülmények vannak megjelenik), így a diszkrét egyenletes eloszlás sokkal elterjedtebb, mint folytonos társa.

Nevezetes abszolút folytonos eloszlások Exponenciális eloszlás Az mondjuk, hogy a ξ valószín˝uségi változó λ paraméter˝u (λ > 0) exponenciális eloszlású, ha s˝ur˝uségfüggvénye ( λ e−λ x , ha x ∈]0, ∞[ fξ (x) = 0, egyébként. Az eloszlásfüggvénye: ( 1 − e−λ x , ha x ∈]0, ∞[ Fξ (x) = 0, egyébként. A várható értéke és varianciája: E(ξ ) =

1 , λ

D2 (ξ ) =

1 . λ2

Nevezetes abszolút folytonos eloszlások Megjegyzés Exponenciális eloszlást rendszerint élettartamhoz köthet˝o vizsgálatok során használunk. Például a radioaktív bomlás tipikusan exponenciális eloszlással írható le, de populációk egyedszámának id˝obeli változásához is gyakran exponenciális eloszlást használunk. Ha az eloszlást átparaméterezzük, akkor túlélési valószín˝uséget is számolhatunk az eloszlás segítségével (megkaphatjuk, hogy egy adott populáció mekkora valószín˝uséggel fog x id˝on keresztül fennmaradni).

Nevezetes abszolút folytonos eloszlások Normális eloszlás Azt mondjuk, hogy a ξ valószín˝uségi változó m, σ 2 ∈ R paraméter˝u (σ > 0) normális eloszlású, ha s˝ur˝uségfüggvénye 2 1 − (x−m) fξ (x) = √ e 2σ 2 , x ∈ R. 2πσ

A várható értéke és varianciája rendre m és σ 2 . Az eloszlásfüggvénye nem adható meg klasszikus eszközökkel, így a vizsgálatok során táblázattal dolgozunk. Megjegyzés Jelölés: N (m, σ 2 ). A gyakorlatban az ún. standard normális eloszlással foglalkozunk, hiszen az ahhoz készült táblázatok segítségével tudjuk számolni a kívánt értékeket. Ez nem más, mint N (0, 1).

Nevezetes abszolút folytonos eloszlások Standardizálás Ahhoz, hogy egy tetsz˝oleges normális eloszlásból standard normálisat kapjunk, a várható értéket "el kell tolni", a szórással pedig "le kell osztani". Nevezetesen: Fξ (x) = P(ξ < x) = P(ξ − m < x − m) =     ξ −m x−m x−m =P < =Φ . σ σ σ Például, ha ξ egy m = 5, σ 2 = 4 (azaz σ = 2) paraméter˝u normális eloszlású valószín˝uségi változó és arra vagyunk kíváncsiak, hogy mekkora valószín˝uséggel lesz a kapott értékünk 8-nál kisebb, úgy Fξ (8) = P(ξ < 8) = P(ξ − 5 < 3) =     ξ −5 3 3 =P < =Φ ≈ 0, 93319 ≈ 93, 3%. 2 2 2

Nevezetes abszolút folytonos eloszlások Megjegyzés Ez az egyik leggyakoribb eloszlásfajta a biológiai vizsgálatok során. Kell˝oen nagy populációkban a testmagasság, testtömeg és úgy általában mindenfajta hosszméret is normális eloszlást követ (s˝ot, rendszerint a jegyek eloszlása a vizsgadolgozatok során is ezt az eloszlást követi, de persze ezt sok dolog befolyásolhatja).

Nevezetes abszolút folytonos eloszlások

Lognormális eloszlás Azt mondjuk, hogy a ξ valószín˝uségi változó m, σ 2 ∈ R paraméter˝u (σ > 0) lognormális eloszlású, ha s˝ur˝uségfüggvénye 2 1 − (ln x−m) e 2σ 2 , x ∈ R. fξ (x) = √ 2πσ x

Az eloszlásfüggvénye a normális eloszláshoz hasonlóan nem adható meg klasszikus módszerekkel. A várható értéke és varianciája: σ2

E(ξ ) = em+ 2 ,

2

2

D2 (ξ ) = e2m+σ (eσ − 1).

Nevezetes abszolút folytonos eloszlások Megjegyzés Lognormális eloszlást gyakorlatban sejtosztódási, sejtaprítási folyamatok során használunk. Gyakran lognormális eloszlást követ valamely sejttípus esetén a sejtmag átmér˝oje. Szintén ilyen eloszlással írható le a mitózishoz szükséges id˝o bizonyos sejtek esetén.

Biológiai példák 20 − 24 év közötti japán n˝ok testsúlya normális eloszlást követ m = 50, 01, σ 2 = 8 (azaz σ ≈ 2, 83) paraméterekkel. Számoljuk ki, hogy mekkora annak az esélye, hogy egy véletlenszer˝uen választott 20 − 24 év közötti japán n˝o testsúlya 48 és 51 kg közé esik! A következ˝o valószín˝uséget kell kiszámolni: P(48 < ξ < 51), ahol ξ jelöli a testsúlyt. Alkalmazva a tanult képletet ez nem más, mint Fξ (51) − Fξ (48) = P(ξ < 51) − P(ξ < 48). Standardizálva: P(ξ < 51) − P(ξ < 48) =     ξ − 50, 01 0, 99 ξ − 50, 01 2, 01 < −P <− = =P 2, 83 2, 83 2, 83 2, 83 = Φ(0, 3498) − Φ(−0.7102) ≈ 0, 63683 − 0, 23885 ≈ 39, 8%. Megjegyzés Sok esetben a táblázatban nem szerepel negatív érték. Ekkor a Φ(−x) = 1 − Φ(x) képlettel számolhatjuk a keresett valószín˝uséget.

Biológiai példák

Egy kórházba bizonyos betegséggel évenként beszállított egyének száma Poisson-eloszlású valószín˝uségi változó. Kéthetenként átlagosan egy személyt szállítanak be. Mennyi a valószín˝usége annak, hogy egy adott héten két személyt szállítanak be? Mivel kéthetente átlagosan egy embert szállítanak be, így egy hét alatt átlagosan 0, 5 személy kerül kórházba az adott betegséggel. Így λ = 0, 5. Alkalmazva a képletet k = 2 választással: P(ξ = 2) =

λ k −λ 0, 52 −0,5 e = e ≈ 0, 0758 ≈ 7, 6%. k! 2!

Biológiai példák

Egy populáció egyedei ragadozók áldozatául eshetnek. Az egyedek élettartamai egy adott id˝opillanattól kezdve (másodpercekben mérve) független exponenciális eloszlást követnek λ = 0, 002 paraméterrel. Mekkora valószín˝uséggel ejtenek el egy egyedet a mérés kezdetét követ˝oen 5 − 7 perc között a ragadozók? Ha ξ -vel jelöljük az egyed várható élettartamát, úgy a keresett valószín˝uség: P(300 < ξ < 420) (átírtuk a perceket másodpercekre). Átírva: P(300 < ξ < 420) = Fξ (420) − Fξ (300) = = (1 − e−0,002·420 ) − (1 − e−0,002·300 ) ≈ 0, 5683 − 0, 4512 ≈ 11, 7%.

Life Enjoy

" Life is not a problem to be solved but a reality to be experienced! "

Get in touch

Social

© Copyright 2013 - 2019 TIXPDF.COM - All rights reserved.