Statisztika
Becslőfüggvény
A következtetéselmélet célja, hogy összefüggéseket találjon a statisztikai sokaság és az ezekből származó minta jellemzői között. Látni fogjuk, hogy a sokaság eloszlásának ismerete sokat segít a pontosabb következtetések kiszámításában, de a sokaság eloszlástípusának ismerete nem feltétlenül követelmény. A minta esetében is többféle mintavételi eljáráshoz tudunk kialakítani becsléseket, bár matematikailag legjobban kezelhető mintavételi eljárás a FAE (Független Azonos Eloszlású) minta.
A sokaságokat eloszlásával, illetve az eloszlások paramétereivel specifikáljuk, a mintát pedig elemeinek felsorolásával adjuk meg. A mintaelemek egy tetszőleges függvényét statisztikának nevezzük. Például a minta átlaga, mediánja, terjedelme egy-egy statisztikát jelent. A következtetéselméletben a statisztikát becslőfüggvénynek nevezzük.
A becslőfüggvény olyan statisztika, amely egy sokasági jellemző, mintából történő közelítő meghatározására szolgál.
Ha a becsülni kívánt sokasági jellemzőt \(\Theta\)-val jelöljük, akkor a becslőfüggvénye az \(y_1,y_2,\ldots ,y_n\), \(n\)-elemű mintából a
\[
\begin{aligned}
\widehat\Theta(y_1,y_2,\ldots ,y_n)=\widehat\Theta(n)=\widehat\Theta
\end{aligned}\notag
\]
lesz, ahol \(\widehat\Theta\) a \(\Theta\) jellemző becslőfüggvényét jelöli.
Adott sokasági jellemzőre több becslőfüggvény is készíthető, így például a sokaság \(\sigma^2\) szórásnégyzetére a következő becslőfüggvényeket adhatjuk:
\[
\begin{aligned}
\widehat\Theta_1(y_1,y_2,\ldots ,y_n)=\frac{1}{n}\sum_{i=1}^n(y_i-\bar y)^2={s^*}^2\\
\widehat\Theta_2(y_1,y_2,\ldots ,y_n)=\frac{1}{n-1}\sum_{i=1}^n(y_i-\bar y)^2=s^2\\
\end{aligned}\notag
\]
\begin{aligned}
\widehat\Theta_1(y_1,y_2,\ldots ,y_n)=\frac{1}{n}\sum_{i=1}^n(y_i-\bar y)^2={s^*}^2\\
\widehat\Theta_2(y_1,y_2,\ldots ,y_n)=\frac{1}{n-1}\sum_{i=1}^n(y_i-\bar y)^2=s^2\\
\end{aligned}\notag
\]
ahol \(s^2\) a korrigált tapasztalati szórásnégyzet.
A sokaság szórásnégyzetére további becslőfüggvényeket is készíthetünk:
\[
\begin{array}{rl}
\widehat\Theta_3=\left(\dfrac{\sum_{i=1}^n |y_i-\bar y|} {n}\right )^2=b^2&\text{\’atlagos abszol\’ut elt\’er\’es n\’egyzete}\\
\widehat\Theta_4=y_{max}-y_{min}=R&\text{terjedelem}\\
\widehat\Theta_5=0\cdot(y_1+y_2+\ldots+y_n)+c&\text{szak\’ert\Hooe i becsl\’es}
\end{array}\notag
\]
\begin{array}{rl}
\widehat\Theta_3=\left(\dfrac{\sum_{i=1}^n |y_i-\bar y|} {n}\right )^2=b^2&\text{\’atlagos abszol\’ut elt\’er\’es n\’egyzete}\\
\widehat\Theta_4=y_{max}-y_{min}=R&\text{terjedelem}\\
\widehat\Theta_5=0\cdot(y_1+y_2+\ldots+y_n)+c&\text{szak\’ert\Hooe i becsl\’es}
\end{array}\notag
\]
A korábbi két becslőfüggvényt további hárommal bővítettük, amelyek szintén alkalmasak a sokaság szórásnégyzetének becslésére. Az utolsó két becslőfüggvény azt mutatja, hogy nem kell felhasználni a minta összes elemét, sőt akár külső információból származó becsléssel is élhetünk, mint az utolsó esetben, ahol egyáltalán nem vettük figyelembe a minta elemeit.
A minta elemei valószínűségi változók, így a belőlük képzett becslőfüggvény is egy valószínűségi változó, mindaddig, amíg konkrét értékeket nem helyettesítünk be és számítjuk ki a függvény számértékét.
A fentiekben a becslőfüggvények az \(n\)-elemű mintához egyetlen értéket, pontot rendelnek hozzá, ezért az ilyen típusú becsléseket pontbecslésnek nevezzük.
Átlag becslése
Feladat
Egy négytagú családban megmérték mindenkinek a súlyát és a következő eredményeket kapták: \(50\), \(60\), \(72\) és \(90\) kg. Készítsünk becslőfüggvényt az átlagsúlyra \(n=3\) minta alapján. A mintát egyszerű véletlen (EV) módszerrel választjuk ki a korábban említett FAE minta helyett. Az EV mintavétel alapján megvizsgálhatjuk az összes lehetséges mintára vonatkozó becslőfüggvényt. A becslőfüggvények legyenek a következők:
- minta átlag
- minta medián
- terjedelemközép (a legnagyobb és legkisebb elem különbségének fele)
- szakértői becslés, amely szerint az átlag \(80\) kg.
Ha az összes lehetséges FAE mintához szeretnénk elkészíteni a fentiekben meghatározott négy becslőfüggvényt, akkor a számításokat \(4^3=64\) darab mintára kellene elvégeznünk, ugyanis ez visszatevéses mintavételt jelentene. Az EV mintavételek lehetséges száma \(\dbinom{4}{3}=4\), amely sokkal kezelhetőbb és ez az esetszám is megfelelően szemlélteti a becslőfüggvényeket.
Megoldás
| A minták jellemzői | |||||
|---|---|---|---|---|---|
| No. | Minta elemei | Átlag
\(\widehat\Theta_1=\bar y\) |
Medián
\(\widehat\Theta_2=Me\) |
Terjedelemközép
\(\widehat\Theta_3=\dfrac{y_{max}-y_{min}}{2}\) |
Szakértői becslés
\(\widehat\Theta_4=80\) |
| 1. | 50, 60, 72 | 60,67 | 60 | 61 | 80 |
| 2. | 50, 60, 90 | 66,67 | 60 | 70 | 80 |
| 3. | 50, 72, 90 | 70,67 | 72 | 70 | 80 |
| 4. | 60, 72, 90 | 74 | 72 | 75 | 80 |
A négy becslőfüggvény, mint valószínűségi változó várható értékét kell kiszámítanunk, amelyhez az összes adat rendelkezésre áll a fenti táblázatban. Mind a négy becslőfüggvény esetén a négy mintából számított számértékek számtani átlagát kell venni a várható értékhez.
\[
\begin{aligned}
E(\widehat\Theta_1)&=\frac{60,67+66,67+70,67+74}{4}=68\\
E(\widehat\Theta_2)&=\frac{60+60+72+72}{4}=66\\
E(\widehat\Theta_3)&=\frac{61+70+70+75}{4}=69\\
E(\widehat\Theta_4)&=\frac{80+80+80+80}{4}=80\\
\end{aligned}\notag
\]
A sokaság \(\Theta=68\) jellemzőjét (átlagsúlyt) a \(\widehat\Theta_1\) becslőfüggvény torzítatlanul, míg amásik három becslőfüggvény torzítottan becsüli. A torzítás mértéke a \(\widehat\Theta_4\) esetén a legnagyobb:
\[
\begin{aligned}
Bs(\widehat\Theta_4)=68-80=-12\;kg
\end{aligned}\notag
\]
Az előző feladatban láthattuk, hogy több becslőfüggvényt is fel tudunk írni, azonban nem mindegyik jelzi pontosan a sokaság jellemzőjét. Azt a becslőfüggvényt részesítjük előnybe, amelynek az egyes mintákon felvett értéke a sokasági jellemző értéke körül ingadozik, kis szórással. A két elvárás általában egyformán fontos. Az átlag esetén láthattuk, hogy a súlyátlag körül ingadozik. Ezzel ellentétben a szakértői becslés “nem közelíti jól” a sokaság súlyátlagát, bár szóródása \(0\).
Ha a becslőfüggvény értékei ingadozásának középpontja a becsülni kívánt sokasági jellemző, akkor azt torzítatlannak nevezzük.
Egy torzítatlan becslőfüggvény a becsülni kívánt sokasági jellemző körül ingadozik, amelyből ha több is létezik, akkor azt tekintjük jobbnak, amely szóródása kisebb. A szóródást általában a szórásnégyzettel mérjük.
Torzítatlanság
Egy becslőfüggvényt torzítatlannak nevezünk, ha annak várható értéke megegyezik a becsülni kívánt sokasági jellemzővel.
\[
\begin{aligned}
E(\widehat\Theta)=\Theta
\end{aligned}\notag
\]
Egy becslőfüggvény torzítását a következőképpen definiálhatjuk:
\[
\begin{aligned}
Bs(\widehat\Theta)=\Theta-E(\widehat\Theta)
\end{aligned}\notag
\]
Megjegyzés
A feladat első három becslőfüggvényét sematikusan ábrázoltuk, amelyek szórása és várható értéke eltérő. A \(\widehat\Theta_1\) becslőfüggvény várható értéke megegyezik a becsülni kívánt sokasági jellemzővel, amelyet jelöltünk az ábrán.
Az ábrát tekintve a torzítás azt jelnti, hogy az egyes becslőfüggvények várható értéke milyen messze esik a becsülni kívánt sokasági jellemzőtől. (Az érték a vízszintes tengelyen olvasható le.
Ábra
Hatásosság
Egy becslőfüggvény valamennyi lehetséges mintán felvett értékének szórásnégyzetét mintavételi szórásnégyzetnek, négyzetgyökét pedig a becslőfüggvény és a becslés standard hibájának nevezzük.
A becslőfüggvények tulajdonságainak áttekintésekor a torzítatlanság mellett fontos szempont volt, hogy a becsülni kívánt sokasági jellemző körüli szóródása kicsi legyen. A becslőfüggvény és a becslés standard hibáját a következő módon jelöljük:
\[
\begin{aligned}
Se(\widehat\Theta)=\sqrt{Var(\widehat\Theta)}
\end{aligned}\notag
\]
Torzítatlan becslőfüggvények esetén azt tekintjük jobbnak, amelynek a szórásnégyzete, standard hibája kisebb. Két becslőfüggvény összehasonlításakor a szórásnégyzetek hányadosát szokás tekinteni:
\[
\begin{aligned}
Ef_r=\frac{Var(\widehat\Theta_1)}{Var(\widehat\Theta_2)}
\end{aligned}\notag
\]
A fenti hányadost relatív hatásfoknak nevezzük.
Ismet eloszlású sokaság, FAE minta esetén egyserűbb mutatószámokra létezik olyan becslőfüggvény, amely szórásnégyzete minden más becslőfüggvény szórásnégyzeténél kisebb. Az ilyen becslőfüggvény a minimális szórásnégyzetű torzítatlan becslőfüggvény (MVUE) és \(\widehat\Theta_0\)-val jelöljük. A relatív hatásfok analógiájára definiálhatjuk az MVUE létezése esetén az abszolút hatásfokot:
\[
\begin{aligned}
Ef_a=\frac{Var(\widehat\Theta_1)}{Var(\widehat\Theta_0)}
\end{aligned}\notag
\]
Megjegyzés
Az ábrán két torzítatlan becslőfüggvényt ábrázoltunk, a hatásosság szemléltetésére. A \(\widehat\Theta_1\) hatásosabb, mint \(\widehat\Theta_2\).
Ábra
Átlagos négyzetes hiba (MSE)
A torzítatlanság és a hatásosság között nem tudunk olyan fontossági sorrendet felállítani, amely alapján eldönthető, hogy melyik mutató alapján érdemes becslőfüggvényt választani. A torzítás négyzetének és a becslőfüggvény szórásnégyzetének összegét tekintve egyszerre vizsgálhatjuk a két mutató kompozícióját, amely összehasonlíthatóvá teszi a becslőfüggvényeket. Az átlagos négyzetes hiba:
\[
\begin{aligned}
MSE(\widehat\Theta)=E\left((\widehat\Theta-\Theta)^2\right)=Var(\widehat\Theta)+Bs^2(\widehat\Theta)
\end{aligned}\notag
\]
Feladat (folytatás)
A négytagú család testsúlyával kapcsolatos feladatot folytatjuk azzal, hogy kiegészítjük a táblázatot a korábban kiszámított torzítással.
| A minták jellemzői | |||||
|---|---|---|---|---|---|
| No. | Minta elemei | Átlag
\(\widehat\Theta_1=\bar y\) |
Medián
\(\widehat\Theta_2=Me\) |
Terjedelemközép
\(\widehat\Theta_3=\dfrac{y_{max}-y_{min}}{2}\) |
Szakértői becslés
\(\widehat\Theta_4=80\) |
| 1. | 50, 60, 72 | 60,67 | 60 | 61 | 80 |
| 2. | 50, 60, 90 | 66,67 | 60 | 70 | 80 |
| 3. | 50, 72, 90 | 70,67 | 72 | 70 | 80 |
| 4. | 60, 72, 90 | 74 | 72 | 75 | 80 |
| Torzítás (Bs) | \(Bs(\widehat\Theta_1)=0\) | \(Bs(\widehat\Theta_2)=2\) | \(Bs(\widehat\Theta_3)=1\) | \(Bs(\widehat\Theta_4)=-12\) | |
A becslések szórásnégyzetét a fenti adatokból már ki tudjuk számítani.
\[
\begin{aligned}
Var(\widehat\Theta_1)&=\frac{(60,67-68)^2+(66,67-68)^2+(70,67-68)^2+(74-68)^2}{4}=24,69\\
Var(\widehat\Theta_2)&=\frac{(60-66)^2+(60-66)^2+(72-66)^2+(72-66)^2}{4}=36\\
Var(\widehat\Theta_3)&=\frac{(61-69)^2+(70-69)^2+(70-69)^2+(75-69)^2}{4}=25,5\\
Var(\widehat\Theta_4)&=\frac{(80-80)^2+(80-80)^2+(80-80)^2+(80-80)^2}{4}=0\\
\end{aligned}\notag
\]
A becslőfüggvények összehasonlításához kiszámítjuk az átlagos négyzetes hibákat (MSE).
| A minták jellemzői | ||||
|---|---|---|---|---|
| Átlag
\(\widehat\Theta_1=\bar y\) |
Medián
\(\widehat\Theta_2=Me\) |
Terjedelemközép
\(\widehat\Theta_3=\dfrac{y_{max}-y_{min}}{2}\) |
Szakértői becslés
\(\widehat\Theta_4=80\) |
|
| Torzítás (Bs) | \(Bs(\widehat\Theta_1)=0\) | \(Bs(\widehat\Theta_2)=2\) | \(Bs(\widehat\Theta_3)=1\) | \(Bs(\widehat\Theta_4)=-12\) |
| Szórásnégyzet (Var) | \(Var(\widehat\Theta_1)=24,69\) | \(Var(\widehat\Theta_2)=36\) | \(Var(\widehat\Theta_3)=25,5\) | \(Var(\widehat\Theta_4)=0\) |
| \(MSE(\hat\Theta)=Var(\widehat\Theta)+Bs^2(\widehat\Theta)\) | \(MSE(\widehat\Theta_1)=24,69\) | \(Var(\widehat\Theta_2)=40\) | \(MSE(\widehat\Theta_3)=26,5\) | \(MSE(\widehat\Theta_4)=144\) |
A \(\widehat\Theta_1=\bar y\) becslőfüggvénynek a legkisebb az átlagos négyzetes hibája, így ezt tekinthetjük a legjobb becslőfüggvénynek a négy közül.
Maximum likelihood módszer
Pontbecslés
Az eddigiekben is többféle becslőfüggvényt használtunk pontbecsléshez, azonban minden esetben a becsülendő sokasági jellemzőhöz hasonló becslőfüggvényt használtunk a mintára. Amikor a sokaság átlagát akartuk becsülni, akkor középértékeket használtunk, amelyek közül az mintára alkalmazott átlag, mint becslőfüggvény bizonyult a legjobban. Sok esetben működik, hogy a sokasági jellemzővel megegyező tartalmú mutatót számítunk ki a mintára és ezzel becsüljük a sokasági jellemzőt, amely az analógia elvét követi. Az analógia módszere azonban nem minden esetben működik, ezért megnézünk két módszert, amelyek segítségével jó tulajdonságú becslőfüggvényeket tudunk készíteni. Az elkészített becslőfüggvényeket általában tesztelni kell, hogy tényleg megfelelnek-e az elvárásainknak. Ha elégedettek vagyunk a becslőfüggvénnyel, akkor a minta elemeit behelyettesítve készíthetünk becslét a sokasági jellemzőre.
Maximum likelihood módszer
A maximum likelihood módszert általában ismert eloszlású sokaságok esetén az eloszlás paraméterének, vagy paramétereinek a becslésére használjuk. A módszer kedvező tulajdonságú becslőfüggvényeket eredményez, ugyanis ha létezik minimális varianciájú, torzítatlan becslés, akkor a Maximum likelihood módszerrel ezt a becslőfüggvényt kapjuk meg.
A módszer lényege, hogy az ismert eloszlású sokaságból származó mintára felírjuk annak a valószínűségét, hogy éppen az általunk vizsgált minta adódjék. Ez a valószínűség az ismeretlen paraméter(ek) függvénye, és likelihood függvénynek nevezzük. Az alapötlet az, hogy a felírt likelihood függvény olyan paraméterét vagy paramétereit keressük, amely esetén a legnagyobb valószínűséggel az adott minta adódik. A likelihood függvény felírását követően lényegében, annak maximumát kell megkeresnünk, szélsőérték számítási módszerekkel.
Példa
Egy gyógyszerkutatás során azt kívánják felmérni, hogy egy adott gyógyszernek milyen gyakran van mellékhatása. A gyógyszert használók közül FAE módszerrel 25 embert kiválasztanak és feljegyzik, hogy tapasztaltak-e kedvezőtlen tüneteket. A válaszokat csak “igen/nem” formában kérik, a tünetek fajtájára és intenzitására nem kérdeznek rá. A kapott eredményeket az alábbi módon rögzítették:
\[
\begin{aligned}
I\;N\;N\;I\;\ldots\;N
\end{aligned}\notag
\]
Összesen \(5\) esetben válaszoltak a megkérdezettek igennel, és \(20\)-an nemmel. A FAE (visszatevéses) mintavétel miatt tudjuk, hogy egy esemény bekövetkezésének valószínűségét a binomiális eloszlás írja le, ha két állapot közül egyszer az egyik másszor a másik következik be. A binomiális eloszlás általános alakja:
\[
\begin{aligned}
P(X=k)=\binom{n}{k}p^k(1-p)^(n-k)
\end{aligned}\notag
\]
A binomiális eloszlásnak két paramétere van \((n,p)\), amelyből jelen esetben \(n\) a minta nagysága, így csak a \(p\) paramétert kell becsülnünk. Írjuk fel annak a valószínűségét, hogy a kiválasztott minta \(y_1\) első eleme \(I\), feltételezve, hogy a binomiális eloszlás paraméterei \((25,p)\):
\[
\begin{aligned}
P(y_1=I|p)=p
\end{aligned}\notag
\]
Hasonlóan annak a valószínűsége, hogy a második elem \(N\):
\[
\begin{aligned}
P(y_2=N|p)=1-p
\end{aligned}\notag
\]
A minta alapján felírhatjuk a teljes mintára vonatkozó feltételes valószínűséget, amelyet az egyes mintaelemek függetlensége (FAE mintavétel) miatt egyszerűbb alakra is hozhatunk:
\[
\begin{aligned}
P(y_1=I,y_2=N,\ldots y_{25}=N|p)=\\
=P(y_1=I|p)\cdot P(y_2=N|p)\cdot\ldots\cdot P(y_{25}=N|P)=\\
=p\cdot(1-p)\cdot\ldots\cdot(1-p)=p^5\cdot (1-p)^{20}
\end{aligned}\notag
\]
A mintában az elemek sorrendje nem számít, amelyet eddig figyelembe vettünk, így a korábban kapott eredményhez házzá kell venni az összes olyan minta eredményét, amelyben \(5\) “igen” és \(20\) darab “nem” szerepel, így az likelihood függvény:
\[
\begin{aligned}
P(k=I|p)\binom{20}{5}p^5(1-p)^{20}=L(y_1,y_2,\ldots y_{20})
\end{aligned}\notag
\]
Táblázat
A likelihood függvény maximumát keressük, amelyhez először a függvény értékét néhány lehetséges \(p\) értékre nézünk meg.
\[
\begin{array}{c|c}
p&L(y_1,y_2,\ldots ,y_{20})\\
\hline
0&0\\
0,1&0,0645937\\
0,2&0,196015\\
0,3&0,103017\\
0,4&0,0198914\\
0,5&0,0015834\\
\end{array}\notag
\]
Ábra
A táblázatból láthatjuk, hogy a likelihood függvény (a vizsgált adatok közül) a \(p=0,2\)-es érték mellett veszi fel a maximumát, amely várható volt, ugyanis \(\dfrac{5}{25}=0,2\). Természetesen azt nem tudjuk, hogy a \(p=0,2\) pontos vagy közelítő érték. A pontos érték meghatározásához deriválással keressük meg a szélsőértéket. A likelihood függvény helyett annak logaritmusának határozzuk meg a maximumát, azaz a log-likelihood függvény szélsőértékét keressük.
\[
\begin{aligned}
\log L(y_1,y_2,\ldots,y_{20})&=\log\binom{25}{5}+5\log p+20\log(1-p)\\
\frac{\partial\log L}{\partial p}&=\frac{5}{p}-\frac{20}{1-p}\\
\frac{5}{p}-\frac{20}{1-p}&=0\\
5-5p&=20p\\
\widehat p&=\frac{5}{10}=0,2
\end{aligned}\notag
\]
A második derivált kiszámításával igazolhatjuk, hogy a kapott szélsőérték a függvény maximuma.
\[
\begin{aligned}
\frac{\partial^2L}{\partial p^2}&=-\frac{5}{p^2}-\frac{20}{(1-p)^2} < 0,\quad\forall p \geq 0
\end{aligned}\notag
\]
Alkalmazás
A maximum likelihood módszer bemutatására egy binomiális eloszlást választottunk, amely eredménye várható volt, azonban ennél összetettebb mutatók becslésére is jól használható a módszer. A fenti példában FAE mintát használtunk, amely a feltételes valószínűségek kifejezésénél volt nagy hasznunkra. A módszer egyéb mintavételi eljárások esetén is használható, bár a feltételes valószínűségek kifejezése összetettebb lesz. A likelihood függvény helyett gyakran használjuk a log-likelihood függvényt, amikor annak szélsőértékét keressük annak érdekében, hogy a számítás egyszerűbb legyen.
Legkisebb négyzetek módszere
A legkisebb négyzetek módszere széles körben használatos a statisztikában, így találkozni fogunk vele a regresszió számítás során is. A módszer nagy előnye, akár a maximum likelihood módszerrel szemben is, hogy nincs szükségünk arra, hogy a sokaság valamilyen eloszlást kövessen vagy azt ismerjük. Ha a sokaságban formalizált összefüggés van a jelenség leírására, akkor a legkisebb négyzetek módszerével ezen formalizált összefüggés paramétereit tudjuk becsülni. A jelenséget formalizáltan leíró összefüggést modellnek nevezzük.
A legkisebb négyzetek módszerével a modell paramétereit határozzuk meg úgy, hogy a tényleges és a becsült paraméterrel illesztett modellek négyzetes eltérése a lehető legkisebb legyen. A négyzetes eltérés azt jelenti, hogy elemek eltérésének négyzetösszege minimális. Az Euklideszi térben két objektum távolságát az eltérések négyzetösszegének négyzetgyökével fejezzük ki, így a legkisebb négyzetek módszere a tényleges megfigyelések és a modell közti távolság minimalizálását jelenti. A minimalizálás szélsőérték számítás módszereivel történik.
1. Feladat
Tekintsünk egy mintát, amelynek elemeit jelöljük \(y_1,y_2,\ldots,y_n\)-nel és keressük azt a középértéket, amelyhez képest a minta elemeinek négyzetösszege a legkisebb.
Megoldás
Jelöljük a becsülni kívánt sokasági középértéket \(\mu\)-vel, így a modellünk meglehetősen egyszerűen írható fel \(Y=\mu\). Az \(Y\) sokaság eloszlásáról (ha egyáltalán meghatározó) nincs szükségünk információra, enélkül is alkalmazható a módszer. A minta elemeinek négyzetes eltérését a becsülendő \(\widehat\mu\) középértékhez számítva határozzuk meg.
\[
\begin{aligned}
g(y,\widehat\mu)=\sum_{i=1}^n (y_i-\widehat\mu)^2
\end{aligned}\notag
\]
A fenti függvény minimumát deriválással keressük meg.
\[
\begin{aligned}
\frac{\partial g(y,\widehat\mu)}{\partial\widehat\mu}=2\cdot\sum_{i=1}^n
(y-\widehat\mu)&=0\\
\sum_{i=1}^n y_i-n\widehat\mu&=0\\
\sum_{i=1}^n y_i&=n\widehat\mu\\
\widehat\mu&=\frac{\sum_{i=1}^n y_i}{n}=\bar y
\end{aligned}\notag
\]
Tehát az ismeretlen eloszlású sokaság középértékének becslésére a mintaátlagot kaptuk, a legkisebb négyzetek módszerével. A kapott becslés tulajdonságait a korábban megismert módszerekkel ellenőrizhetjük, azaz kiszámíthatjuk torzítottságát, szórásnégyzetét illetve MSE értékét. A legkisebb négyzetek módszerével kapott becslések értékelésére szükség van, ugyanis nem minden esetben eredményez ez a módszer kedvező tulajdonságú becslést.
2. Feladat
Egy pénzérmét egymás után \(25\)-ször feldobunk, és minden esetben arra fogadunk, hogy fej lesz az eredmény, amellyel \(1\) forintot nyerünk (írás esetén a nyeremény \(0\)). A dobássorozat végén azt látjuk, hogy összesen \(5\) forintot nyertünk. Számítsuk ki a minta alapján az egy dobással elérhető nyeremény várható értékét!
Megoldás
A feladat értékei hasonlítanak a maximum likelihood módszernél bemutatott példa értékeire, amely a megoldás végén összehasonlítási alapul fognak szolgálni.
A modell meghatározásában segít, hogy az egyes dobások eredménye, azaz a minta elemei egyenként értékelhetőek, így \(p\)-vel jelölve egy dobás várható értékét a legkisebb négyzetek módszeréhez szükséges függvény felírható. A minta alapján a becsülni kívánt várható értéket jelöljük \(\widehat p\)-vel, amelyhez képest a mintaelemek legkisebb négyzetes eltérését keressük. Az össznyereményből tudjuk, hogy \(5\)-ször nyertünk és \(20\) alkalommal veszítettünk. A mintaelemek sorrendje nem számít, így a következő függvény minimumát kell meghatároznunk.
\[
\begin{aligned}
g(y,p)&=(y_1-p)^2+(y_2-p)^2+\ldots +(y_{25}-p)^2=\\
&=\underbrace{(1-p)^2+\ldots +(1-p)^2}_\text{5 db tag}+\underbrace{(0-p)^2+\ldots +(0-p)^2}_\text{20 db tag}=\\
&=5\cdot (1-p)^2+20\cdot p^2=\\
&=5-10p+25p^2
\end{aligned}\notag
\]
A fenti függvény minimumát deriválással számítjuk ki:
\[
\begin{aligned}
\frac{\partial g(y,\widehat p)}{\partial\widehat p}=-10 +50p&=0\\
50p&=10\\
p&=0,2\\
\end{aligned}\notag
\]
A minimum igazolása a második deriválttal történik.
\[
\begin{aligned}
\frac{\partial^2 g(y,\widehat p)}{\partial\widehat p^2}=50 > 0\\
\end{aligned}\notag
\]
Az eredmény talán nem meglepő, ha \(25\) feldobásból \(5\) nyer, akkor annak esélye hogy nyerünk \(\dfrac{5}{25}=0,2\). A feladat érdekessége inkább abban rejlik, hogy a maximum likelihood módszerhez hasonló eredményre jutottunk. Mindkét feladat értelmezhető úgy, hogy \(25\) eseményből \(5\) eredménye \((1,\text{ I})\) és \(20\) mintaelem \((0,\text{ N})\), és a “bekövetkezés valószínűségét” keressük. A maximum likelihood módszerhez feltételeztük a binomiális eloszlást, a legkisebb négyzetek módszere esetén nem kellett ezzel a feltételezéssel élnünk. Általánosságban a két módszer eredményezhet azonos eredményt, alkalmazásuk feltétele viszont nagyon eltérő. A maximum likelihood módszer esetén ha létezik legkisebb varianciájú torzítatlan becslőfüggvény, akkor ezt kapjuk eredményül. A legkisebb négyzetek módszerénél nem tudunk ilyen jó tulajdonságot igazolni a kapott becslésről, de nem is kell ismernünk a sokaság eloszlását.
Feladatok pontbecsléshez
1. Feladat
Az \(5,7,9\) számokból visszatevéses (FAE) mintavétellel kiválasztjuk az összes kételemű mintát. A mintákból becsüld meg az átlagot, a maximumot és az értékösszeget analóg módszerrel. A becsléseket vizsgáld meg torzítatlanság és MSE szempontból!
Megoldás
A FAE mintavételi eljárás miatt \(3^2=9\) mintát kell megvizsgálnunk. A korábbihoz hasonló táblázatot készítünk, ahol a becslőfüggvények kiválasztásakor az analógia elvét követjük.
| A minták jellemzői | ||||
|---|---|---|---|---|
| No. | Minta elemei | Átlag
\(\widehat\Theta_1=\bar y\) |
Maximum
\(\widehat\Theta_2=y_{max}\) |
Értékösszeg
\(\widehat\Theta_4=y_i+y_j\) |
| 1. | 5, 5 | 5 | 5 | 10 |
| 2. | 5, 7 | 6 | 7 | 12 |
| 3. | 5, 9 | 7 | 9 | 14 |
| 4. | 7, 5 | 6 | 7 | 12 |
| 5. | 7, 7 | 7 | 7 | 14 |
| 6. | 7, 9 | 8 | 9 | 16 |
| 7. | 9, 5 | 7 | 9 | 14 |
| 8. | 9, 7 | 8 | 9 | 16 |
| 9. | 9, 9 | 9 | 9 | 18 |
Az átlagra 5-féle becslést kaptunk, amelyek gyakoriságát ábrázoljuk oszlopdiagrammal. A gyakorisági diagramon egy háromszög alakzat rajzolódik ki, amely a minta elemszámának növelésével is megtartja ezt a jellegét. Nagyobb elemszámú minta esetén a mintaátlagok eloszlása közelíteni fog a normális eloszlás harang-görbéjéhez, függetlenül az eredeti sokaság eloszlásától. A fentieket a központi határeloszlás tételek segítségével igazolhatjuk.
A becslőfüggvényekre, mint valószínűségi változókra kiszámítottuk az összes lehetséges mintára a függvények értékét, amelyek várható értékét fogjuk meghatározni.
\[
\begin{aligned}
E(\widehat\Theta_1)&=\frac{5+2\cdot 6+3\cdot 7+2\cdot 8+9}{9}=7\\
E(\widehat\Theta_2)&=\frac{5+3\cdot 7+5\cdot 9}{9}=7,89\\
E(\widehat\Theta_3)&=\frac{10+2\cdot 12+3\cdot 14+2\cdot 16+18}{9}=14\\
\end{aligned}\notag
\]
Mielőtt elemeznénk a becslőfüggvények tulajdonságait, számítsuk ki a becslések szórásnégyzetét.
\[
\begin{aligned}
Var(\widehat\Theta_1)&=\frac{(5-7)^2+2\cdot (6-7)^2+3\cdot (7-7)^2+2\cdot (8-7)^2+(9-7)^2}{9}=1,33\\
Var(\widehat\Theta_2)&=\frac{(5-7,89)^2+3\cdot (7-7,89)^2+5\cdot (9-7,89)^2}{9}=1,88\\
Var(\widehat\Theta_3)&=\frac{(10-14)^2+2\cdot (12-14)^2+3\cdot (14-14)^2+2\cdot (16-14)^2+(18-14)^2}{9}=5,33\\
\end{aligned}\notag
\]
A becslőfüggvények értékeléséhez kiszámítjuk az átlagos négyzetes hibákat (MSE).
| A minták jellemzői | ||||
|---|---|---|---|---|
| Átlag
\(\widehat\Theta_1=\bar y\) |
Maximum
\(\widehat\Theta_2=y_{max}\) |
Értékösszeg
\(\widehat\Theta_3=y_i+y_j\) |
||
| Torzítás (Bs) | \(Bs(\widehat\Theta_1)=7-7=0\) | \(Bs(\widehat\Theta_2)=7,89-9=1,11\) | \(Bs(\widehat\Theta_3)=14-21=7\) | |
| Szórásnégyzet (Var) | \(Var(\widehat\Theta_1)=1,33\) | \(Var(\widehat\Theta_2)=1,88\) | \(Var(\widehat\Theta_3)=5,33\) | |
| \(MSE(\hat\Theta)=Var(\widehat\Theta)+Bs^2(\widehat\Theta)\) | \(MSE(\widehat\Theta_1)=1,33\) | \(Var(\widehat\Theta_2)=3,11\) | \(MSE(\widehat\Theta_3)=75,5\) | |
Csak a \(\widehat\Theta_1\) átlag becslőfüggvénye torzítatlan, a másik két becslés torzított, illetve a \(\widehat\Theta_3\) értékösszeg becslése messze lemarad a sokaság értékösszegétől. A maximum becslése csak azokban a mintákban lehet jó, amelyekbe a maximális érték kiválasztásra kerül, a többi biztosan alulbecsüli a maximumot, ezért a sokasági maximumra nem igazán tudunk jó becslőfüggvényt készíteni.
Az értékösszeg becslését vizsgálva láthatjuk, hogy minden minta elemszáma kisebb, mint a sokaságé, így a minta értékösszege sem tudja elérni sokaság értékösszegét, azonban a maximum becslésével ellentétben itt van lehetőségünk “megjavítani” a becslőfüggvényt. Ha arányosítani tudjuk a mintát a sokasághoz, akkor a becslőfüggvény tulajdonságai javulni fognak. Az arányosítással elérhető, hogy a becslőfüggvény torzítatlan legyen, amely kiemelkedő eredménynek tekinthető. Az arányosítás azt jelenti, hogy ha a minta elemszáma a sokaság elemszámának \(10\%\)-a, akkor a mintából becsült értékösszeget szorozzuk meg \(10\)-zel.
A példánkban az értékösszeget úgy tudjuk arányosítani, ha a mintából becsült értékösszeget \(\dfrac{3}{2}\)-del szorozzuk, ugyanis a minta elemszáma \(\dfrac{2}{3}\)-a a sokaságénak. A \(\widehat\Theta_3\) helyett vizsgáljuk meg a \(\widehat\Theta_4=\dfrac{3}{2}(y_i+y_j)=\dfrac{3}{2}\widehat\Theta_3\) becslőfüggvény tulajdonságait.
\[
\begin{aligned}
E(\widehat\Theta_4)&=\frac{3}{2}E(\widehat\Theta_3)=1,5\cdot 14=21\\
Var(\widehat\Theta_4)&=\frac{(15-21)^2+2\cdot (18-21)^2+3\cdot (21-21)^2+2\cdot(24-21)^2+(27-21)^2}{9}=12
\end{aligned}\notag
\]
Látható, hogy az arányosítással kapott \(\widehat\Theta_4\) becslőfüggvény torzítatlan, azonban szórásnégyzete megnövekedett \(\widehat\Theta_3\)-hoz képest. A torzítás és a szórásnégyzet hatását együttesen vizsgálva \(MSE(\widehat\Theta_4)=12\), amely a \(MSE(\widehat\Theta_3)=75,5\)-höz képest jelentős javulást mutat. Tehát a \(\widehat\Theta_4\) minden vizsgált tulajdonságában jobb mint \(\widehat\Theta_3\) (torzítatlan és MSE értéke is jóval alacsonyabb).
2. Feladat
A \(2,12,16,24\) számokból visszatevés nélküli (EV) mintavétellel kiválasztjuk az összes háromelemű mintát. A mintákból becsüld meg az átlagot analóg módszerrel. A becsléseket vizsgáld meg torzítatlanság és MSE szempontból! Az adott sokaság átlagára keressünk egy kisebb MSE-val rendelkező becslőfüggvényt! (A javított becslőfüggvényben a szórást csökkentjük a középső érték súlyának növelésével.)
Megoldás
Az EV mintavétel miatt csak \(4\) féle mintát tudunk készíteni, amelyeket a szokásos táblázatban foglalunk össze. A \(\widehat\Theta_1\) becslőfüggvény a mintából számított átlag, a \(\widehat\Theta_2\) függvény pedig a mintából számított súlyozott átlag lesz, amely a középső elemet kétszeres súllyal veszi figyelembe. A \(\widehat\Theta_2\) várhatóan csökkenti majd a szórásnégyzet értékét. A két függvény összehasonlítását az MSE kiszámításával tehetjük meg.
| A minták jellemzői | |||
|---|---|---|---|
| No. | Minta elemei | Átlag
\(\widehat\Theta_1=\bar y\) |
Súlyozott átlag
\(\widehat\Theta_2=\dfrac{y_i+2y_j+y_k}{4}\) ahol \(y_i\leq y_j\leq y_k\) |
| 1. | 2, 12, 16 | \(\dfrac{2+12+16}{3}=10\) | \(\dfrac{2+2\cdot 12+16}{4}=10,5\) |
| 2. | 2, 12, 24 | 12,67 | 12,5 |
| 3. | 2, 16, 24 | 14 | 14,5 |
| 4. | 12, 16, 24 | 17,33 | 17 |
A táblázatból láthatjuk, hogy a minták kétféle becslőfüggvénnyel becsült értéke között nincs nagy eltérés, sem értékben sem az eloszlás ferdeségében. A pontos értékeléshez számítsuk ki a két becslőfüggvény várható értékét és szórásnégyzetét.
\[
\begin{aligned}
E(\widehat\Theta_1)&=\frac{10+12,67+14+17,33}{4}=13,5\\
E(\widehat\Theta_2)&=\frac{10,5+12,5+14,5+17}{4}=13,625\\
\end{aligned}\notag
\]
A sokaság átlaga \(\dfrac{2+12+16+24}{4}=13,5\), tehát \(\widehat\Theta_1\) torzítatlan, míg \(\widehat\Theta_2\) torzított \(Bs(\widehat\Theta_2)=0,125\). Vizsgáljuk meg a két becslőfüggvény szórásnégyzetét.
\[
\begin{aligned}
Var(\widehat\Theta_1)&=\frac{(10-13,5)^2+(12,67-13,5)^2+(14-13,5)^2+(17,33-13,5)^2}{4}=6,97\\
Var(\widehat\Theta_2)&=\frac{(10,5-13,625)^2+(12,5-13,625)^2+(14,5-13,625)^2+(17-13,625)^2}{4}=5,8\\
\end{aligned}\notag
\]
| A minták jellemzői | ||
|---|---|---|
| Átlag
\(\widehat\Theta_1=\bar y\) |
Súlyozott átlag
\(\widehat\Theta_2=\dfrac{y_i+2y_j+y_k}{4}\) ahol \(y_i\leq y_j\leq y_k\) |
|
| Torzítás (Bs) | \(Bs(\widehat\Theta_1)=0\) | \(Bs(\widehat\Theta_2)=0,125\) |
| Szórásnégyzet (Var) | \(Var(\widehat\Theta_1)=6,97\) | \(Var(\widehat\Theta_2)=5,8\) |
| \(MSE(\hat\Theta)=Var(\widehat\Theta)+Bs^2(\widehat\Theta)\) | \(MSE(\widehat\Theta_1)=6,97\) | \(Var(\widehat\Theta_2)=5,82\) |
A becslőfüggvények összehasonlításából látszik, hogy az MSE alapján számított hiba tekintetében a \(\widehat\Theta_2\) becslőfüggvény, a megadott sokaság átlagát jobban becsüli, azonban a mintaátlag torzítatlanságához képest \(\widehat\Theta_2\) torzított.
Feladat maximum likelihood módszerhez
1. Feladat
Egy irodaházban \(15\) héten keresztül feljegyezték, hogy hány világítótest hibásodik meg. A meghibásodások gyakoriságáról feltételezhetjük, hogy Poisson-eloszlást követ. A megfigyelt időszakban összesen \(43\) lámpatest hibásodott meg.
| 15 hetes statisztika | |||||||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| hét | 1. | 2. | 3. | 4. | 5. | 6. | 7. | 8. | 9. | 10. | 11. | 12. | 13. | 14. | 15. |
| kiégett izzó (db) | 4 | 2 | 3 | 1 | 5 | 3 | 4 | 2 | 3 | 0 | 6 | 3 | 2 | 4 | 1 |
A lámpatestek gyártója által megadott élettartam alapján, a Poisson-eloszlás alapján számított napi meghibásodások száma 3.
Becsüld meg a Poisson eloszlás \(\lambda\) paraméterét a maximum likelihood módszerrel és számítsd ki, hogy a 15 elemű minta alapján mennyivel tér el a becsült meghibásodási érték a gyártó által megadottól!
Megoldás
A Poisson-eloszlás valószínűségi függvénye egy adott \( k \) eseményszámra így néz ki:
\[
\begin{aligned}
P(X = k) = \frac{\lambda^k e^{-\lambda}}{k!}
\end{aligned}\notag
\]
ahol
- \( X \) az események száma,
- \( \lambda \) az egy időszakra vonatkozó eseményszám várható értéke (Poisson-paraméter),
- \( k \in \{0, 1, 2, \dots \} \).
Jelöljük a minta elemszámát \( n=15 \)-tel, ahol \( y_1, y_2, \dots, y_{15} \) független megfigyeléseket jelent. A minta értékeit a fenti táblázat tartalmazza. A célunk a \( \lambda \) paraméter becslése.
A likelihood függvény a minta alapján:
\[
\begin{aligned}
L(\lambda) &= P(X_1 = y_1, X_2 = y_2, \dots, X_{15} = y_{15}|\lambda) =\\
&=P(X_1=y_1|\lambda)\cdot P(X_2=y_2|\lambda)\cdot\ldots\cdot P(X_{15}=y_{15}|\lambda)=\\
&=\prod_{i=1}^{15} \frac{\lambda^{y_i} e^{-\lambda}}{y_i!}\\L(\lambda) &= \frac{\lambda^{\sum_{i=1}^{15} y_i}\cdot e^{-15 \lambda}}{\prod_{i=1}^{15} y_i!}\\
\end{aligned}\notag
\]
A Log-likelihood függvény
\[
\begin{aligned}
\ln L(\lambda) = \ln \lambda\sum_{i=1}^{15} y_i – 15 \lambda – \sum_{i=1}^{15} \ln (y_i!)
\end{aligned}\notag
\]
Keressük meg az \( \lambda \)-ra vonatkozó maximális értéket, azaz vegyük a log-likelihood deriváltját \( \lambda \) szerint, és tegyük egyenlővé nullával:
\[
\begin{aligned}
\frac{\partial \ln L(\lambda)}{\partial\lambda} &= \frac{1}{\lambda}\sum_{i=1}^{15} y_i – 15 = 0\\
\frac{1}{\lambda}\sum_{i=1}^{15} y_i &= 15\\
\widehat{\lambda} &= \frac{\sum_{i=1}^{15} y_i}{15}
\end{aligned}\notag
\]
A becslés eredménye, hogy a Poisson-eloszlás \( \lambda \) paramétere a megfigyelt eseményszámok átlaga, így \(\lambda\) becsült értéke, a mintából számítva \(\widehat\lambda=\dfrac{43}{15}=2,87\), amely jól közelíti a gyártó által megadott \(\lambda=3\) értéket. Az irodaházban tehát a minta alapján arra lehet számítani, hogy hetente átlagosan \(2,87\) darab lámpatest hibásodik meg. A gyártó által megadott \(\lambda=3\) érték elfogadásához további számításokra lenne szükség, amely a későbbi fejezetek témája lesz.


