Valószínűségszámítás és statisztika III.
Tarcsay Tamás
2004/01/12 13:04
1911 megtekintés
A cikk már legalább egy éve nem frissült, az akkor még aktuális információk lehet, hogy mára elavultak.
Sorozatunk, amely Magyar Zsolt tanár úr - a Közoktatási Modernizációs Közalapítvány által támogatott - dolgozata alapján készült, folytatódik. Célunk segítséget nyújtani a közoktatásban szereplő új témakör, a statisztika tanulásához és tanításához. Korábban a statisztikai adatok ábrázolásáról és a statisztikai közepek ről írtunk.

A középértékek "jóságának" mérőszámai

Medián

A sorozat előző írásában láthattuk, hogy a leggyakrabban használatos középértékek a módusz, a medián és az átlag. Természetesen az adathalmazt bármilyen más, egyéb módon definiált középértékkel lehet jellemezni, hiszen nagyon sokféle szempont dominálhat ennek megadásában. Felmerül viszont az a kérdés, hogy egy adott középérték mennyire jellemzi jól az adathalmazt, mennyire nagy az egyes elemektől való eltérése. Ennek megadására újabb mérőszámot vagy mérőszámokat kell bevezetnünk.

Terjedelem

Megadhatjuk az adathalmaz terjedelmét, azaz a legnagyobb és legkisebb elem különbségét. Ha ez kicsi, akkor gyakorlatilag bármelyik középérték jól jellemzi az adathalmazt, ha pedig nagy, akkor nem lehet eldönteni, hogy mi mennyi információt szolgáltat. A terjedelem másik nagy problémája, hogy egy-egy adatra nagyon érzékeny, tehát nagyon nagy lehet, ha van egy kiugró adat a többi között, amely a többihez képest nagyon nagy, vagy nagyon kicsi, holott az adatok lényegében egy szám környékén tömörülhetnek. Ezt szokták úgy kiküszöbölni pl. fizikai kísérletek eredményének kiértékelésekor, hogy a legnagyobb és legkisebb adatot kihagyják az értékelésből, azonban ez nem minden esetben tehető meg. (Természetesen ez a módszer a többi középérték esetén is javítja az értékelés jóságát.)

Vehetnénk azt is, hogy átlagosan mekkora eltérései vannak az adathalmaz elemeinek a megadott középértéktől, ezt nevezhetnénk átlagos eltérésnek. (Az eltérések számtani közepe.) Ennek a mutatónak azonban van egy óriási hátránya: mivel a megadott középértéknél feltehetően vannak nagyobb és kisebb adatok is az adathalmazban, az összegben szerepelnek pozitív és negatív tagok is, ezek viszont összességében eredményezhetnek nagyon kicsi számot, holott ők maguk abszolút értékben lehetnek nagyok.

Kérdés

  • Mi az átlagos eltérés, ha a középértéknek az átlagot (számtani közepet) választjuk?

Ki kell tehát küszöbölni az előjelproblémát az átlagos eltérésből. Erre a legegyszerűbb módszer, ha az eltérések abszolút értékét átlagoljuk, ennek neve átlagos abszolút eltérés.

Kérdés

  • Melyik középérték választása esetén lesz az átlagos abszolút eltrérés minimális?

Szórás

A másik módszer az előjel kiküszöbölésére a négyzetre emelés. Tehát megadhatjuk az átlagos négyzetes eltérést, ami az eltérések négyzetének átlaga.

Ezzel azonban főleg mértékegység problémák vannak. Ha az adatok valamilyen mértékegységgel rendelkeznek, akkor az átlagos négyzetes eltérés mérőszáma ennek négyzete, tehát szokás ennek négyzetgyökét venni.

Kérdés

  • az átlagos négyzetes eltérés milyen közép választása esetén lesz minimális?

Az átlagos négyzetes eltérést a számtani középre felírva empirikus szórásnégyzetnek nevezzük, a négyzetgyökét empirikus szórásnak.

Felmerülhet az a kérdés, hogy ezen mérőszámok közül melyiket érdemes használni a gyakorlatban? Erre a kérdésre a későbbiekben tárgyalandó Csebisev-egyenlőtlenség adja meg majd a választ.

Csatlakozz hozzánk!

Ajánljuk

European Schoolnet Academy Ingyenes online tanfolyamok tanároknak
School Education Gateway Ingyenes tanfolyamok és sok más tanárok számára
ENABLE program Program iskoláknak a bullying ellen
Jövő osztályterme Modern tanulási környezetekről a Sulineten