Základy analýzy dát
1. Typ premennej I.
V doterajšom hodnotení študentov mediamatiky boli výsledky z predmetu Štatistické metódy nasledujúce: známku A získalo 11% študentov; známku B získalo 14% študentov; známku C získalo 18% študentov; známku D získalo 22% študentov; známku E získalo 29% študentov a nakoniec 6% sa nepodarilo predmet úspešne ukončiť, čiže ich hodnotenie bolo FX. Aký typ premennej predstavuje známka, ktorú získali študenti?
- ordinálna
- nominálna
- numerická, spojitá
- numerická, diskrétna
Výsledok
Postup riešenia
2. Typ premennej II.
Ktoré z nasledujúcich sú príkladmi kvantitatívnych/numerických/číselných premenných (viacero možností je správnych)?
- mesačná mzda
- miesto pobytu
- telefónne číslo
- výška skúmanej osoby udávaná v centimetroch
- farba očí
- číslo občianskeho preukazu
Výsledok
Postup riešenia
3. Typ premennej III.
Ktoré z nasledujúcich náhodných premenných nie sú spojité? (viacero možností je správnych):
- dĺžka telefonického hovoru
- počet znakov, ktoré padli pri 100násobnom hádzaní mincou
- počet úmrtí pri pádoch lietadla za rok
- množstvo peňazí, ktoré domácnosť utratila za potraviny za rok
- počet základných škôl v meste
Výsledok
Postup riešenia
4. Typ premennej IV.
Ktoré z nasledujúcich premenných sú diskrétne (viacero možností je správnych)?
- hmotnosť dospelých jedincov v SR
- vzdialenosť medzi dvoma mestami
- počet detí v rodine
- mesačný úhrn zrážok v meste
- mesačná mzda v €
- počet ľudí odsúdených za závažný trestný čin za rok
Výsledok
Postup riešenia
5. Typ premennej V.
Ktoré z nasledujúcich sú príkladmi kategoriálnych premenných (viacero možností je správnych)?
- počet ukončených rokov školskej dochádzky
- ročný úhrn zrážok
- ukončený stupeň vzdelania
- ročný príjem (v eurách)
- akademická hodnosť (Bc., Mgr., PhD., atď)
Výsledok
Postup riešenia
6. Opisné štatistiky I.
Dostali ste nasledujúci súbor údajov: 6, 3, 5, 2, 6, 4, 9. Ktoré z nasledujúcich tvrdení o tomto súbore údajov NIE JE pravdivé?
- Medián je 5.
- Rozpätie je 7.
- Priemer je 6.
- Rozsah je 7.
Výsledok
Postup riešenia
7. Opisné štatistiky II.
Ktoré z nasledujúcich tvrdení NIE JE pravdivé?
- Medián možno použiť pri nominálnych a číselných údajoch.
- Rozptyl sa zvyčajne používa na výpočet iných opisných štatistík.
- Rozpätie aj priemer sú citlivé na extrémne odchýlené hodnoty.
- Rozptyl je druhou odmocninou smerodajnej odchýlky.
Výsledok
Postup riešenia
- Tenisti
K dispozícii máte údaje o platoch prvých desiatich najlepšie zarábajúcich tenistoch v tomto roku (2022) podľa The New York Times. Vypočítajte aritmetický priemer a smerodajnú odchýlku ročného platu týchto tenistov.
| Rank | Player | Country | Points | Earnings in $ |
| 1 | Rafael Nadal | Spain | 6 515 | 2 159 790 |
| 2 | Daniil Medvedev | Russia | 8 435 | 1 649 130 |
| 3 | Felix Auger-Aliassime | Canada | 3 883 | 1 214 760 |
| 4 | Denis Shapovalov | Canada | 2 863 | 1 026 674 |
| 5 | Stefanos Tsitsipas | Greece | 6 565 | 992 345 |
| 6 | Matteo Berrettini | Italy | 4 928 | 954 828 |
| 7 | Roberto Bautista Agut | Spain | 2 585 | 793 391 |
| 8 | Jannik Sinner | Italy | 3 429 | 656 435 |
| 9 | Pablo Carreno Busta | Spain | 2 181 | 655 671 |
| 10 | Diego Schwartzman | Argentina | 2 865 | 628 251 |
Výsledok
Postup riešenia
9. Aritmetický priemer
Vypočítajte aritmetický priemer nasledujúcej množiny dát: 0,003; 0,045; 0,58; 0,687; 1,25; 10,38; 11,252; 12,001. Výsledok zaokrúhlite na tisíciny.
Výsledok
Postup riešenia
10. Smerodajná odchýlka I.
Ktorý z nasledujúcich dátových súborov má najvyššiu smerodajnú odchýlku (bez nutnosti počítať)?
1, 2, 3, 4
1, 1, 1, 4
1, 1, 4, 4
4, 4, 4, 4
1, 2, 2, 4
Výsledok
Postup riešenia
11. Priemer a odchýlka I.
Ktorá z nasledujúcich dátovým množín má aritmetický priemer 3 a smerodajnú odchýlku 1?
- 1, 2, 3, 4, 5
- 3, 3, 3, 3, 3
- 2, 2, 3, 4, 4
- 1, 1, 1, 1, 1
- 0, 0, 3, 6, 6
Výsledok
Postup riešenia
12. Smerodajná odchýlka II.
Ktoré z nasledujúcich dátových množín majú rovnakú smerodajnú odchýlku ako dátová množina 1, 2, 3, 4, 5. (Vyriešte bez výpočtu).
- 10, 20, 30, 40, 50
- 0,1; 0,2; 0,3; 0,4; 0,5
- 6, 7, 8, 9, 10
- 1, 1, 3, 4, 4
Výsledok
Postup riešenia
13. Priemer a odchýlka II.
Ktorá z nasledujúcich dátových množín má aritmetický priemer 15 a smerodajnú odchýlku 1?
- 13, 14, 15, 16, 17
- 15, 15, 15, 15, 15
- 1, 1, 1, 1, 1
- žiadna
- 14, 14, 15, 16, 16
Výsledok
Postup riešenia
14. Priemer a odchýlka III.
Porovnajte aritmetický priemer a smerodajnú odchýlku dvojíc dátových množín A a B (bez nutnosti počítať);
- A: 3, 5, 5, 5, 8, 11, 11, 11, 13
B: 3, 5, 5, 5, 8, 11, 11, 11, 20
- A: -20, 0, 0, 0, 15, 25, 30, 30
B: -40, 0, 0, 0, 15, 25, 30, 30
- A: 0, 2, 4, 6, 8, 10
B: 20, 22, 24, 26, 28, 30
- A: 100, 200, 300, 400, 500
B: 0, 50, 300, 550, 600
Výsledok
Postup riešenia
- Test
V teste zo štatistiky mali možnosť študenti získať maximálne 100 bodov. Náhodným výberom sme vybrali vzorku 20 študentov, ktorých bodové hodnotenie bolo nasledovné: 98 bodov: 2 študenti; 95 bodov: 1 študent; 92 bodov: 3 študenti; 88 bodov: 4 študenti; 87 bodov: 2 študenti; 85 bodov: 2 študenti; 79 bodov: 1 študent; 78 bodov: 2 študenti; 73 bodov: 1 študent; 72 bodov: 1 študent; 65 bodov: 1 študent. Aká je smerodajná odchýlka bodového hodnotenia vybraných študentov? Výsledok zaokrúhlite na desatiny.
Výsledok
Postup riešenia
- Dovolenka v banskom závode
Pracovníci na konkrétnom ťažobnom mieste majú priemerne 35 dní zaplatenej dovolenky za rok (v závislosti od odpracovaných rokov a iných okolností), ktorá je však nižšia ako celoštátny priemer. Vedúci tohto závodu je pod tlakom a miestny zväz baníkov ho núti zvýšiť počet dní platenej dovolenky každému baníkovi. To však vedúci urobiť nechce, pretože by to bolo nákladné. Namiesto toho sa rozhodne prepustiť 10 zamestnancov takým spôsobom, aby sa zvýšil priemerný počet dní dovolenky jeho zamestnancov. Ktorých zamestnancov by mal vedúci prepustiť, aby splnil svoj cieľ?
- tých, ktorí majú najvyšší počet dní dovolenky
- tých, ktorí majú najnižší počet dní dovolenky
- tých, ktorí majú priemerný počet dní dovolenky (35).
Výsledok
Postup riešenia
17. Opisné štatistiky – sumár
18 študentov získalo z 15 bodového testu zo štatistiky nasledujúce počty bodov. Určte všetky opisné štatistiky a vytvorte histogram a škatuľkový graf.
| Adam | 5 |
| Božena | 4 |
| Dušan | 10 |
| Eva | 4 |
| Fero | 4 |
| Henrieta | 7 |
| Jakub | 4 |
| Janka | 5 |
| Jano | 5 |
| Jarmila | 12 |
| Karol | 5 |
| Matej | 2 |
| Milan | 6 |
| Renáta | 5 |
| Tomáš | 6 |
| Veronika | 6 |
| Viktor | 3 |
| Zlatica | 3 |
Výsledok
Postup riešenia
- Medián
Ktorý z nasledujúcich dátových súborov nemá medián 3?
- 3; 3; 3; 3; 3
- 2; 5; 3; 1; 1
- 1; 4; 3; 4; 1
- 1; 2; 5; 3; 4
Výsledok
Postup riešenia
19. Medián a IQR.
Porovnajte medián a IQR dvojíc dátových množín X a Y (bez nutnosti počítať);
- X: 3, 5, 6, 7, 9
Y: 3, 5, 6, 7, 20
- X: 3, 5, 6, 7, 9
Y: 3, 5, 7, 8, 9
- X: 1, 2, 3, 4, 5
Y: 6, 7, 8, 9, 10
- X: 0, 10, 50, 60, 100
Y: 0, 100, 500, 600, 1000
Výsledok
Postup riešenia
- Histogram a boxplot I.
Ktoré opisné štatistiky možno vyčítať aj zo škatuľkového grafu a z histogramu nie a naopak?
Výsledok
Postup riešenia
- Histogram a boxplot II.
Ktorú z nasledujúcich opisných štatistík možno vyčítať aj zo škatuľkového grafu, aj z histogramu:
- medián
- IQR
- tretí kvartil
- minimum
- prvý kvartil
Výsledok
Postup riešenia
- Opisné štatistiky I.
Ktorá z nasledujúcich opisných štatistík je najmenej citlivá na extrémne odchýlené hodnoty?
- aritmetický priemer
- medián
- variačné rozpätie
- smerodajná odchýlka
Výsledok
Postup riešenia
23. Opisné štatistiky II.
Ktoré z nasledujúcich tvrdení sú pravdivé?
- Medián a prvý kvartil nemôžu byť rovnaké hodnoty.
- Maximum a minimum môžu byť rovnaké hodnoty.
- Tretí kvartil má vždy väčšiu hodnotu ako prvý kvartil.
- Variačné rozpätie a medzikvartilové rozpätie môžu byť rovnaké hodnoty.
Výsledok
Postup riešenia
24. Opisné štatistiky III.
Ktoré z nasledujúcich tvrdení nie je pravdivé?
- Medián a prvý kvartil môžu byť rovnaké hodnoty.
- Maximum a minimum môžu byť rovnaké hodnoty.
- Prvý a tretí percentil môžu byť rovnaké hodnoty.
- Variačné rozpätie a medzikvartitové rozpätie môžu byť rovnaké hodnoty.
- Tretí kvartil má vždy väčšiu hodnotu ako prvý kvartil.
Výsledok
Postup riešenia
25. Opisné štatistiky IV.
Ktoré z nasledujúcich tvrdení nie je pravdivé?
- 50% všetkých hodnôt premennej leží medzi prvým a tretím kvartilom
- 50% všetkých hodnôt premennej leží medzi mediánom a maximálnou hodnotou
- 50% všetkých hodnôt premennej leží medzi mediánom a minimálnou hodnotou
- 50% všetkých hodnôt premennej je menších alebo rovných ako medián
- 50% všetkých hodnôt premennej je vždy menších ako aritmetický priemer
Výsledok
Postup riešenia
26. Opisné štatistiky V.
Ktoré z nasledujúcich tvrdení možno považovať za pravdivé?
- Aritmetický priemer je vždy menší ako medián
- Rozptyl je vždy väčší ako smerodajná odchýlka
- Variačné rozpätie je vždy menšie ako medzikvartilové rozpätie
- IQR je vždy menšie ako smerodajná odchýlka
- Ani jedna zo zvyšných odpovedí nie je správna
Výsledok
Postup riešenia
27. Test z anglického jazyka 5 bodové zhrnutie
Z testu z anglického jazyka získali študenti nasledujúce počty bodov: 72, 74, 75, 77, 79, 82, 83, 87, 88, 90, 91, 91, 91, 92, 96, 97, 97, 98, 100. Ktorá z nasledujúcich možností predstavuje 5 bodové zhrnutie? Pozn.: hodnoty kvartilov boli počítané pomocou algoritmu, nie pomocou funkcie v Exceli.
- 72, 79, 90, 96, 100
- 72, 79, 90, 92, 100
- 72, 79, 87, 96, 100
- 72, 78, 90, 96, 100
- 72, 79, 92, 98, 100
Výsledok
Postup riešenia
28. 5 bodové zhrnutie
Róbert sa pokúšal vypočítať 5 bodové zhrnutie z počtu dosiahnutých bodov na skúške a zistil nasledujúce údaje:
Minimum= 30
Maximum = 90
Prvý kvartil = 50
Tretí kvartil = 80
Medián = 85
Čo je na Róbertových výpočtoch nesprávne?
Výsledok
Postup riešenia
- Test zo štatistiky – 5 bodové zhrnutie
Tu sú výsledky dvadsiatich študentov z testu zo štatistiky: 57, 66, 69, 71, 72, 73, 74, 77, 78, 78, 79, 79, 81, 81, 82, 83, 83, 88, 89, 94. Aké je 5-bodové zhrnutie premennej? Ako vyzerá histogram a škatuľkový graf?
Výsledok
Postup riešenia
- Študentský prieskum
Spracujete výsledky študentského prieskumu nasledovným spôsobom:
- premennú intro_extra formou frekvenčnej tabuľky a vhodného grafu;
- pre premennú spánok:
- nájdite všetky opisné štatistiky z prednášky 1
- nakreslite (na papier) histogram
- nájdite 5 bodové zhrnutie
- nakreslite (na papier) boxplot
- pre premennú krajiny:
- nájdite všetky opisné štatistiky z prednášky 1
- nakreslite (na papier) histogram
- nájdite 5 bodové zhrnutie
- nakreslite (na papier) boxplot
Výsledok
Postup riešenia
Pravdepodobnosť
1. Hod mincou: pravda alebo lož?
Je pravdivé nasledujúce tvrdenie?: “Ak hádžeme mincou mnohokrát za sebou a v posledných ôsmich hodoch padol znak, potom šanca, že v nasledujúcom hode padne znak je menej ako 50%.”
Výsledok
Tvrdenie nie je pravdivé. Hody mincou sú nezávislé javy a to, či v predchádzajúcich hodoch padol znak nijako neovplyvní pravdepodobnosť nasledujúceho hodu.
Postup riešenia
2. Kocka II.
Ak hádžeme kockou, aká je pravdepodobnosť, že padne:
- štvorka
- jednotka alebo šestka
- párne číslo alebo 6
- nepárne číslo alebo číslo väčšie ako 3
Výsledok
a. 0,17
b. 0,33
c. 0,5
d. 0,
Postup riešenia
3. Karty I.: pravda alebo lož?
Nech jav A predstavuje vytiahnutie „Face“ karty (t.j. karty s označením J, Q, K) a jav B predstavuje vytiahnutie červenej karty z balíčku 52 kariet. Javy A a B sú vzájomne sa vylučujúce (disjunktné) javy.
Výsledok
Postup riešenia
4. Karty II.: pravda alebo lož?
Nech jav A predstavuje vytiahnutie „Face“ karty (t.j. karty s označením J, Q, K) a jav B predstavuje vytiahnutie esa z balíčku 52 kariet. Javy A a B sú vzájomne sa disjunktné javy.
Výsledok
Javy A a B sú disjunktné javy, tvrdenie je pravdivé. Nie je možné vytiahnuť z balíčka kariet jednu kartu, ktorá by bola súčasne face karta a zároveň eso.
Postup riešenia
5. Čokoláda
V roku 2012 sa uskutočnil prieskum na vzorke 2 373 náhodne vybraných respondentov, ktorí sa mali vyjadriť akú čokoládu majú radi: horkú, mliečnu alebo oba druhy čokolád. 45% respondentov označili, že majú radi mliečnu čokoládu, 33% respondentov horkú čokoládu a 11% majú radi oba druhy čokolád. Určte:
- či to, akú čokoládu má respondent rád, sú disjunktné javy?
- znázornite vennov diagram aj s príslušnými relatívnymi početnosťami;
- koľko percent respondentov majú radi horkú čokoládu, ale určite nie mliečnu?
- koľko percent respondentov majú radi horkú alebo mliečnu čokoládu?
- koľko percent respondentov nemajú radi ani horkú, ani mliečnu čokoládu?
Výsledok
- nie, pretože existujú ľudia, ktorí majú radi aj mliečnu, aj horkú čokolád
- Vennov diagram:
- 22%
- 67%
- 23%
Postup riešenia
6. Vymeškávanie v škole
Z dát zozbieraných zo základných škôl sa zistilo, že 25% všetkých žiakov vymeškalo v škole iba jeden deň, 15% vymeškalo 2 dni a 18% vymeškalo 3 alebo viac dní.
- Aká je pravdepodobnosť, že náhodne vybraný žiak nevymeškal ani jeden deň?
- Aká je pravdepodobnosť, že náhodne vybraný žiak nevymeškal viac ako jeden deň?
- Aká je pravdepodobnosť, že náhodne vybraný žiak vymeškal aspoň jeden deň?
Výsledok
Postup riešenia
- 0,42
- 0,67
7. Americká spoločnosť pre prácu s komunitami I.
Americká spoločnosť pre prácu s komunitami každoročne vydáva správu s aktuálnymi informáciami o živote komunít. V roku 2010 táto spoločnosť zverejnila informáciu, že 14,6% Američanov, žije pod hranicou chudoby, 20,7% Američanov rozpráva doma iným ako anglickým jazykom a 4,2% patrí do oboch kategórií, teda medzi Američanmi je 4,2% takých, ktorí žijú pod hranicou chudoby a zároveň sa doma nerozprávajú po anglicky. Na základe vennovho diagramu určte:
- koľko percent Američanov žije pod hranicou chudoby a doma sa rozprávajú po anglicky?
- koľko percent Američanov žije pod hranicou chudoby alebo sa doma rozprávajú inak ako po anglicky?
- koľko percent Američanov žije nad hranicou chudoby a doma rozprávajú po anglicky?
Výsledok
- 10,4 %
- 31,1%
Postup riešenia
- Dve kocky
Ak hádžeme dvoma kockami (jednou bielou druhou modrou), aká je pravdepodobnosť, že padne:
- na bielej jednotka a súčasne na modrej šestka
- súčet 5
- súčet aspoň 10
- na bielej padne 2 a súčasne na modrej číslo väčšie ako 3
- padne súčet 6 alebo na oboch kockách rovnaké číslo (napr. na bielej 1 a na modrej tiež 1)
- padne súčet 5 alebo 7
Výsledok
- 0,028
- 0,11
- 0,167
- 0,083
- 0,28
Postup riešenia
9. Štyri kocky
Budeme hádzať 4 rôznofarebnými kockami (biela, modrá, červená, zelená). Aká je pravdepodobnosť, že:
- padne práve jedna šestka
- padnú práve tri šestky
Výsledok
- 0,386
- 0,015
Postup riešenia
10. Mince
Predstavme si, že hádžeme mincami. Aká je pravdepodobnosť, že:
- pri hode dvoma mincami na oboch padne znak
- pri hode troma mincami na všetkých troch padne znak
- pri hode desiatimi mincami vždy padne hlava
- pri hode desiatimi mincami padne aspoň jeden znak
Výsledok
- 0,25
- 0,125
- 0,000977
- 0,999023
Postup riešenia
11. Praváci a ľaváci I.
Vieme, že v populácii sa nachádza 9% ľavákov Vypočítajte:
- ak náhodne vyberieme dvoch jedincov, aká je pravdepodobnosť, že budú obaja ľaváci;
- ak náhodne vyberieme dvoch jedincov, aká je pravdepodobnosť, že budú obaja praváci;
- ak náhodne vyberieme piatich jedincov, aká je pravdepodobnosť, že budú všetci praváci
- ak náhodne vyberieme piatich jedincov, aká je pravdepodobnosť, že budú všetci ľaváci
- ak náhodne vyberieme piatich jedincov, aká je pravdepodobnosť, že nie všetci budú praváci?
Výsledok
- 0,0081
- 0,8281
- 0,624
- 0,0000059
- 0,376
Postup riešenia
12. Praváci a ľaváci II.
Predpokladajme, že premenné pohlavie a to, či je človek pravák alebo ľavák sú nezávislé (teda vedomosť o tom, či je človek muž alebo žena nám nedá žiadnu užitočnú informáciu o tom, či je pravák alebo ľavák)a že v populácii je 9% ľavákov a 50% mužov. Vypočítajte:
- aká je pravdepodobnosť, že jeden vybraný jedinec bude muž pravák;
- aká je pravdepodobnosť, že dvaja vybraní jedinci budú muži praváci;
- aká je pravdepodobnosť, jeden vybraný jedinec bude žena ľaváčka;
- aká je pravdepodobnosť, že z troch jedincov budú dvaja muži praváci a jedna žena ľaváčka?
Výsledok
- 0,455
- 0,207
- 0,045
- 0,009
Postup riešenia
13. Vrecko s kockami
Predstavte si, že máte vrecko, v ktorom je 5 červených, 3 modré a 2 oranžové kocky.
- ako prvú kocku ste z vrecúška vytiahli modrú kocku a nechali ste si ju (nevrátili ste ju naspäť do vrecúška). Aká je pravdepodobnosť, že druhá vytiahnutá kocka bude opäť modrá?
- tentokrát ste ako prvú kocku vytiahli oranžovú kocku a nechali ste si ju (nevrátili ste ju naspäť do vrecúška). Aká je pravdepodobnosť, že druhá vytiahnutá kocka bude modrá?
- Aká je pravdepodobnosť, že prvá aj druhá vytiahnutá kocka budú modré (prvú kocku po vytiahnutí nevrátite naspäť do vrecúška)?
Výsledok
- b. 0,33
- c. 0,067
Postup riešenia
14. Zásuvka s ponožkami
Vo vašej zásuvke na ponožky sa nachádzajú 4 modré, 5 sivých a 3 čierne ponožky. Ráno, ešte poslepiačky, si zo zásuvky náhodne vyberiete 2 ponožky. Zistite, aká je pravdepodobnosť, že:
- ste si vybrali 2 modré
- ste si nevybrali ani jednu sivú.
- ste si vybrali aspoň jednu čiernu.
- ste si vybrali zelenú ponožku.
- ste si vybrali pár (teda dve ponožky rovnakej farby).
Výsledok
- 0,09
- 0,318
- 0
- 0,29
Postup riešenia
- Oblečenie
Predstavte si triedu, v ktorej je 24 študentov a študentiek. 7 z nich má oblečené džínsy, 4 majú oblečené šortky, 8 má sukňu a zvyšok legíny. (pozn. žiadny študent ani študentka nemá na seba oblečené súčasne dva druhy oblečenia). Náhodne vyberieme 3 jedincov. Aká je pravdepodobnosť, že v trojici vybraných jedincov budú mať dvaja oblečené džínsy a jeden legíny?
Výsledok
0,0519
Postup riešenia
- Kiahne I.
Národné centrum pre očkovanie zistilo, že 90% populácie prekonalo kiahne pred dosiahnutím dospelosti. Aká je pravdepodobnosť, že
- práve 3 z 8 náhodne vybraných ľudí prekonali v detstve kiahne
- práve 7 z 8 náhodne vybraných ľudí prekonalo v detstve kiahne
- aspoň jeden z 8 náhodne vybraných ľudí prekonal v detstve kiahne
Výsledok
- 0,033
- 0,38
- 0,99999999
Postup riešenia
17. Kiahne II.
Národné centrum pre očkovanie zistilo, že 90% populácie prekonalo kiahne pred dosiahnutím dospelosti. Predpokladajme, že náhodne vyberieme vzorku 100 ľudí. Aká je pravdepodobnosť, že práve 8 zo 100 náhodne vybraných občanov nemalo v detstve kiahne? Výsledok zaokrúhlite na stotiny.
Výsledok
Postup riešenia
- Konzumácia alkoholu u mladých ľudí I.
Ústav na liečbu drogových závislostí a duševného zdravia (v USA) uskutočnil v roku 2008 prieskum, podľa ktorého 70% 18-20 ročných mladých ľudí konzumuje alkoholické nápoje. Vypočítajte pravdepodobnosť, že:
- práve 5 z 10 náhodne vybraných ľudí vo veku 18-20 rokov konzumujú alkoholické nápoje,
- práve 3 z 10 náhodne vybraných ľudí vo veku 18-20 rokov nekonzumujú alkoholické nápoje?
- aspoň jeden z 10 náhodne vybraných ľudí vo veku 18-20 rokov konzumuje alkoholické nápoje
Výsledok
- a. 0,1
- b. 0,27
- c. 0,999994
Postup riešenia
Náhodná premenná a normálne rozdelenie
1. Rozdelenie pravdepodobnosti náhodnej premennej
Nasledujúce možnosti môžu predstavovať rozdelenie pravdepodobnosti náhodnej premennej „Hodnotenie z predmetu Štatistické metódy“. Označte, ktoré z možností sú nesprávne.
- A: 0,25; B: 0,30; C: 0,2; D: 0,1; E: 0,1; FX: 0,05
- A: 10%; B: 20%; C: 30%; D: 20%; E: 10%; FX: 10%
- A: 10%; B: 20%; C: 20%; D: 20%; E: 10%; FX: 10%
- A: 20%; B: 20%; C: 30%; D: 20%; E: 10%; FX: 0%
- A: 0,25; B: 0,30; C: 0,2; D: 0,15; E: -0,1; FX: 0,2
- A: 0,25; B: 0,30; C: 0,2; D: 0,2; E: 0,1; FX: 0,05
Výsledok
Postup riešenia
2. Kocky v kasíne I.
Budeme hádzať 4 kockami, na ktorú z nasledujúcich možností by ste si v kasíne vsadili? Aby ste svoj odhad potvrdili, vytvorte tabuľku a histogram rozdelenia náhodnej premennej X = počet šestiek vo štvorici kociek:
- že nepadne žiadna šestka
- že padne práve jedna šestka;
- že padnú práve dve šestky
- že padnú práve tri šestky
- že na všetkých štyroch kockách padne šestka.
Výsledok
- a. 0,48
- b. 0,39
- c. 0,12
- d. 0,015
- e. 0,00077
Postup riešenia
3. Kocky v kasíne II.
Budeme hádzať 5 kockami. Aká je pravdepodobnosť, že:
- padne práve jedna šestka;
- padnú práve tri šestky;
- na ktorú z nasledujúcich možností, by ste si v kasíne vsadili a prečo:
- že nepadne žiadna šestka;
- že padne práve jedna šestka;
- že padnú práve dve šestky;
- že padnú práve tri šestky;
- že padnú práve štyri šestky;
- že na všetkých piatich kockách padne šestka.
Výsledok
Postup riešenia
4. Knihy vyžadované v predmetoch.
Nech X je náhodná premenná = počet kníh, ktoré sú vyžadované v jednotlivých predmetoch na univerzite. Táto premenná nadobudla pre univerzitu v tomto akademickom roku hodnoty: 0, 1, 2, 3 a 4. Pravdepodobnosť výskytu týchto hodnôt bola 0,10; 0,20; 0,40; 0,20; 0,10. Aká je smerodajná odchýlka náhodnej premennej X? Výsledok zaokrúhlite na desatiny.
Výsledok
1,1
Postup riešenia
5. Súrodenci
Nech X je náhodná premenná počet súrodencov študentov na univerzite. Hodnoty náhodnej premennej sú: 0, 1, 2, 3 a 4: 0,25; 0,49; 0,14, 0,09 a 0,03. Aký je priemerný počet súrodencov univerzitných študentov (stredná hodnota náhodnej premennej X), aký je rozptyl a smerodajná odchýlka tejto náhodnej premennej?
Výsledok
E(X) = 1,16; V(X) = 0,9944; SD(X) = 0,997
Postup riešenia
6. Hazard
Predstavte si, že si zahráme nasledujúcu kartovú hru: z balíčka dobre premiešaných pokrových kariet (52) vyberieme karty bez toho, aby sme ich vložili späť. Ak si vytiahnete 2 esá, vyhráte 200 €. Ak si vytiahnete 3 “Face” karty, vyhráte 100 €. Vo všetkých ostatných prípadoch nevyhráte nič.
- vytvorte tabuľku rozdelenia pravdepodobnosti príslušnej náhodnej premennej a vypočítajte očakávanú (priemernú) výhru, rozptyl a smerodajnú odchýlku príslušnej náhodnej premennej;
- ak by ste za každú hru mali zaplatiť 5 €, hrali by ste túto hru?
Výsledok
- E(X) = 1,9; V(X) = 276,9; SD(X) = 16,6
- hra by bola z dlhodobého hľadiska pre hráča výhodná, ak by za hru zaplatil menej ako 1,9 €
Postup riešenia
- 0,42
- 0,67
7. Štandardné normálne rozdelenie I.
Pre akú časť (v percentách) štandardného normálneho rozdelenia (µ=0; σ=1) platí:
- Z < -1,35
- Z < 1,08
- Z > 1,48
- Z > -0,45
- -0,4 < Z < 1,5
- |Z|> 2?
Výsledok
- 8,85%
- 85,99%
- 6,94%
- 67,36%
- 58,86%
- 4,55%
Postup riešenia
- Štandardné normálne rozdelenie II.
Pre akú časť (v percentách) štandardného normálneho rozdelenia (µ=0; σ=1) platí, že Z > -1,13? Výsledok zaokrúhlite na stotiny. Hint: Obrázok určite pomôže.
Výsledok
87,08%
Postup riešenia
9. Štandardné normálne rozdelenie III.
Pre akú časť (v percentách) štandardného normálneho rozdelenia (µ=0; σ=1) platí, že Z < 0,18? Výsledok zaokrúhlite na stotiny. Hint: Obrázok určite pomôže.
Výsledok
57,14%
Postup riešenia
10. Štandardné normálne rozdelenie IV.
Pre akú časť (v percentách) štandardného normálneho rozdelenia (µ=0; σ=1) platí, že -0,6 < Z < 1,2? Výsledok zaokrúhlite na desatiny. Hint: Obrázok určite pomôže.
Výsledok
61,07%
Postup riešenia
11. Štandardné normálne rozdelenie V.
Pre akú časť (v percentách) štandardného normálneho rozdelenia (µ=0; σ=1) platí, že|Z|> 0,5? Výsledok zaokrúhlite na stotiny. Hint: Obrázok určite pomôže.
Výsledok
61,71%
Postup riešenia
12. Testy SAT
O testoch SAT vieme, že priemerný počet bodov, ktoré môžu študenti získať je 1500 bodov so smerodajnou odchýlkou 300 bodov a rozdelenie pravdepodobnosti je normálne. V tomto teste získali traja študenti nasledujúce počty bodov: Anna 1800 bodov, Dana 900 bodov, Tomáš 1256 bodov. Vypočítajte z-skóre pre Annu, Danu a Tomáša a určte s akým percentilom na testoch SAT dopadli (koľko percent študentov bolo horších než oni).
Výsledok
Anna: z = 1, P(Z<1) = 84,13%; Dana: z = -2; P(Z<-2) = 2,28%; Tomáš: z = -0,81; P(Z<-0,81) = 20,8%
Postup riešenia
13. Test GRE I.
Test GRE (the Graduate Record Examination: http://www.ets.org/gre) otestuje každého uchádzača v dvoch oblastiach: verbálne uvažovanie (VU) a kvantitatívne uvažovanie (KU). Z predchádzajúcich rokov je známe, že priemerné skóre vo VU bolo 462 so smerodajnou odchýlkou 119, priemerné skóre v KU bolo 584 so smerodajnou odchýlkou 151 a obe rozdelenia môžeme považovať za normálne. Alexandra dosiahla vo VU skóre 620 a v KU skóre 670. V ktorej oblasti Alexandra skončila relatívne lepšie?
- vo verbálnom uvažovaní (VU)
- v kvantitatívnom uvažovaní (KU)
- na základe dostupných údajov nie je možné určiť
- v oboch rovnako
Výsledok
Postup riešenia
14. Test GRE II.
Test GRE (the Graduate Record Examination: http://www.ets.org/gre) otestuje každého uchádzača v dvoch oblastiach: verbálne uvažovanie (VU) a kvantitatívne uvažovanie (KU). Z predchádzajúcich rokov je známe, že priemerné skóre vo VU bolo 462 so smerodajnou odchýlkou 119, priemerné skóre v KU bolo 584 so smerodajnou odchýlkou 151 a obe rozdelenia môžeme považovať za normálne. Alexandra dosiahla vo VU skóre 620 a v KU skóre 670.
- Koľko percent študentov dopadlo v kvantitatívnom uvažovaní (KU) horšie ako Alexandra? Výsledok zaokrúhlite na celé percentá.
- Koľko percent študentov dopadlo vo verbálnom uvažovaní (VU) lepšie ako Alexandra? Výsledok zaokrúhlite na celé percentá.
- Aké bolo Filipove skóre v kvantitatívnom uvažovaní, ak viete, že dosiahol 80-ty percentil? Výsledok zaokrúhlite na celé čísla.
- Aké bolo skóre Emílie, ktorá vo verbálnom uvažovaní skončila horšie ako 80% jej kolegov? Výsledok zaokrúhlite na celé čísla.
Výsledok
Postup riešenia
- Triatlon
V triatlone je zvykom, že sú účastníci rozdelení do kategórií podľa pohlavia a veku. Priatelia Leo a Mary sa rozhodli obaja pretekať v Hermosa Beach triatlone a pretek dokončili takto: Leo dosiahol v kategórii mužov od 31 do 34 rokov čas 1:22:28 (4948 sekúnd) a Mary dosiahla v kategórii žien od 25 do 29 rokov čas 1:31:53 (5513 sekúnd). Podľa informácií od organizátorov bol priemerný čas v kategórii mužov od 31 do 35 rokov 4313 sekúnd so smerodajnou odchýlkou 583 sekúnd. V kategórii žien od 25 do 29 rokov bol priemerný čas 5261 so smerodajnou odchýlkou 807 sekúnd. Obe rozdelenia boli normálne. Určte:
- Z-skóre oboch priateľov
- ktorý z priateľov skončil v rámci svojej kategórie lepšie?
- koľko percent bežcov v Leovej kategórii bežalo rýchlejšie ako on?
- koľko percent bežkýn v Maryinej kategórii bežalo rýchlejšie ako ona?
- aký najhorší čas mohol mať bežec v Leovej kategórii, ak chcel patriť medzi 5% najrýchlejších bežcov?
- aký najhorší čas mohla mať bežkyňa v Maryinej kategórii, ak chcela patriť medzi 10%?
Výsledok
Postup riešenia
- Externá časť maturity
V externej časti maturity zo slovenského jazyka, resp. matematiky dosiahli študenti stredných škôl na Slovensku priemerne 52,3 bodov, resp. 45,7 bodov so smerodajnou odchýlkou 15,6 bodov, resp. 15,2 bodov (obe rozdelenia boli normálne). Zuzana získala zo SJ 67 bodov a z matematiky 52 bodov. Vypočítajte:
- v ktorom predmete bola Zuzana úspešnejšia (v ktorom predmete dosiahla vyšší percentil)?
- aký percentil dosiahla v SJ?
- aký percentil dosiahla v matematike?
- koľko študentov na Slovensku je v SJ lepších ako Zuzana, ak viete, že maturitu zo SJ v príslušnom roku robilo 43 709 študentov?
- koľko študentov na Slovensku je v matematike lepších ako Zuzana, ak viete, že maturitu z matematiky v príslušnom roku robilo 6 658 študentov?
- aspoň koľko bodov by ste mali dosiahnuť, ak by ste chceli patriť medzi elitných 5% študentov v externej maturite zo SJ?
- aspoň koľko bodov by ste mali dosiahnuť, ak by ste chceli patriť medzi elitných 10% študentov v externej maturite z matematiky?
Výsledok
Postup riešenia
17. Aukcia na knihy.
Potrebujete si kúpiť knižku, ktorá by bola vhodná pre absolvovanie predmetu Štatistické metódy. Zistíte však, že v jej zakúpenie v „normálnom obchode“ by bolo pre vás veľmi drahé. Preto sa rozhodnete využiť služby Ebay a ich aukcie. Sledovaním aukcií ste zistili, že cena knižky má normálne rozdelenie s priemernou hodnotou 15 € a smerodajnou odchýlkou 2,5 €. Aká je pravdepodobnosť, že pri náhodne vybranej aukcii bude cena menšia ako 10 €? Výsledok zaokrúhlite na stotiny.
Výsledok
Postup riešenia
- Skúškový test.
Z minulých rokov som zistila, že priemerný počet bodov zo skúškového testu zo Štatistických metód je 55 z maximálneho počtu 90 a smerodajná odchýlka je 11 (rozdelenie budeme považovať za normálne).
- Koľko bodov ste museli získať, aby váš test patril medzi 10 % najúspešnejších? Výsledok zaokrúhlite na celé body.
- Koľko percent pokusov neprekročilo magickú hranicu 55 bodov, ktorá bola považovaná za hraničnú, aby bol test považovaný za úspešný?
- Keby ste v skúškovom teste získali 80 bodov, koľko percent pokusov by bolo horších ako ten váš? Výsledok zaokrúhlite na desatiny
Výsledok
Postup riešenia
19. Národný test z matematiky I.
Predpokladajme, že výsledky národného testu z matematiky majú normálne rozdelenie s aritmetickým priemerom 1000 bodov a smerodajnou odchýlkou 100. Ktoré z nasledujúcich tvrdení nie je pravdivé?
- Približne 68% študentov získalo v teste 900 až 1100 bodov.
- Očakávame, že počet študentov, ktorí získali viac ako 1200 bodov je vyšší ako počet študentov, ktorí získali menej ako 900 bodov.
- Počet bodov vyšší ako 1300 je menej očakávaný ako počet bodov nižší ako 800.
- Približne 84% študentov získalo viac ako 900 bodov.
Výsledok
Postup riešenia
20. Národný test z matematiky II.
Predpokladajme, že výsledky národného testu z matematiky majú normálne rozdelenie s aritmetickým priemerom 800 bodov a smerodajnou odchýlkou 100. Ktoré z nasledujúcich tvrdení nie je pravdivé?
- Približne 68% študentov získalo v teste 700 až 900 bodov.
- Očakávame, že počet študentov, ktorí získali viac ako 1000 bodov je vyšší ako počet študentov, ktorí získali menej ako 500 bodov.
- Počet bodov vyšší ako 1100 je viac očakávaný ako počet bodov nižší ako 600.
- Približne 84% študentov získalo viac ako 700 bodov.
Výsledok
Postup riešenia
21. Hmotnosť mincí.
Rozdelenie premennej váha mince (v gramoch) je normálne s priemerom 2,5 gramu a smerodajnou odchýlkou 0,08 gramu. Vypočítajte, aká je pravdepodobnosť, že náhodne vybraná minca bude vážiť menej ako 2,4 gramu? Výsledok zaokrúhlite na desatiny.
Výsledok
Postup riešenia
Geometrické a binomické rozdelenie
1. Batožina
Nasledujúce možnosti môžu predstavovať rozdelenie pravdepodobnosti náhodnej premennej „Hodnotenie z predmetu Štatistické metódy“. Označte, ktoré z možností sú nesprávne.
Výsledok
Postup riešenia
2. Šošovky
Kontrolóri kvality v spoločnosti na výrobu mikroskopov testovali šošovky všetkých mikroskopov, aby sa presvedčili, či rozmery šošoviek sú správne. Počas jedného mesiaca otestovali 600 šošoviek. Aritmetický priemer hrúbky šošovky bol 2 mm a smerodajná odchýlka 0,000025 mm, rozdelenie premennej hrúbka bolo normálne. Spoločnosť ako nepodarky vyhlásila všetky šošovky, ktorých hrúbka bolo viac ako jednu smerodajnú odchýlku od priemeru. Určte približne koľko zo skontrolovaných šošoviek počas jedného mesiaca boli nepodarky.
Výsledok
Postup riešenia
3. Mensa
MENSA je organizácia, v ktorej sú združení ľudia s vysokým IQ. Ide o ľudí, ktorých IQ dosahuje hodnotu aspoň 132, čo predstavuje 2% celej populácie. Zistite, aká je smerodajná odchýlka IQ celej populácie, ak viete že priemerná hodnota IQ je 100 a rozdelenie premennej je normálne. Výsledok zaokrúhlite na desatiny.
Výsledok
Postup riešenia
4. Gény po rodičoch
Manžel aj manželka majú obaja hnedé oči, ale majú gény, ktoré môžu spôsobiť, že ich deti budú mať hnedé oči (s pravdepodobnosťou 0,75), modré oči (s pravdepodobnosťou 0,125) alebo zelené oči ( s pravdepodobnosťou 0,125).
- aká je pravdepodobnosť, že prvé modrooké dieťa sa narodí ako tretie v poradí? Predpokladajme, že farba očí u detí sú nezávislé a identické javy.
- priemerne koľko pokusov by mal manželský pár uskutočniť (presnejšie koľko detí by mal mať), aby mali modrooké dieťa?
- Aká je smerodajná odchýlka?
Výsledok
- P(3) = 0,096
- 𝜇 = 8
- σ = 7,48
Postup riešenia
5. Stroj na výrobu tranzistorov
Stroj na výrobu špeciálneho typu tranzistorov (súčasť počítača) má chybovosť 2%. Produkciu môžeme považovať za náhodný proces, pri ktorom je výroba jednotlivých tranzistorov na sebe nezávislá a identická.
- aká je pravdepodobnosť, že piaty tranzistor bude ako prvý chybný?
- aká je pravdepodobnosť, že desiaty tranzistor bude ako prvý chybný?
- aká je pravdepodobnosť, že v sto kusoch nie je ani jeden chybný?
- priemerne koľko očakávame, že sa vyprodukujeme dobrých tranzistorov, kým nevyrobíme chybný kus?
- Aká je smerodajná odchýlka?
- iný stroj na výrobu tranzistorov má chybovosť 5%. Koľko tranzistorov priemerne očakávame, že sa vyprodukuje v tomto stroji, kým sa nevyrobí nepodarok?
- Aká je teraz smerodajná odchýlka?
Výsledok
- P(5) = 0,018
- P(10) = 0,017
- P(0 zo 100) = 0,133
- 𝜇 = 50
- σ = 49,5
- 𝜇 = 20
- σ = 19,5
Postup riešenia
6. Obézni Američania
V roku 2012 sa uskutočnil Gallupov prieskum, na základe ktorého sa zistilo, že 26,2% Američanov je obéznych.
- aká je pravdepodobnosť, že medzi 10 náhodne vybranými Američanmi bude práve 6 obéznych?
- koľko obéznych ľudí budeme očakávať vo vzorke 100 Američanov?
- aká bude smerodajná odchýlka?
Výsledok
Postup riešenia
7. Kiahne III.
O americkej populácii viete, že 90% Američanov prekonalo kiahne v detskom veku. Uvažujeme, že budeme náhodne vyberať vzorku so 120 Američanmi. Ako budeme postupovať pri výpočte pravdepodobnosti, že vo vzorke 120 náhodne vybraných Američanov bude najviac 105 ľudí, ktorí prekonali kiahne v detskom veku.
- Budeme používať binomickú formulu, pretože n=120; k=0, 1, …, 105 a p=0,9.
- Mohli by sme použiť binomickú formulu, ale bolo by to veľmi zdĺhavé a preto radšej skontrolujeme, či n.p ≥10 a n.(1-p) ≥ 10 a využijeme normálnu aproximáciu binomického rozdelenia.
- Keďže nie sú splnené podmienky pre normálnu aproximáciu binomického rozdelenia, úlohu nie je možné z dostupných informácií vyriešiť.
Výsledok
Postup riešenia
8. Kiahne IV.
Na základe údajov Svetovej zdravotníckej organizácie 90% Američanov prekonalo kiahne v detskom veku. Uvažujeme, že budeme náhodne vyberať vzorku so 150 Američanmi.
- koľko Američanov, ktorí prekonali kiahne v detskom veku budeme očakávať v tejto vzorke 150 Američanov?
- aká bude smerodajná odchýlka?
- aká je pravdepodobnosť, že práve piati zo 150 vybraných Američanov prekonali kiahne?
- aká je pravdepodobnosť, že vo vzorke 150 Američanov bude viac ako 130 takých, ktorí v detskom veku prekonali kiahne?
Výsledok
- 𝜇 = 135
- σ = 3,67
- podmienky na aproximáciu normálnym rozdelením sú splnené; z = -1,36; P (z > -1,36) = 0,913
Postup riešenia
9. Aproximácia binomického rozdelenia
Ktoré z nasledujúcich binomických rozdelení s parametrami n a p sa dá aproximovať normálnym rozdelením:
- n = 100; p = 0,95;
- n = 25; p = 0,45;
- n = 150; p = 0,05;
- n = 500, p = 0,015
Výsledok
Postup riešenia
10. Konzumácia alkoholu u mladých ľudí II.
Ústav na liečbu drogových závislostí a duševného zdravia (v USA) uskutočnil v roku 2008 prieskum, podľa ktorého 70% 18-20 ročných mladých ľudí konzumuje alkoholické nápoje. Uvažujme o vzorke 50 náhodne vybraných 18-20 ročných mladých ľudí.
- koľko budeme očakávať vo vzorke 50 mladých ľudí tých, ktorí konzumujú alkoholické nápoje?
- prekvapí nás, ak vo vzorke 50 mladých ľudí bude 45 a viac ľudí konzumujúcich alkoholické nápoje? (za prekvapivý výsledok sa považuje taký, ktorý je od priemeru vzdialený o viac ako dve smerodajné odchýlky)
- vypočítajte pravdepodobnosť, že vo vzorke 50 mladých ľudí bude 45 a viac ľudí konzumujúcich alkoholické nápoje.
Výsledok
Postup riešenia
Induktívna štatistika
1. Čipy
Ako súčasť kontroly kvality v spoločnosti na výrobu čipov do počítačov, inžinier náhodne vybral 212 čipov z týždennej produkcie, aby otestoval súčasné percento chybovosti čipov a zistil, že 27 z nich je naozaj chybných.
- čo je v tomto prípade populácia?
- aký parameter budeme odhadovať?
- aký je bodový odhad parametra?
- ako sa nazýva štatistika, ktorou meriame to, ako sa náš odhad bude líšiť od skutočnosti?
- vypočítajte štatistiku z bodu d)
- na základe historických dát vieme, že percento chybovosti je 10%, mal by byť inžinier prekvapený z toho, aké percento chybovosti nameral tento týždeň?
Výsledok
- všetky vyrobené čipy za jeden týždeň
- relatívna početnosť (percento) chybných čipov za jeden týždeň
- p=27212=0,127
- SE = smerodajná chyba
- SE = p(1-p)n=0,127.(1-0,127)212=0,023
- výsledok tohto týždňového merania nie je prekvapivý, pretože meranie (0,127) nie je viac ako dve smerodajné chyby od parametra (0,1).
Postup riešenia
2. Pôžička
Vo vzorke 765 náhodne vybraných Američanov je 322 takých, ktorí si pri nečakanom výdavku $400 musia tento obnos od niekoho požičať alebo zobrať úver.
- čo je v tomto prípade populácia?
- aký parameter budeme odhadovať?
- aký je bodový odhad parametra?
- ako sa nazýva štatistika, ktorou meriame to, ako sa náš odhad bude líšiť od skutočnosti?
- vypočítajte štatistiku z bodu d)
- vypočítajte 95%-ný interval spoľahlivosti pre relatívnu početnosť Američanov, ktorí si pri nečakanom výdavku $400 musia tento obnos od niekoho požičať alebo zobrať úver a interpretujte ho!
Výsledok
Postup riešenia
3. Lekár z Guiney
23. októbra v roku 2014 sa do New Yorku vrátil lekár z Guiney, ktorý tam liečil pacientov chorých na Ebolu. Mal miernu teplotu a neskôr bol pozitívne testovaný. O nejaký čas The Wall Street Journal realizoval prieskum, v ktorom sa 82% Newyorčanov vyslovilo, že by mal každý, kto prišiel do styku s týmto lekárom, podstúpiť dobrovoľnú 21-dňovú karanténu. Tohto prieskumu sa zúčastnilo 1 042 Newyorčanov v období od 24. do 28. októbra 2014.
- môžeme v tomto prípade uvažovať o použití CLT?
- vypočítajte 95%-ný interval spoľahlivosti pre parameter: relatívna početnosť Newyorčanov, ktorí podporujú dobrovoľnú 21-dňovú karanténu pre všetkých, ktorí prišli do styku s lekárom. Interpretujte!
Výsledok
- za predpokladu, že The Wall Street Journal realizoval náhodný výber, stačí overiť, že 1042 vybraných Newyorčanov tvorí menej ako 10% celkovej populácie obyvateľov New Yorku (čo pri cca 8,6 milióna obyvateľov je určite splnené) a že hodnoty n.p a n.(1-p) sú väčšie ako 10: 1042.0,82 = 854 aj 1042.0,18 = 188 sú väčšie ako 10
- bodový odhad p=0,82, SE= 0,82.(1-0,82)1042=0,012, p∈0,82±1,96.0,012, p ∈0,796;0,844, interpretácia: sme si na 95% istí, že skutočná relatívna početnosť Newyorčanov, ktorí si myslia, že dotknuté osoby by mali podstúpiť karanténu, sa nachádza v intervale medzi 0,796 a 0,844.
Postup riešenia
4. Kategórie Facebooku
Väčšina komerčných webových stránok zhromažďuje údaje o správaní svojich používateľov a používa ich na doručovanie cieleného obsahu, odporúčaní a reklám. S cieľom pochopiť, či si Američania myslia, že ich životy sú v súlade s tým, ako ich klasifikačné systémy riadené algoritmami kategorizujú, požiadal Pew Research reprezentatívnu vzorku 850 amerických používateľov Facebooku o to, aby sa vyjadrili, ako vnímajú zoznam kategórií, ktoré pre nich Facebook uviedol na stránke svojich predpokladaných záujmov. 67% respondentov uviedlo, že uvedené kategórie boli presné. Odhadnite skutočný podiel amerických používateľov Facebooku, ktorí si myslia, že Facebook kategorizuje svoje záujmy presne.
Výsledok
Ak odhad uskutočníme pomocou 95% intervalu spoľahlivosti, skutočný podiel amerických používateľov Facebooku, ktorí si myslia, že Facebook kategorizuje svoje záujmy presne, sa nachádza v intervale 64% až 70%.
Postup riešenia
5. Alternatívne formy energie
Agentúra Fokus realizovala na Slovensku prieskum o alternatívnych formách energie a zistila, že 84,8% z 1000 respondentov podporuje využitie veterných turbín.
- môžeme v tomto prípade uvažovať o použití CLT?
- zostrojte 99%-ný interval spoľahlivosti pre relatívnu početnosť Slovákov podporujúcich využitie veterných turbín.
Výsledok
Postup riešenia
6. Nový dizajn webstránky
Webstránka sa snaží získať viac používateľov, ktorí by sa hneď pri prvej návšteve webstránky zaregistrovali a preto pripravila nový dizajn stránky. Po mesiaci zo všetkých nových návštevníkov stránky za posledný mesiac vyberú admini stránky 752 náhodným výberom a zistia, že 64 z nich sa aj zaregistrovalo. Skontrolujte podmienky na vytvorenie 90% intervalu spoľahlivosti, vytvorte a interpretujte ho.
Výsledok
⟨0,0686; 0,1014⟩
Postup riešenia
7. Kupón v maili
Obchod náhodne vybral zo svojich zákazníkov nakupujúcich počas jedného roka 603 zákazníkov a zistil, že 142 z nich navštívilo obchod kvôli kupónu, ktorý dostali mailom. Zostavte 95% interval spoľahlivosti pre relatívnu početnosť všetkých zákazníkov počas roka, ktorých návšteva bola spôsobená kupónom, ktorý dostali mailom a interpretujte ho.
Výsledok
Postup riešenia
8. Rande
Analýza náhodne vybranej vzorky 200 ľudí vo veku 18 až 22 rokov ukázala, že na rande minú priemerne 32,5 € so smerodajnou odchýlkou 15 €. Vypočítajte 95% interval spoľahlivosti pre priemernú hodnotu peňazí, ktoré mladá generácia míňa na rande a interpretujte ho.
Výsledok
⟨30,42; 34,58⟩
Postup riešenia
9. Vzdialenosť do rodného mesta
V náhodne vybranej vzorke 300 univerzitných študentov sa zistilo, že priemerná vzdialenosť do ich rodného mesta je 125 km so smerodajnou odchýlkou 40 km. Vypočítajte 90% interval spoľahlivosti pre priemernú vzdialenosť a interpretujte ho.
Výsledok
⟨121,21; 128,79⟩
Postup riešenia
10. Čakanie v čakárni I.
Riaditeľ nemocnice by rád zlepšil pomery vo svojej nemocnici a rozhodol sa odhadnúť čas, ktorý musia stráviť pacienti čakaním na lekárske ošetrenie. Náhodným výberom vybral vzorku 64 pacientov a požiadal ich, aby si zmerali čas, ktorý strávili v nemocnici, kým vošli k lekárovi do ordinácie. Priemerný čas bol 137,5 minúty a smerodajná odchýlka bola 40 minút. Vypočítajte 99% interval spoľahlivosti pre priemerný čas strávený v ordinácii a interpretujte ho.
Výsledok
⟨124,6; 150,4⟩
Postup riešenia
11. Partnerské vzťahy
V roku 2012 sa na Duke University uskutočnil prieskum, v ktorom sa 203 náhodne vybraných študentov okrem iného pýtali, koľko partnerských vzťahov mali doteraz. Priemer bol 3,2 a smerodajná odchýlka 1,97. Chceme skonštruovať 90% interval spoľahlivosti pre priemerný počet partnerských vzťahov pre všetkých študentov Duke University.
- Čo je v tomto prípade populácia?
- Čo je v tomto prípade parameter, ktorý chceme odhadnúť?
- Aký je bodový odhad parametra?
- Aká je smerodajná chyba (SE) pre priemer?
- Aká je tolerancia chyby (ME) pre 90% interval spoľahlivosti?
- Aká spodná (ľavá) hranica pre 90% interval spoľahlivosti?
- Aká horná (pravá) hranica pre 90% interval spoľahlivosti?
- Aká je vaša interpretácia zisteného 90% intervalu spoľahlivosti?
Výsledok
Postup riešenia
12. Prvý vydaj
Centrum pre kontrolu chorôb realizovalo Národný prieskum o rozvoji rodiny, v ktorom jedna zo zisťovaných premenných bola: vek ženy, kedy sa po prvýkrát vydala. Centrum v rokoch 2006 až 2010 oslovilo 5534 náhodne vybraných žien. Priemerný vek oslovených žien, kedy sa po prvýkrát vydali bol 23,44 so smerodajnou odchýlkou 4,72. Chceme vytvoriť 95% interval spoľahlivosti pre priemerný vek žien, kedy sa po prvýkrát vydali.
- Čo je v tomto prípade parameter?
- Aký je bodový odhad pre priemerný vek žien, kedy sa po prvýkrát vydali?
- Aká je smerodajná chyba (SE) pre výberový priemer?
- Aká je spodná (ľavá) hranica pre 95% interval spoľahlivosti?
- Aká je horná (pravá) hranica pre 95% interval spoľahlivosti?
- Aká je vaša interpretácia zisteného intervalu spoľahlivosti?
- Ako výsledný interval spoľahlivosti ovplyvnilo to, že vzorka bola veľká?
Výsledok
Postup riešenia
13. Čakanie v čakárni II.
Riaditeľ nemocnice by rád zlepšil pomery vo svojej nemocnici a rozhodol sa odhadnúť čas, ktorí musia stráviť pacienti na čakaním na lekárske ošetrenie. Náhodným výberom vybral vzorku 64 pacientov a požiadal ich, aby si zmerali čas, ktorý strávili v nemocnici, kým vošli k lekárovi do ordinácie. 95% interval spoľahlivosti bol takýto: (128 minút, 147 minút). Určte, či sú nasledujúce tvrdenia pravdivé alebo nie a pokúste sa svoje rozhodnutie zdôvodniť si:
- Sme na 95% presvedčení, že priemerný čas 64 náhodne vybraných pacientov bol v rozmedzí 128 až 147 minút.
- Sme na 95% presvedčení, že priemerný čas všetkých pacientov bol v rozmedzí 128 až 147 minút.
- 99%-ný interval spoľahlivosti by bol užší, pretože si potrebujeme byť istejší v našom odhade.
- Bodový odhad je 137,5 a tolerancia chyby 9,5.
- Bodový odhad je 130 a tolerancia chyby 9,5.
- Aby sme znížili toleranciu chyby (ME) pri 95% intervale spoľahlivosti na polovicu, museli by sme zvýšiť počet ľudí vo vzorke na dvojnásobok.
Výsledok
Postup riešenia
14. Suma peňazí pri jednom nákupe
Majiteľa obchodu s oblečením zaujíma priemerná suma peňazí, ktorú jeho zákazníci minú pri jednom nákupe. Zo záznamov v registračnej pokladni náhodne vyberie 100 bločkov a zistí, že priemerná suma, ktorú týchto 100 zákazníkov zaplatilo bola 45 € a vypočítal 95% interval spoľahlivosti. Ako by sa zmenil 95%-ný interval spoľahlivosti, ak by majiteľ obchodu náhodne vybral 500 bločkov (aritmetický priemer a smerodajná odchýlka vzorky so 100 bločkami a 500 bločkami sú rovnaké)?
- bude rovnaký ako pri vzorke 100 bločkov;
- bude užší ako pri vzorke 100 bločkov;
- bude širší ako pri vzorke 100 bločkov.
Výsledok
Postup riešenia
15. Index BMI
Lekár chce odhadnúť priemerný index BMI pre svojich dospelých pacientov. Potrebuje vybrať vzorku svojich pacientov a získať od nich potrebné informácie. Chcel by, aby tolerancia chyby nebola väčšia ako 1,5 jednotiek BMI s 95% intervalom spoľahlivosti. Zároveň vie, že pre populáciu platí, že smerodajná odchýlka BMI indexu je 4,5 a tento index má normálne rozdelenie. Akú veľkú vzorku by mal lekár osloviť? Akým spôsobom by sme vo všeobecnosti vypočítali veľkosť vzorky, ak si stanovíme prípustnú toleranciu chyby a interval spoľahlivosti a za predpokladu, že poznáme smerodajnú odchýlku v populácii?
Výsledok
lekár by mal osloviť (1,96.4,5/1,5)^2 pacientov, teda približne 35 pacientov, vo všeobecnosti: (z*.𝛔/ME)^2
Postup riešenia
Hypotézy
1. Známa reštaurácia
Okolo známej reštaurácie sa začali šíriť reči, že jedlo v nej nezodpovedá hygienickým pravidlám. Majitelia reštaurácie preto prizvali kontrolóra hygieny, aby jedlo v reštaurácii skontroloval. V prípade, že by jedlo nespĺňalo požadované kritériá, majitelia by museli reštauráciu zavrieť.
- čo je v tomto prípade populácia?
- aký parameter budeme odhadovať?
- aký je bodový odhad parametra?
- ako sa nazýva štatistika, ktorou meriame to, ako sa náš odhad bude líšiť od skutočnosti?
- vypočítajte štatistiku z bodu d)
- na základe historických dát vieme, že percento chybovosti je 10%, mal by byť inžinier prekvapený z toho, aké percento chybovosti nameral tento týždeň?
Výsledok
- H0: jedlo v reštaurácii spĺňa hygienické pravidlá, H1: jedlo v reštaurácii nespĺňa kritériá
- chyba I. druhu: reštauráciu by zavreli napriek tomu, že jedlo spĺňa hygienické kritériá
- chyba II. druhu: reštaurácia nespĺňa hygienické kritériá, napriek tomu je otvorená
- pre majiteľa je nepríjemné chuba I. druhu
- pre zákazníkov je nepríjemná chyba II. druhu;
Postup riešenia
2. Krátkozraké deti
Podľa renomovaných výskumov je známe, že 8% detí je krátkozrakých. V náhodne vybranej vzorke 194 detí sa zistilo, že 21 z nich je krátkozrakých. Poskytujú dáta zo vzorky dostatočný dôkaz o tom, že číslo z renomovaných výskumov (8%) nie je pravdivé?
- sformulujte nulovú a alternatívnu hypotézu
- otestujte pomocou 95 % intervalu spoľahlivosti
- otestujte pomocou p-hodnoty, hladinu významnosti zvoľte 0,05.
Výsledok
- H0 : p = 0,08; H1: p ≠ 0,08
- 0,08 ∈ ⟨0,065;0,152⟩ ⟹ nemôžeme zamietnuť H0
- SE = 0,019; z = 1,44; p-hodnota = 0,15 > 𝛼 ⟹ nemôžeme zamietnuť H0
Postup riešenia
3. Nadané deti
Výskumníci skúmali vlastnosti nadaných detí a zozbierali dáta zo škôl vo veľkom meste. Náhodne vybrali 36 detí, ktoré boli identifikované ako nadané skoro po dosiahnutí 4 rokov. Máme k dispozícii údaj o týchto 36 deťoch, ktorý uvádza, v koľkých mesiacoch ich veku vedeli úspešne napočítať do 10: najmladšie dieťa malo 21 mesiacov, najstaršie 39 mesiacov, priemerná hodnota veku bola 30,69 a smerodajná odchýlka 4,31. Formulujte a otestujte hypotézu na hladine významnosti 0,10, ak viete, že podľa renomovaného výskumu priemerný vek detí, ktoré vedia úspešne napočítať do 10 je 32 mesiacov.
- vypočítajte 90%-ný interval spoľahlivosti
- testujte pomocou výpočtu p-hodnoty
- porovnajte výsledok testovania s určením intervalu spoľahlivosti.
Výsledok
- ⟨29,51;31,87⟩
- H0 : 𝜇 = 32; H1: 𝜇 ≠ 32; p-hodnota = 0,068
- pri a) zamietame H0 preto, lebo 32 ∉ ⟨29,51;31,87⟩, pri b) zamietame H0 preto, lebo p-hodnota < 𝛼 (0,068 < 0,10)
Postup riešenia
4. Cena za ubytovanie
Univerzity často uvádzajú, koľko ich študenti priemerne minú za ubytovanie vo svojich ubytovacích zariadeniach. Na Duke University je táto hodnota 650 $. Študenti z tejto univerzity chceli overiť, či je tento údaj pravdivý. Vybrali náhodne 75 študentov a zistili, že ich priemerné náklady na ubytovanie sú iba 611,63 $, so smerodajnou odchýlkou 132,85 $. Existuje presvedčivý dôkaz o tom, že náklady na ubytovanie súčasných študentov nie sú v súlade v deklarovanou sumou? Formulujte a otestujte hypotézu:
- pomocou 95% intervalu spoľahlivosti
- pomocou výpočtu p-hodnoty.
Výsledok
H0 : 𝜇 = 650; H1: 𝜇 ≠ 650;
- ⟨581,56; 641,7⟩; 650 ∉ IS, preto zamietame H0
- p-hodnota = 0,0124; zamietame H0
Postup riešenia
5. Čakanie v čakárni III.
Riaditeľ nemocnice náhodne vybral 64 pacientov a odmeral čas, ktorý strávili čakaním na ošetrenie lekára. Priemerný čas bol 137,5 minút so smerodajnou odchýlkou 39 minút. Podľa záznamov z minulého roka bol však priemerný čas čakania pacientov v celej nemocnici iba 127 minút. Riaditeľ by rád vedel, či tento rozdiel spôsobili nejaké okolnosti v nemocnici alebo či ide iba o variabilitu spôsobenú vybranou vzorkou.
- pri použití hladiny významnosti 0,05 je možné, že rozdiel štatisticky významný? Použite obojstranný test.
- zmenilo by sa rozhodnutie z testu, ak by sme zmenili hladinu významnosti na 0,01?
Výsledok
- H0 : 𝜇 = 127; H1: 𝜇 ≠ 127; SE=4,875; z=2,15; p-hodnota= 0,03; na hladine významnosti H0 zamietame
- áno, na hladine významnosti 0,01 by sme H0 nemohli zamietnuť
Postup riešenia
6. Spánok
Podľa nadácie na výskum spánku študenti univerzity spia priemerne 7 hodín denne. Výskumníci z vidieckej univerzity by radi dokázali, že ich študenti spia priemerne viac ako 7 hodín denne. Náhodne vybrali 110 študentov a zistili, že priemer tejto vzorky bol 7,42 a smerodajná odchýlka 1,75. Formulujme nulovú a alternatívnu hypotézu a otestujeme ju na hladine významnosti 0,05.
Výsledok
H0 : 𝜇 = 7; H1: 𝜇 ≠ 7; SE=0,167; z=2,51; p-hodnota=0,01; zamietame H0
Postup riešenia
7. Ofcom
Podľa štúdie spoločnosti Ofcom (The Office of Communications) trávia študenti univerzít online komunikáciou 29 hodín týždenne. Študenti istej univerzity si však myslia, že toto číslo nie celkom zodpovedá skutočnosti, preto sa rozhodli tento údaj overiť pre ich univerzitu. Náhodne vybrali 112 študentov a požiadali ich, aby si nainštalovali aplikáciu, ktorá bude merať ich čas strávený online komunikáciou. Priemerný čas bol 30,25 hodín so smerodajnou odchýlkou 7,32. Študenti vykonali testovanie štatistickej hypotézy s hladinou významnosti 5%.
- Aká bola nulová hypotéza?
- Aká bola alternatívna hypotéza?
- Za predpokladu, že študenti testovali pomocou intervalu spoľahlivosti, aký bol?
- Aké bolo študentov rozhodnutie o výsledku testovania na základe výpočtu intervalu spoľahlivosti?
- Aká bola p-hodnota?
- Aké bolo študentov rozhodnutie o výsledku testovania na základe výpočtu p-hodnoty?
- Ako by sa zmenilo rozhodnutie študentov o výsledku testovania pri zmene hladiny významnosti na 10%?
Výsledok
Postup riešenia
8. Nadané deti
Výskumníci skúmali vlastnosti nadaných detí a zozbierali dáta zo škôl vo veľkom meste. Náhodným výberom bolo vybraných 36 detí, ktoré boli identifikované ako nadané skoro po dosiahnutí 4 rokov. Ďalšie informácie, ktoré o týchto nadaných deťoch máme, sú informácie o IQ ich rodičov. Pre IQ ich matiek bolo zistené, že priemerná hodnota IQ bola 118,2 so smerodajnou odchýlkou 6,5. Zistite, či tieto údaje poskytujú dostatočne presvedčivý dôkaz na to, že priemerné IQ matiek nadaných detí sa líši od priemerného IQ celej populácie, ktoré je 100. Použite hladinu významnosti 0,1 a obojstranný test.
- Ako bude formulovaná nulová a alternatívna hypotéza?
- Aká je príslušná p-hodnota?
- Aké je rozhodnutie testovania?
- Čo pre nás výsledok testovania znamená?
- Ako by zmena hladiny významnosti na 0,01 ovplyvnila naše rozhodnutie?
Výsledok
Postup riešenia
9. CocaCola
Niektorí ľudia tvrdia, že vedia rozoznať na jeden dúšok rozdiel medzi CocaColou Light a Cocacolou Zero. Výskumník si chcel overiť, či je to naozaj možné a vybral z týchto ľudí náhodne 80 osôb. Výskumník pripravil 80 pohárov, pričom do 40 nalial Cocacolu Light a do 40 Cocacolu Zero a nechal ich vypiť 80 účastníkom. 53 z nich správne určilo, ktorý nápoj mali v pohári. Poskytujú nám tieto údaje dostatočný dôkaz na to, aby sme mohli tvrdiť, že títo ľudia skutočne vedia rozoznať rozdiel medzi nápojmi na jeden dúšok? Otestujte na hladine významnosti 0,05 a vypočítajte p-hodnotu. (Hint: nulová hodnota parametra bude zodpovedať tomu, ako by sa rozhodovali účastníci iba náhodne)
Výsledok
Postup riešenia
10. Jablko denne (testovanie rozdielu dvoch relatívnych početností)
Učiteľ telesnej výchovy, ktorý chce zvýšiť povedomie o otázkach výživy a zdravia, sa na začiatku semestra svojich študentov spýtal, či si myslia, že jedno jablko denne pomôže zlepšiť ich zdravie. 40% študentov odpovedalo, že áno. Počas celého semestra začal hodinu krátkou diskusiou o pozitívnych účinkoch konzumácie väčšieho množstva ovocia a zeleniny. Na konci semestra vykonal rovnaký prieskum zameraný na jablká a tentoraz 60% študentov odpovedalo áno. Môže použiť metódu testovania rozdielu dvoch relatívnych početností na tento typ výskumu? Svoje vysvetlenie zdôvodnite.
Výsledok
metódu rozdielu dvoch relatívnych početností v tomto prípade nemôžeme použiť, pretože nejde o dve nezávislé populácie, ale o jednu
Postup riešenia
11. Spánková deprivácia (testovanie rozdielu dvoch relatívnych početností)
Podľa správy o spánkovej deprivácii, ktorú publikovalo Centrum pre kontrolu a prevenciu chorôb, 8% obyvateľov bratislavského kraja uviedlo, že nemajú dostatok spánku za posledných 30 dní. V košickom kraji Centrum zistilo, že ide o 8,8% obyvateľov, ktorí nemajú dostatok spánku za posledných 30 dní. Prieskum v bratislavskom kraji sa uskutočnil na náhodne vybranej vzorke 11 545 respondentov, v košickom kraji to bolo 4 691 respondentov.
- čo je v tomto prípade populácia a čo parameter?
- môžeme použiť metódu výpočtu 95% intervalu spoľahlivosti pre rozdiel dvoch relatívnych početností?
- vypočítajte 95% interval spoľahlivosti a svoje zistenia interpretujte;
- vypočítajte spojenú relatívnu početnosť a overte, či môžeme testovať hypotézu o rozdiele dvoch relatívnych početností;
- sformulujte nulovú a alternatívnu hypotézu;
- vypočítajte SE, z-skóre a p-hodnotu
- ako dopadlo testovanie hypotézy na základe výpočtu p-hodnoty?
Výsledok
- populácie aj parametre sú dva: populácia č. 1 je všetci obyvatelia bratislavského kraja, populácia č. 2 sú všetci obyvatelia košického kraja; parameter č.1 je relatívna početnosť (percento) obyvateľov bratislavského kraja, ktorí trpia spánkovou depriváciou; parameter č.2 je relatívna početnosť (percento) obyvateľov košického kraja, ktorí trpia spánkovou depriváciou;
- metódu výpočtu 95 % intervalu spoľahlivosti pre rozdiel dvoch relatívnych početností môžeme použiť, pretože ide o dve rôzne populácie a sú splnené podmienky:
Postup riešenia
Testovanie pre kategoriálne a numerické dáta
1. Profesorove očakávania
Profesor, ktorý používa na svoj predmet knihu, ktorá je tzv. open source predpokladá, že napriek tomu si 60% jeho študentov kúpi fyzickú knihu, 25% si ju vytlačí z webu a 15% ju bude čítať online. Na konci semestra sa profesor svojich študentov spýtal, aký formát knihy používali. Zo 126 študentov si nakoniec knihu kúpilo 71 študentov, 30 si ju vytlačilo a 25 čítalo online.
- ako by mohla znieť nulová a alternatívna hypotéza v tomto prípade?
- koľko študentov predpokladal profesor, že si kúpi knihu? koľko predpokladal, že si ju vytlačí? koľko predpokladal, že ju bude čítať online?
- sú splnené podmienky na vykonanie χ2 testu dobrej zhody?
- vypočítajte hodnotu χ2
- aký je stupeň voľnosti?
- aká je p-hodnota?
- aká je podľa vás interpretácia zistenej p-hodnoty?
Výsledok
- H0 : študenti sa budú správať podľa očakávaní profesora; H1 študenti sa nebudú správať podľa očakávaní profesora
- 75,6; 31,5; 18,9
- podmienky splnené sú, pretože všetky očakávané početnosti sú väčšie ako 5
- 2,32
- 2
- 0,31
- keďže p-hodnota je väčšia ako hladina významnosti, nemôžeme zamietnuť H0 a študenti sa správajú podľa očakávania profesora
Postup riešenia
2. Štekajúce jelene
Prírodovedci skúmali faktory, ktoré sa spájajú s pastvinami a ležoviskami štekajúcich jeleňov na ostrove Hainan v Číne. V tomto regióne je 4,8% pokrytých ihličnatými lesmi, kultivovaný trávnatý porast tvorí 14,7% krajiny a 39,6% tvoria listnaté lesy (zvyšok krajiny nemožno zaradiť k určitému druhu porastu). Zo 426 miest, kde sa pasú štekajúce jelene, môžeme 4 zaradiť medzi ihličnaté lesy, 16 medzi kultivovaný trávnatý porast a 61 medzi listnaté lesy (zvyšných 345 miest nemožno zaradiť k určitému druhu porastu). Môžeme na základe týchto údajov tvrdiť, že štekajúce jelene na ostrove Hainan uprednostňujú nejaký druh porastu? Vykonajte χ2 test dobrej zhody (ak sú splnené podmienky) na hladine významnosti 0,01.
Výsledok
H0 : štekajúce jelene sa pasú rovnomerne na všetkých dostupných druhoch porastu, H1: štekajúce jelene sa nepasú rovnomerne, ale uprednostňujú niektorý druh porastu; očakávané početnosti sú: 20,448, 62,622, 168,696, 174,234 a všetky sú väčšie ako 5; chí kvadrát = 284,06; DF = 3; p-hodnota = 2,8.10^(-61)-veľmi malé číslo; na hladine významnosti 0,01 môžeme H0 zamietnuť
Postup riešenia
3. Kameň – papier – nožnice
Všetci poznajú hru: Kameň – papier – nožnice. Predstavte si, že ste ako projekt na predmet štatistické metódy dostali za úlohu zistiť, či sa pri hre dvoch hráčov vyskytujú možnosti kameň, papier a nožnice náhodne alebo, či je niektorá z možností preferovaná. Požiadali ste svojich dvoch spolužiakov, aby si hru zahrali 51-krát a svoje výsledky zaznamenali. V týchto 51 hrách padol 44-krát kameň, 22-krát papier a 36-krát nožnice. Použite χ2 test dobrej zhody (ak sú splnené podmienky) na hladine významnosti 0,05, aby ste zistili, či hráči používali 3 možnosti náhodne alebo, či preferovali niektorú z možností.
Výsledok
Postup riešenia
4. Stanovisko k ťažbe ropy
V prieskume sa pýtali 827 náhodne vybraných voličov v Kalifornii, aké je ich stanovisko k ťažbe ropy a zemného plynu na pobreží Kalifornie. Respondenti mohli odpovedať, že podporujú ťažbu, nepodporujú ťažbu alebo nemajú dostatok informácií, aby sa vedeli rozhodnúť. Všetkých respondentov výskumníci rozdelili do dvoch skupín podľa toho, či sú absolventmi vysokej školy alebo nie. Počty respondentov sú zaznamenané v nasledujúcej tabuľke. Vykonajte χ2 test nezávislosti o tom, či existuje štatisticky významný rozdiel v odpovediach vysokoškolákov a “nevysokoškolákov”.
| Absolventi vysokej školyÁNO | Absolventi vysokej školy NIE | |
| Podporujú ťažbu | 154 | 132 |
| Nepodporujú ťažbu | 180 | 126 |
| Nevedia sa rozhodnúť | 104 | 131 |
| Spolu | 438 | 389 |
Výsledok
p-hodnota= 0,003, zamietame H0
Postup riešenia
5. Zamestnanosť vs cukrovka
Gallupov inštitút realizoval prieskum, ktorého úlohou bolo zistiť vzťah medzi statusom zamestnanosti a cukrovkou (alebo inak povedané: súvisí nezamestnanosť s cukrovkou?). V prieskume sa zistilo, že 1,5% zo 47 000 zamestnaných Američanov (na plný alebo čiastočný úväzok) a 2,5% z 5 880 nezamestnaných Američanov má cukrovku. Poskytujú nám tieto údaje presvedčivý dôkaz na to, že nezamestnaní Američania trpia cukrovkou viac ako zamestnaní?
- vytvorte kontingenčnú tabuľku reprezentujúcu výsledky Gallupovho prieskumu;
- otestujte štatistickú hypotézu o nezávislosti premenných na hladine významnosti 0,05;
- zmenilo by sa naše rozhodnutie, ak by sme hladinu významnosti zmenili na 0,01?
Výsledok
- zamestnaní s cukrovkou: 705; nezamestnaní s cukrovkou: 147; zamestnaní bez cukrovky: 46 295; nezamestnaní bez cukrovky: 5 733;
- H0 : zamestnanosť a cukrovka spolu nesúvisia, H1: zamestnanosť a cukrovka súvisia; chí kvadrát= 32,97; DF=1; p-hodnota= 9,4.10^(-9)= 0,0000000094, H0 zamietame
- aj na hladine významnosti 0,01 by sme H0 zamietli;
Postup riešenia
6. Americké domácnosti
V nasledujúcej kontingenčnej tabuľke sú výsledky prieskumu zo 6400 náhodne vybraných amerických domácností. Majiteľov týchto domácností sa okrem iného pýtali na ich pohlavie a to, ako sú spokojní vo svojom súčasnom zamestnaní. Môžeme na základe týchto údajov tvrdiť, že existujú rozdiely v spokojnosti v zamestnaní amerických mužov a žien? Testujte pomocou χ2 testu nezávislosti na hladine významnosti 0,05. Zmenilo by sa naše rozhodnutie, ak by sme hladinu významnosti zväčšili na 0,1?
Výsledok
H0 : premenné sú nezávislé (spokojnosť v zamestnaní nesúvisí s pohlavím); H1: premenné sú závislé (spokojnosť v zamestnaní súvisí s pohlavím); chí kvadrát = 9,04; p-hodnota= 0,06, na hladine významnosti 0,05 nemôžeme H0 zamietnuť, dáta neposkytujú dostatočne silný dôkaz na, že spokojnosť v zamestnaní súvisí s pohlavím; ak by sme hladinu významnosti zväčšili na 0,1, tak by sa výsledok testovania zmenil: H0 zamietame a na tejto hladine významnosti existuje závislosť medzi pohlavím a spokojnosťou v zamestnaní
Postup riešenia
7. Pitie kávy a depresia
Vedci uskutočnili štúdiu skúmajúcu vzťah medzi pitím kávy a rizikom depresie u žien. Zhromaždili údaje o 50 739 ženách bez príznakov depresie na začiatku štúdie v roku 1996 a tieto ženy boli sledované do roku 2006. V roku 2006 sa ich spýtali na informáciu ohľadom konzumácie kávy (od menej ako 2 šálky za týždeň, až po viac ako 3 šálky denne) a o tom, či im bola lekárom diagnostikovaná depresia. Zistené údaje sú v tabuľke:
- Aký typ testu je vhodný na vyhodnotenie, či existuje súvislosť medzi pitím kávy a depresiou?
- Napíšte hypotézy pre test, ktorý ste identifikovali v časti a).
- Vypočítajte celkový podiel (percento) žien, ktoré trpia depresiou a podiel (percento) žien, ktoré netrpia depresiou.
- Aký je očakávaný počet žien, ktoré trpia depresiou a zároveň vypijú 2-6 šálok kávy za týždeň?
- Štatistika testu je χ2 = 20,93. Aká je p-hodnota?
- Aký je záver testu hypotéz?
Výsledok
Postup riešenia
8. Globálne otepľovanie (párové dáta)
Existuje presvedčivý dôkaz o globálnom otepľovaní? K dispozícii máme vzorku meraní, ktoré boli zaznamenané v roku 1968 a v roku 2008 na území USA: náhodným výberom bolo vybraných 51 miest a na týchto miestach bola zaznamenaná najvyššia denná teplota 1.januára príslušného roku. Následne bol vypočítaný rozdiel medzi teplotami (teplota v roku 2008-teplota v roku 1968) pre každé vybrané miesto. Priemerná hodnota týchto údajov bola 1,1 F a smerodajná odchýlka 4,9 F. Zaujíma nás, či tieto dáta poskytujú presvedčivý dôkaz toho, že sa v USA teplota v priebehu 40 rokov zvýšila. Použite test pre priemernú hodnotu a hladinu významnosti 0,05.
Výsledok
H0 : 𝜇 = 0; H1: 𝜇 ≠ 0; SE= 0,69; Z-skóre= 1,59; p-hodnota= 0,112, H0 nemôžeme zamietnuť, dáta neposkytujú dostatočne silný dôkaz na, že existuje globálne otepľovanie
Postup riešenia
9. Progres v oblasti vzdelávania (rozdiel dvoch priemerov)
Národný úrad pre progres v oblasti vzdelávania testoval vzorky 1000 náhodne vybraných trinásťročných študentov v roku 2004, aj v roku 2008 (dve osobitné vzorky po 1000 študentoch). Priemer a smerodajná odchýlka v roku 2004 boli: 257 a 39 bodov, v roku 2008: 260 a 38. Znamenajú tieto dáta pre národný úrad v oblasti vzdelávania dostatočný dôkaz na to, aby tvrdili, že výsledky študentov v príslušných rokoch sú odlišné? Testujte rozdiel dvoch priemerov na hladine významnosti 0,1.
Výsledok
H0 : 𝜇1 -𝜇2 = 0; H1: 𝜇1 -𝜇2 ≠ 0; SE=1,72; z=-1,74; p-hodnota = 0,08; na hladine významnosti 10% H0 zamietame, údaje poskytujú presvedčivý dôkaz o tom, že výsledky študentov sa zlepšujú
Postup riešenia
10. Paleo diéta (rozdiel dvoch priemerov)
Funguje tzv. paleo diéta (diéta, podľa ktorej je dovolené jesť takú stravu, ktorú konzumovali naši predkovia pred viac ako 2,5 miliónmi rokov)? Odpoveď na túto otázku nám môže dať nasledujúca úloha. Výskumníci náhodne rozdelili 500 dobrovoľníkov na dve rovnako početné skupiny po 250 dobrovoľníkov. Jedna zo skupín 6 mesiacov absolvovala paleo diétu, druhá skupina dostala brožúru o kontrole veľkostí porcií. Na začiatku štúdie sa zvážili všetci dobrovoľníci a rozdiel vo váhe jednej a druhej skupiny bol v priemere 0. Po 6 mesiacoch skupina s paleo diétou schudla v priemere o 7 libier (jednotka hmotnosti v USA) so smerodajnou odchýlkou 18 libier, zatiaľ čo druhá skupina schudla 5 libier so smerodajnou odchýlkou 12 libier. Môžeme na základe týchto dát usúdiť, že existuje signifikantný rozdiel medzi priemernou hmotnosťou, o ktorú schudla jedna a druhá skupina? Použite obojstranný test na hladine významnosti 0,05.
Výsledok
Postup riešenia
11. t-rozdelenie
Vypočítajte p-hodnotu, ak poznáte alternatívnu hypotézu H1, veľkosť vzorky a príslušnú hodnotu t-rozdelenia:
- H1: 0, n = 11, t = 1,91
- H1: 3, n = 17, t = -3,45
- H1: 126, n = 7, t = 0,83
- H1: 4, n = 15, t = 0,78
- H1: 92, n = 7, t = -2,12
Výsledok
- 0,085
- 0,003
- 0,438
Postup riešenia
12. New York
New York je známy ako mesto, ktoré nikdy nespí. 25 náhodne vybraných Newyorčanov sa spýtali, koľko hodín denne spia a získali nasledujúce štatistiky: n = 25, x=7,73, s = 0,77. Američania však spia priemerne 8 hodín denne. Môžeme na základe týchto údajov tvrdiť, že Newyorčania spia naozaj menej? Použite t-test a hladinu významnosti 0,05.
Výsledok
H0 : 𝜇 = 8; H1: 𝜇 ≠ 8; SE = 0,154; t = -1,75; DF = 24; p-hodnota = 0,09; H0 nemôžeme zamietnuť
Postup riešenia
13. Šťastná hodinka
Majiteľ reštaurácie uvažuje o tom, že by rozšíril „šťastnú hodinku“ v nádeji, že sa mu zvýšia zisky. Nie je si však istý, či tomu naozaj aj bude. V súčasnosti je jeho priemerný zisk počas „šťastnej hodinky“ 18 € na zákazníka. Rozhodol sa pokusne na jeden týždeň vyskúšať rozšírenú „šťastnú hodinku“ a zistil, že vypočítal priemerný zisk zo zákazníka 19,25 € so smerodajnou odchýlkou 3,02 € na vzorke náhodne vybraných 26 zákazníkov. Keby ste boli majiteľom tejto reštaurácie, súhlasili by ste s rozšírením „šťastnej hodinky“? Vykonajte test štatistickej hypotézy na hladine významnosti 5%.
Výsledok
H0 : 𝜇 = 18; H1: 𝜇 ≠ 18; SE=0,59; z=2,11; p-hodnota=0,045; zamietame H0
Postup riešenia
14. Hudobná škola
Giorgianna je malé mesto v USA, ktoré je známe svojou láskou k hudbe a preslávilo sa svojou hudobnou školou, kde sa deti učia hrať na klavír. Mesto sa hrdí tvrdením, že priemerné dieťa strávi hraním na klavír v slávnej škole 5 rokov svojho života. S cieľom overiť toto tvrdenie bolo náhodne vybraných 20 detí z mestečka a zistilo sa, že ich priemerná dĺžka hrania na klavír bola 4,6 roka so smerodajnou odchýlkou 2,2 roka. Môžeme na základe týchto údajov oprávnene pochybovať o tvrdení, že priemerné dieťa v Giorgianne strávi 5 rokov hraním na klavíri?
- nájdite 95% interval spoľahlivosti pre priemerný počet rokov strávených v hudobnej škole;
- otestujte hypotézu na hladine významnosti 0,05 (použite správny test)
- porovnajte zistenia z bodu a) a b).
Výsledok
Postup riešenia
15. Piatok 13-teho
Na začiatku 90-tych rokov britskí vedci skúmali, či má skutočnosť, že je piatok 13-teho, vplyv na hustotu premávky, počet nakupujúcich a počet dopravných nehôd. Zozbierali dáta v piatok 13-teho a pre porovnanie aj vždy nasledujúci piatok 20-teho. Pre 10 takýchto dvojíc piatkov zistili, že priemerný počet áut, ktoré prešli cez istý úsek cesty bol pre piatky 13-teho 126 550 áut a priemerný počet áut v piatok 20-teho bol 128 385 (čiže priemerný rozdiel medzi piatkami bol 1 835 áut). Smerodajná odchýlka, ktorú vedci vypočítali pre rozdiel počtu áut bola 1 176. Môžeme na základe týchto údajov konštatovať, že sa obyvatelia mesta natoľko obávajú povestného piatku 13-teho, že v daný deň jazdia menej? Vykonajte t-test na hladine významnosti 0,05.
Výsledok
H0 : 𝜇 = 0; H1: 𝜇 ≠ 0; SE= 371,88; t-skóre= 4,93; p-hodnota= 0,0008, H0 môžeme zamietnuť, piatok 13 je divný deň 🙂
