up:: ZK > ZK

Open questions (GROUPED)

Základní pojmy a sběr dat

$ 3-4) Cukrovar dodává cukr v balení o hmotnosti 25 kg. Bylo vybráno 15 balení a zjištěna průměrná hmotnost 23,9 kg. Vymezte statistickou jednotku a znak.
- Statistická jednotka: balení cukru.
- Statistický znak: hmotnost balení cukru.
$ 7-4) Jaké výhody a nevýhody má anketa?
- Výhody: Rychlé, levné.
- Nevýhody: Nízká návratnost, zkreslení (nereprezentativnost).
? 1-4) Jaké jsou nejznámější techniky náhodného výběru?
- Losování, použití tabulek náhodných čísel, mechanický výběr (softwarový generátor).
! 2-5) Jak se provádí výběr pomocí metody základního masivu?
- Šetření probíhá na velkých jednotkách a malé/nevýznamné se vynechají.
! 4-4) Jak lze charakterizovat pojem „kvótní záměrný výběr“?
- Struktura je výběrového souboru je poskládaná tak aby byla stejná jako ZS
? 6-4) Co znamená pojem prostý náhodný výběr?
- Výběr, u něhož mají všechny jednotky základního souboru stejnou pravděpodobnost zahrnutí do výběru.
? 8-4) Jak lze definovat základní soubor?
- Množina všech prvků, které splňují stanovené vymezení a jsou předmětem zkoumání.
$ 9-6) Co znamená pojem neúplné statistické zjišťování?
- Zjišťování prováděné pouze na části (výběru) základního souboru.
! 10-5) Výběr každého k-tého prvku z náhodně seřazené posloupnosti.
- Systematický výběr.
$ 11-5) Jak lze vysvětlit pojem kvalitativní statistický znak?
- Nabývá slovních hodnot, nelze ho měřit číslem (např. barva očí, pohlaví).
$ 14-4) Jak lze vysvětlit výběr bez vracení?
- Tažená jednotka se nevrací zpět, nemůže se ve výběru opakovat.
? o1-4) Jak lze charakterizovat pojem „typický záměrný výběr“?
- Výběr jednotek dle vlastního úsudku s typickými a průměrnými vlastnostmi.
  - ( Při typickém záměrném výběru výzkumník nevybírá jednotky náhodou, ale na základě vlastního úsudku a expertních znalostí o dané populaci. Cílem je vybrat takové případy, které nejlépe reprezentují průměrný nebo typický stav zkoumaného jevu. )
! 25_1-4) Co je statistická jednotka?
- Základní prvek hromadného jevu (např. občan, auto).

Pravděpodobnost (Jevy, definice, věty)

! 5-1) Jestliže při rostoucím počtu pokusů kolísá relativní četnost jevu A kolem určitého čísla, co je to za postup?
- Statistická definice pravděpodobnosti.
! 7-1) Pokud je výsledek náhodného pokusu charakterizován slovně, tak se jedná o …
- Náhodný jev
  - (pokus=hod, jev=padlo x, veličina=barva).
? 9-1) Jak se označují jevy, které nemohou nastat současně?
- Neslučitelné (disjunktní) jevy.
$ 10-1) Definice P(A) = m/n pro stejně možné výsledky. Jak se nazývá?
- Klasická (Laplaceova) definice pravděpodobnosti.
- ( lze vyčíst ze vzorečků )
! 1-1) Jevy opačné musí splňovat určité relace, aby bylo možné hovořit o jevech opačných. Uveďte je.
- neslučitelnost
  - (nemohou nastat zároveň, průnik je prázdný)
- úplnost
  - (dohromady tvoří celý prostor možných jevů, sjednocení je Ω).
! 2-1) Jak lze stanovit pravděpodobnost náhodného jevu? Uveďte všechny 3 základní metody.
- 1. Klasická (Laplaceova), 2. Statistická (empirická), 3. Subjektivní (příp. Geometrická, Axiomatická).
$ 1-3) Co znamená pojem „paradox nulové pravděpodobnosti“ a kdy se s ním můžeme setkat?
- Jev s nulovou pravděpodobností není jev nemožný.
  - Je to pojem u spojitých náhodných veličin a vyjadřuje fakt, že i jevy s nulovou pravděpodobností (P(X=x)=0) mohou nastat.
? 3-1) Kdy používáme subjektivní pravděpodobnost?
- Metoda: Když odhadujeme P jevu na základe osobního úsudku / zkušenosti.
- Podmínky: Když nelze provést opakovaný pokus ani neznáme všechny možné výsledky.
! 4-1) Kdy použijeme větu o úplné pravděpodobnosti?
- Když neznáme pravděpodobnost přímo, skládáme ji z podmíněných pravděpodobností přes úplný systém jevů (nepřekrývají se, tvoří celek).
- ( opsat vzorec ze vzorečků )
  - výpočet P(A) složením z pravé strany vzorce, když chybí přímá pravděpodobnost, ale známe podmíněné pravděpodobnosti P(A|B_i) na úplném systému disjunktních jevů a jejich apriorní pravděpodobnosti P(B_i).
$ 6-1) Kdy použijeme větu o sčítání pravděpodobností?
- Hledáme-li pravděpodobnost sjednocení (součtu) jevů A a B, tzn. P(A ∪ B).
- ( lze vyčíst ze vzorečků )
$ 8-1) Jaké jevy se označují jako neslučitelné?
- Jevy, které se navzájem vylučují (nemohou nastat současně, průnik je prázdný).
? 11-1) Kdy hovoříme o podmíněné pravděpodobnosti?
- Pravděpodobnost jevu A za předpokladu, že už nastal jev B.
- ( lze vyčíst ze vzorečků )
$ 14-1) Co představuje průnik jevů?
- Skutečnost, že jev A a jev B nastanou oba současně.
$ o1-1) Kdy použijeme větu o násobení pravděpodobností?
- Pokud hledáme pravděpodobnost průniku (současného nastoupení) jevů A a B.
- ( lze vyčíst ze vzorečků )
$ 25_1-1) Jakou pravděpodobnost budou mít jevy rovnocenné?
- Každý bude mít pravděpodobnost p = 1/n.

Náhodné veličiny a jejich rozdělení

? 4-3), 8-3) Definice: Variabilita velkého počtu nezávislých veličin se vzájemně ruší, takže jejich součet/průměr je skoro konstantní. Jaká metoda je tím vyjádřena?
- Zákon velkých čísel.
! 5-2) Pokud je výsledek náhodného pokusu charakterizován kvantitativně, tak se jedná o …
- Náhodnou veličinu.
! 6-2) Pravidlo, které každé hodnotě přiřazuje pravděpodobnost, že náhodná veličina nabude této hodnoty, se nazývá…
- Zákon rozdělení náhodné veličiny.
! 9-3) Je možné odhadnout pravděpodobnost výskytu náhodných veličin bez znalosti rozdělení?
- Ano, pomocí Čebyševovy nerovnosti.
$ 10-2) Kdy se používá hypergeometrické rozdělení?
- U výběrů bez vracení z konečného souboru (např. kontrola kvality).
! 10-3) O jaký typ konvergence jde u zákona velkých čísel?
- Konvergence v pravděpodobnosti.
! 12-1) Jak lze vysvětlit pojem náhodná veličina?
- Číselné vyjádření výsledku náhodného pokusu.
? 2-2) V jakých situacích se používá rovnoměrné rozdělení?
- V situacích, kdy má náhodná veličina stejnou pravděpodobnost výskytu pro jakoukoli hodnotu v rámci daného uzavřeného intervalu (konstantní hustota pravděpodobnosti).
- Rovnoměrné rozdělení se používá v situacích, kdy mají všechny možné výsledky stejnou pravděpodobnost výskytu. ( např: Hazard-kostky, čekajiciDoba-spoj )
! 3-3) Je možné odhadnout pravděpodobnost výskytu náhodných veličin, pokud neznáme jejich rozdělení? V případě kladné odpovědi uveďte postup.
- Ano, lze to buď teoreticky ohraničit pomocí Čebyševovy nerovnosti, pokud známe alespoň střední hodnotu a rozptyl, nebo prakticky odhadnout z naměřených dat pomocí relativní četnosti.

Popisná statistika (Míry polohy, variability a tvaru)

$ v-3) Do jaké skupiny statistických charakteristik se řadí průměrná absolutní odchylka?
- Míry variability (absolutní).
! 4-5) Jaké statistické míry jsou založeny na srovnání stupně nahuštěnosti hodnot prostřední velikosti se stupněm nahuštěnosti ostatních?
- Míry špičatosti (charakteristiky špičatosti).
! 9-5) Je možné použít některou z měr polohy při analýze kvalitativních znaků?
- Ano, lze využít modus (u ordinálních i medián).
$ 1-5) Jak je definován, příp. jak se spočítá medián?
- střed seřazených hodnot
  - Je to prostřední hodnota v uspořádané řadě hodnot podle velikosti.
  - (dělí soubor na dvě stejně velké poloviny)
$ 5-4) Kdy se používá vážený aritmetický průměr?
- Používá se k výpočtu průměru v situacích, kdy mají jednotlivé hodnoty různou důležitost (váhu), například když má velká písemka větší váhu než malý test.
  - ~~Jsou-li statistická data setříděna (hodnotám jsou přiřazeny různé četnosti / váhy).~~
! 6-6) K čemu slouží relativní míry variability?
- K porovnávání rozptýlení různých souborů, které se liší měrnou jednotkou nebo mají odlišný průměr (např. variační koeficient).
? o1-5) Jakou informaci poskytují míry variability?
- O tom, jak moc se hodnoty liší mezi sebou nebo jak jsou rozptýleny kolem středu.
$ 8-6) Kdy se používá prostý aritmetický průměr?
- Ke zjištění střední hodnoty souboru číselných dat, kde má každá hodnota stejnou váhu, a to za předpokladu, že se v datech nevyskytují extrémní odchylky.
? 12-5) Jakou informaci poskytují charakteristiky polohy?
- Zastupují soubor jednou reprezentativní hodnotou, kolem které data kolísají.
? o2-4) Je možné použít medián či modus u kvalitativních znaků?
- Modus vždy, medián pouze u ordinálních znaků.

Teorie odhadu (Bodové a intervalové odhady)

! v-5) Doplňte následující tvrzení: Při konstrukci intervalových odhadů platí, že čím má interval vyšší spolehlivost, tím nižší má
- Přesnost odhadu
  - (chyba odhadu se zvyšuje / interval je širší)
! 5-6) Je interval spolehlivosti pro odhad rozptylu základního souboru symetrický vzhledem k hodnotě s²?
- Není symetrický (vychází z asymetrického rozdělení chí-kvadrát).
$ o1-7) Čím je odhad přesnější, tím je interval spolehlivosti…
- Užší.
$ o2-6) Čím má interval nižší spolehlivost, tím má…
- Vyšší přesnost (interval je užší).
! 5-5) Co znamená konstatování, že bodový odhad má být konzistentní?
- S rostoucím počtem pozorování se přibližuje skutečné (populační) hodnotě parametru základního souboru.
! 6-7) Co znamená, že bodový odhad má být nestranný?
- Nesmí vést k systematickým chybám; střední hodnota výběrové charakteristiky se rovná charakteristice základního souboru.
  - ( Nestrannost: „Kdybych ten pokus dělal mockrát, tak průměr mých výsledků bude přesně to, co hledám.“ )
! 7-6) Co znamená, že bodový odhad má být postačující?
- Odhad vyčerpává veškerou informaci obsaženou ve výběru, která se týká daného parametru.
  - ( jakmile vypočítáš postačující odhad, můžeš původní data klidně smazat, protože pro odhad daného parametru už v nich nezůstalo nic užitečného. )
$ 7-7) K čemu se dá použít vzorec přípustné chyby?
- K “určení rozsahu výběru” nebo “určení spolehlivosti odhadu”.
- ( lze vyčíst ze vzorečků ⇒ Δ )
? 10-6) Jak lze vysvětlit pojem bodový odhad?
- Výpočet jediné konkrétní hodnoty, která zastupuje neznámý parametr základního souboru.
$ 14-6) Jak lze vysvětlit pojem spolehlivost odhadu?
- Pravděpodobnost (1 - α), že interval skutečně překryje hodnotu hledaného parametru.
! o1-6) Co je hlavním úkolem teorie odhadu?
- Usuzovat na neznámé parametry základního souboru z dat výběru.
! o2-7) Proč je u odhadu parametru p nutný velký rozsah výběru?
- Aby bylo možné využít centrální limitní větu (konvergence k normálnímu rozdělení).
? 25_1-6) Jak lze vysvětlit pojem přesnost odhadu?
- Maximální přípustná chyba, vyjádřená polovinou délky intervalu spolehlivosti.
  - Přesnost odhadu je dána velikostí náhodné chyby. Čím je tato chyba menší, tím je interval spolehlivosti užší a odhad považujeme za přesnější.
  - ~~Šířka odhadu, čím užší tím více přesný.~~ nepřesné

Testování statistických hypotéz

$ v-7) Jaký závěr učiníme, jestliže při testování hodnota testového kritéria nepadne do oboru přijetí?
- Zamítneme nulovou hypotézu (H0) a přijmeme alternativní hypotézu (H1)
! 1-7) Jakým pojmem se označuje každé tvrzení o tvaru nebo charakteristikách rozdělení jednoho či několika statistických znaků?
- Statistická hypotéza
$ 6-10) Když přijmeme nulovou hypotézu, která je správná, jaké chyby testování se dopouštíme?
- Žádné, jde o správné rozhodnutí.
$ 3-7), 14-7) Jak je formulována alternativní statistická hypotéza?
- Popírá nulovou hypotézu; vyjadřuje očekávanou změnu nebo rozdíl.
  - nevyvrací, popírá
$ 3-9) Kdy se používá Welchův test?
- Při dvojvýběrovým testu nestejných rozptylů.
- ( lze vyčíst ze vzorečků )
$ 10-8) Když zamítneme nulovou hypotézu, která je nesprávná, jaké chyby se dopouštíme?
- Žádné chyby, jde o správné rozhodnutí.
$ 2-9) Jak je možné charakterizovat chybu 1. druhu při testování statistických hypotéz?
- Chyba 1. druhu nastává v případě, kdy zamítneme nulovou hypotézu (H_0), přestože ve skutečnosti platí.
! 4-9) V rámci testování se rozlišuje, zda jsou dva soubory závislé či nezávislé. Jak se pozná, že jde o soubory závislé?
- Stejné stat jednotky (před/po) nebo společná struktura.
  - Měření probíhají na stejných statistických jednotkách (např. před zásahem a po zásahu) nebo se projevuje společná struktura.
$ 5-9) Jak lze vysvětlit pojem „kritická hodnota“?
- Hodnota, která odděluje obor přijetí od kritického oboru (oboru zamítnutí).
? 7-9) Jak lze vysvětlit pojem „obor přijetí“?
- Množina hodnot testového kritéria, při kterých nezamítáme nulovou hypotézu.
! 8-8) Jak lze definovat pojem parametrický test?
- Test vyžadující splnění předpokladu o rozdělení (např. normalita) a testující konkrétní parametry (μ, σ²).
? 8-10), o2-9), (11-7)) Jakou informaci nám poskytuje síla testu?
- Pravděpodobnost, se kterou se vyvarujeme chyby 2. druhu / že správně zamítne nulovou hypotézu pokud je nepravdivá
? 9-9) Jak lze vysvětlit pojem testové kritérium?
- Veličina vypočítaná z dat výběru, podle které rozhodujeme o zamítnutí či nezamítnutí H_0.
$ 11-8) Jak se pozná, že jsou soubory nezávislé?
- Výběr jedné jednotky neovlivňuje výběr druhé (dvě odlišné skupiny, např. muži vs. ženy).
! 12-7) Jak lze definovat pojem neparametrický test?
- Test, který nevyžaduje splnění předpokladů o konkrétním rozdělení (např. normalitě).
$ 12-8) Jaké následky má snížení síly testu?
- Zvyšuje se riziko spáchání chyby 2. druhu (přijetí nesprávné H_0).
! 25_1-7) Postup, jímž na základě výběru ověřujeme platnost hypotézy?
- Testování statistických hypotéz
  - proces, při kterém formulujeme nulovou a alternativní hypotézu, zvolíme hladinu významnosti, vypočítáme testové kritérium z výběrových dat a na základě výsledku rozhodneme o zamítnutí či nezamítnutí nulové hypotézy.

Korelační a regresní analýza

$ 2-10) 9-11) Pokud mají určité hodnoty jedné proměnné tendenci vyskytovat se společně s určitými hodnotami druhé proměnné, potom lze tyto proměnné označit jako _?
- Závislé (nebo korelované).
! 6-12) Jaký je rozdíl mezi jednoduchou a vícenásobnou závislostí?
- V počtu nezávislých proměnných
  - 1=(mzda závisí na praxi), 2=(mzda závisí na praxi, vzdělání a věku.)
! 12-12) Jak se stanoví intervalový odhad korelačního koeficientu u malých rozsahů?
- Pomocí Fisherovy Z-transformace.
! 14-11) Hodnota korelačního koeficientu pro nepřímou funkční lineární závislost?
- r = -1.
$ 25_1-11) Hodnota korelačního koeficientu u nekorelovaných znaků?
- r = 0.
! 2-11) Jakých hodnot nabývá regresní koeficient?
- Může nabývat libovolných reálných hodnot na intervalu od -∞ do ∞.
  - korelační: ←1;1> (těstnost) || regrestní: (-∞,∞) (sklon přímky)
? 10-12) Jaký cíl sleduje korelační analýza?
- Měření síly (těsnosti) závislosti mezi proměnnými.
? 14-10) Jaký je hlavní cíl regresní analýzy?
- Popsat tvar závislosti (analytický model) pro účely predikce.
! o2-10) Rozdíl mezi jednoduchou a vícenásobnou regresní funkcí?
- V počtu nezávislých (vysvětlujících) proměnných.
! 25_1-10) Úkoly při analýze závislosti kvantitativních znaků?
- Určení typu závislosti (regrese) a intenzity (korelace).
! v-8) Kdy se používá Fisherova Z-transformace?
- Při testování hypotéz a konstrukci intervalů spolehlivosti pro Pearsonův korelační koeficient.
! 1-10) 5-10) Jak lze interpretovat regresní koeficient?
- Regresní koeficient udává, o kolik jednotek se v průměru změní závislá proměnná (y), když se nezávislá proměnná (x) zvýší o jednu jednotku.
! 3-11) Co znamená, že mezi znaky existuje formální korelace?
- Když znaky mají vysokou korelaci (mění společně), ale neexistuje mezi nimi žádný skutečný příčinný vztah (kauzalita).
! 4-12) Kdy hovoříme o oboustranné regresní závislosti?
- Pokud nelze určit, která proměnná je závislá a která nezávislá (používají se sdružené regresní přímky).
  - Pokud jsou obě proměnné navzájem závislé a zkoumáme vztah v obou směrech.
! 8-12) Kdy hovoříme o oboustranné závislosti?
- Pokud nelze logicky určit směr vlivu (vztah je vzájemný, zkoumáme jen těsnost korelace).
! 7-11) Jak lze vysvětlit pojem pořadová korelace?
- Neparametrická metoda měřící závislost na základě pořadí hodnot (např. Spearmanův koeficient).
  - ( nikoliv konkrétních naměřených hodnot ⇒ zachytí nelineární (ale monotónní) vztahy a je odolná vůči odlehlým hodnotám )
! 7-12) Jakou informaci lze získat z korelačního pole?
- Vizuální představu o typu závislosti (lineární/nelineární), směru a těsnosti vztahu.
? 10-11) K čemu slouží metoda nejmenších čtverců?
- K výpočtu parametrů regresní funkce pomocí minimalizace součtu čtverců odchylek.
? 11-11) V jaké souvislosti se hovoří o minimalizaci součtu čtverců odchylek?
- Při odhadu parametrů regresní funkce (Metoda nejmenších čtverců).
! 11-12), o2-11) Jak lze vysvětlit/interpretovat koeficient determinace?
- Podíl variability závislé proměnné vysvětlený regresním modelem.
  - Udává, z kolika procent je celková variabilita závislé proměnné vysvětlena regresním modelem.
? 12-11) Jak stanovíme odhad konkrétní hodnoty závisle proměnné Y?
- Dosazením hodnoty X do regresní funkce.
! o1-10) Jaký je hlavní cíl regresní analýzy?
- Najít vhodný matematický model popisující průběh závislosti.
? o1-11) Jak lze vysvětlit pojem „pevná závislost“?
- Funkční závislost, kdy je hodnota Y jednoznačně určena hodnotou X (|r|=1).

Notes by Edems

Explorer

CZU_4_STAT - zk_open-questions_grouped

Open questions (GROUPED)

Základní pojmy a sběr dat

Pravděpodobnost (Jevy, definice, věty)

Náhodné veličiny a jejich rozdělení

Popisná statistika (Míry polohy, variability a tvaru)

Teorie odhadu (Bodové a intervalové odhady)

Testování statistických hypotéz

Korelační a regresní analýza

Table of Contents