up:: ZK > ZK

Open questions (GROUPED)

Základní pojmy a sběr dat

  • $ 3-4) Cukrovar dodává cukr v balení o hmotnosti 25 kg. Bylo vybráno 15 balení a zjištěna průměrná hmotnost 23,9 kg. Vymezte statistickou jednotku a znak.
    • Statistická jednotka: balení cukru.
    • Statistický znak: hmotnost balení cukru.
  • $ 7-4) Jaké výhody a nevýhody má anketa?
    • Výhody: Rychlé, levné.
    • Nevýhody: Nízká návratnost, zkreslení (nereprezentativnost).
  • ? 1-4) Jaké jsou nejznámější techniky náhodného výběru?
    • Losování, použití tabulek náhodných čísel, mechanický výběr (softwarový generátor).
  • ! 2-5) Jak se provádí výběr pomocí metody základního masivu?
    • Šetření probíhá na velkých jednotkách a malé/nevýznamné se vynechají.
  • ! 4-4) Jak lze charakterizovat pojem „kvótní záměrný výběr“?
    • Struktura je výběrového souboru je poskládaná tak aby byla stejná jako ZS
  • ? 6-4) Co znamená pojem prostý náhodný výběr?
    • Výběr, u něhož mají všechny jednotky základního souboru stejnou pravděpodobnost zahrnutí do výběru.
  • ? 8-4) Jak lze definovat základní soubor?
    • Množina všech prvků, které splňují stanovené vymezení a jsou předmětem zkoumání.
  • $ 9-6) Co znamená pojem neúplné statistické zjišťování?
    • Zjišťování prováděné pouze na části (výběru) základního souboru.
  • ! 10-5) Výběr každého k-tého prvku z náhodně seřazené posloupnosti.
    • Systematický výběr.
  • $ 11-5) Jak lze vysvětlit pojem kvalitativní statistický znak?
    • Nabývá slovních hodnot, nelze ho měřit číslem (např. barva očí, pohlaví).
  • $ 14-4) Jak lze vysvětlit výběr bez vracení?
    • Tažená jednotka se nevrací zpět, nemůže se ve výběru opakovat.
  • ? o1-4) Jak lze charakterizovat pojem „typický záměrný výběr“?
    • Výběr jednotek dle vlastního úsudku s typickými a průměrnými vlastnostmi.
      • ( Při typickém záměrném výběru výzkumník nevybírá jednotky náhodou, ale na základě vlastního úsudku a expertních znalostí o dané populaci. Cílem je vybrat takové případy, které nejlépe reprezentují průměrný nebo typický stav zkoumaného jevu. )
  • ! 25_1-4) Co je statistická jednotka?
    • Základní prvek hromadného jevu (např. občan, auto).

Pravděpodobnost (Jevy, definice, věty)

  • ! 5-1) Jestliže při rostoucím počtu pokusů kolísá relativní četnost jevu A kolem určitého čísla, co je to za postup?
    • Statistická definice pravděpodobnosti.
  • ! 7-1) Pokud je výsledek náhodného pokusu charakterizován slovně, tak se jedná o …
    • Náhodný jev 
      • (pokus=hod, jev=padlo x, veličina=barva).
  • ? 9-1) Jak se označují jevy, které nemohou nastat současně?
    • Neslučitelné (disjunktní) jevy.
  • $ 10-1) Definice P(A) = m/n pro stejně možné výsledky. Jak se nazývá?
    • Klasická (Laplaceova) definice pravděpodobnosti.
    • ( lze vyčíst ze vzorečků )
  • ! 1-1) Jevy opačné musí splňovat určité relace, aby bylo možné hovořit o jevech opačných. Uveďte je.
    • neslučitelnost 
      • (nemohou nastat zároveň, průnik je prázdný)
    • úplnost 
      • (dohromady tvoří celý prostor možných jevů, sjednocení je Ω).
  • ! 2-1) Jak lze stanovit pravděpodobnost náhodného jevu? Uveďte všechny 3 základní metody.
      1. Klasická (Laplaceova), 2. Statistická (empirická), 3. Subjektivní (příp. Geometrická, Axiomatická).
  • $ 1-3) Co znamená pojem „paradox nulové pravděpodobnosti“ a kdy se s ním můžeme setkat?
    • Jev s nulovou pravděpodobností není jev nemožný.
      • Je to pojem u spojitých náhodných veličin a vyjadřuje fakt, že i jevy s nulovou pravděpodobností (P(X=x)=0) mohou nastat.
  • ? 3-1) Kdy používáme subjektivní pravděpodobnost?
    • Metoda: Když odhadujeme P jevu na základe osobního úsudku / zkušenosti.
    • Podmínky: Když nelze provést opakovaný pokus ani neznáme všechny možné výsledky.
  • ! 4-1) Kdy použijeme větu o úplné pravděpodobnosti?
    • Když neznáme pravděpodobnost přímo, skládáme ji z podmíněných pravděpodobností přes úplný systém jevů (nepřekrývají se, tvoří celek).
    • ( opsat vzorec ze vzorečků )
      • výpočet P(A) složením z pravé strany vzorce, když chybí přímá pravděpodobnost, ale známe podmíněné pravděpodobnosti P(A|B_i) na úplném systému disjunktních jevů a jejich apriorní pravděpodobnosti P(B_i).
  • $ 6-1) Kdy použijeme větu o sčítání pravděpodobností?
    • Hledáme-li pravděpodobnost sjednocení (součtu) jevů A a B, tzn. P(A ∪ B).
    • ( lze vyčíst ze vzorečků )
  • $ 8-1) Jaké jevy se označují jako neslučitelné?
    • Jevy, které se navzájem vylučují (nemohou nastat současně, průnik je prázdný).
  • ? 11-1) Kdy hovoříme o podmíněné pravděpodobnosti?
    • Pravděpodobnost jevu A za předpokladu, že už nastal jev B.
    • ( lze vyčíst ze vzorečků )
  • $ 14-1) Co představuje průnik jevů?
    • Skutečnost, že jev A a jev B nastanou oba současně.
  • $ o1-1) Kdy použijeme větu o násobení pravděpodobností?
    • Pokud hledáme pravděpodobnost průniku (současného nastoupení) jevů A a B.
    • ( lze vyčíst ze vzorečků )
  • $ 25_1-1) Jakou pravděpodobnost budou mít jevy rovnocenné?
    • Každý bude mít pravděpodobnost p = 1/n.

Náhodné veličiny a jejich rozdělení

  • ? 4-3), 8-3) Definice: Variabilita velkého počtu nezávislých veličin se vzájemně ruší, takže jejich součet/průměr je skoro konstantní. Jaká metoda je tím vyjádřena?
    • Zákon velkých čísel.
  • ! 5-2) Pokud je výsledek náhodného pokusu charakterizován kvantitativně, tak se jedná o …
    • Náhodnou veličinu.
  • ! 6-2) Pravidlo, které každé hodnotě přiřazuje pravděpodobnost, že náhodná veličina nabude této hodnoty, se nazývá…
    • Zákon rozdělení náhodné veličiny.
  • ! 9-3) Je možné odhadnout pravděpodobnost výskytu náhodných veličin bez znalosti rozdělení?
    • Ano, pomocí Čebyševovy nerovnosti.
  • $ 10-2) Kdy se používá hypergeometrické rozdělení?
    • U výběrů bez vracení z konečného souboru (např. kontrola kvality).
  • ! 10-3) O jaký typ konvergence jde u zákona velkých čísel?
    • Konvergence v pravděpodobnosti.
  • ! 12-1) Jak lze vysvětlit pojem náhodná veličina?
    • Číselné vyjádření výsledku náhodného pokusu.
  • ? 2-2) V jakých situacích se používá rovnoměrné rozdělení?
    • V situacích, kdy má náhodná veličina stejnou pravděpodobnost výskytu pro jakoukoli hodnotu v rámci daného uzavřeného intervalu (konstantní hustota pravděpodobnosti).
    • Rovnoměrné rozdělení se používá v situacích, kdy mají všechny možné výsledky stejnou pravděpodobnost výskytu( např: Hazard-kostky, čekajiciDoba-spoj )
  • ! 3-3) Je možné odhadnout pravděpodobnost výskytu náhodných veličin, pokud neznáme jejich rozdělení? V případě kladné odpovědi uveďte postup.
    • Ano, lze to buď teoreticky ohraničit pomocí Čebyševovy nerovnosti, pokud známe alespoň střední hodnotu a rozptyl, nebo prakticky odhadnout z naměřených dat pomocí relativní četnosti.

Popisná statistika (Míry polohy, variability a tvaru)

  • $ v-3) Do jaké skupiny statistických charakteristik se řadí průměrná absolutní odchylka?
    • Míry variability (absolutní).
  • ! 4-5) Jaké statistické míry jsou založeny na srovnání stupně nahuštěnosti hodnot prostřední velikosti se stupněm nahuštěnosti ostatních?
    • Míry špičatosti (charakteristiky špičatosti).
  • ! 9-5) Je možné použít některou z měr polohy při analýze kvalitativních znaků?
    • Ano, lze využít modus (u ordinálních i medián).
  • $ 1-5) Jak je definován, příp. jak se spočítá medián?
    • střed seřazených hodnot
      • Je to prostřední hodnota v uspořádané řadě hodnot podle velikosti.
      • (dělí soubor na dvě stejně velké poloviny)
  • $ 5-4) Kdy se používá vážený aritmetický průměr?
    • Používá se k výpočtu průměru v situacích, kdy mají jednotlivé hodnoty různou důležitost (váhu), například když má velká písemka větší váhu než malý test.
      • Jsou-li statistická data setříděna (hodnotám jsou přiřazeny různé četnosti / váhy).
  • ! 6-6) K čemu slouží relativní míry variability?
    • K porovnávání rozptýlení různých souborů, které se liší měrnou jednotkou nebo mají odlišný průměr (např. variační koeficient).
  • ? o1-5) Jakou informaci poskytují míry variability?
    • O tom, jak moc se hodnoty liší mezi sebou nebo jak jsou rozptýleny kolem středu.
  • $ 8-6) Kdy se používá prostý aritmetický průměr?
    • Ke zjištění střední hodnoty souboru číselných dat, kde má každá hodnota stejnou váhu, a to za předpokladu, že se v datech nevyskytují extrémní odchylky.
  • ? 12-5) Jakou informaci poskytují charakteristiky polohy?
    • Zastupují soubor jednou reprezentativní hodnotou, kolem které data kolísají.
  • ? o2-4) Je možné použít medián či modus u kvalitativních znaků?
    • Modus vždy, medián pouze u ordinálních znaků.

Teorie odhadu (Bodové a intervalové odhady)

  • ! v-5) Doplňte následující tvrzení: Při konstrukci intervalových odhadů platí, že čím má interval vyšší spolehlivost, tím nižší
    • Přesnost odhadu 
      • (chyba odhadu se zvyšuje / interval je širší)
  • ! 5-6) Je interval spolehlivosti pro odhad rozptylu základního souboru symetrický vzhledem k hodnotě s²?
    • Není symetrický (vychází z asymetrického rozdělení chí-kvadrát).
  • $ o1-7) Čím je odhad přesnější, tím je interval spolehlivosti
    • Užší.
  • $ o2-6) Čím má interval nižší spolehlivost, tím má…
    • Vyšší přesnost (interval je užší).
  • ! 5-5) Co znamená konstatování, že bodový odhad má být konzistentní?
    • S rostoucím počtem pozorování se přibližuje skutečné (populační) hodnotě parametru základního souboru.
  • ! 6-7) Co znamená, že bodový odhad má být nestranný?
    • Nesmí vést k systematickým chybám;  střední hodnota výběrové charakteristiky se rovná charakteristice základního souboru.
      • ( Nestrannost: „Kdybych ten pokus dělal mockrát, tak průměr mých výsledků bude přesně to, co hledám.“ )
  • ! 7-6) Co znamená, že bodový odhad má být postačující?
    • Odhad vyčerpává veškerou informaci obsaženou ve výběru, která se týká daného parametru.
      • ( jakmile vypočítáš postačující odhad, můžeš původní data klidně smazat, protože pro odhad daného parametru už v nich nezůstalo nic užitečného. )
  • $ 7-7) K čemu se dá použít vzorec přípustné chyby?
    • K “určení rozsahu výběru” nebo “určení spolehlivosti odhadu”.
    • ( lze vyčíst ze vzorečků Δ ) 
  • ? 10-6) Jak lze vysvětlit pojem bodový odhad?
    • Výpočet jediné konkrétní hodnoty, která zastupuje neznámý parametr základního souboru.
  • $ 14-6) Jak lze vysvětlit pojem spolehlivost odhadu?
    • Pravděpodobnost (1 - α), že interval skutečně překryje hodnotu hledaného parametru.
  • ! o1-6) Co je hlavním úkolem teorie odhadu?
    • Usuzovat na neznámé parametry základního souboru z dat výběru.
  • ! o2-7) Proč je u odhadu parametru p nutný velký rozsah výběru?
    • Aby bylo možné využít centrální limitní větu (konvergence k normálnímu rozdělení).
  • ? 25_1-6) Jak lze vysvětlit pojem přesnost odhadu?
    • Maximální přípustná chyba, vyjádřená polovinou délky intervalu spolehlivosti.
      • Přesnost odhadu je dána velikostí náhodné chyby. Čím je tato chyba menší, tím je interval spolehlivosti užší a odhad považujeme za přesnější.
      • Šířka odhadu, čím užší tím více přesný. nepřesné

Testování statistických hypotéz

  • $ v-7) Jaký závěr učiníme, jestliže při testování hodnota testového kritéria nepadne do oboru přijetí?
    • Zamítneme nulovou hypotézu (H0) a přijmeme alternativní hypotézu (H1)
  • ! 1-7) Jakým pojmem se označuje každé tvrzení o tvaru nebo charakteristikách rozdělení jednoho či několika statistických znaků?
    • Statistická hypotéza
  • $ 6-10) Když přijmeme nulovou hypotézu, která je správná, jaké chyby testování se dopouštíme?
    • Žádné, jde o správné rozhodnutí.
  • $ 3-7), 14-7) Jak je formulována alternativní statistická hypotéza?
    • Popírá nulovou hypotézu; vyjadřuje očekávanou změnu nebo rozdíl.
      • nevyvrací, popírá
  • $ 3-9) Kdy se používá Welchův test?
    • Při dvojvýběrovým testu nestejných rozptylů.
    • ( lze vyčíst ze vzorečků )
  • $ 10-8) Když zamítneme nulovou hypotézu, která je nesprávná, jaké chyby se dopouštíme?
    • Žádné chyby, jde o správné rozhodnutí.
  • $ 2-9) Jak je možné charakterizovat chybu 1. druhu při testování statistických hypotéz?
    • Chyba 1. druhu nastává v případě, kdy zamítneme nulovou hypotézu (H_0), přestože ve skutečnosti platí.
  • ! 4-9) V rámci testování se rozlišuje, zda jsou dva soubory závislé či nezávislé. Jak se pozná, že jde o soubory závislé?
    • Stejné stat jednotky (před/po) nebo společná struktura.
      • Měření probíhají na stejných statistických jednotkách (např. před zásahem a po zásahu) nebo se projevuje společná struktura.
  • $ 5-9) Jak lze vysvětlit pojem „kritická hodnota“?
    • Hodnota, která odděluje obor přijetí od kritického oboru (oboru zamítnutí).
  • ? 7-9) Jak lze vysvětlit pojem „obor přijetí“?
    • Množina hodnot testového kritéria, při kterých nezamítáme nulovou hypotézu.
  • ! 8-8) Jak lze definovat pojem parametrický test?
    • Test vyžadující splnění předpokladu o rozdělení (např. normalita) a testující konkrétní parametry (μ, σ²).
  • ? 8-10), o2-9), (11-7)) Jakou informaci nám poskytuje síla testu?
    • Pravděpodobnost, se kterou se vyvarujeme chyby 2. druhu / že správně zamítne nulovou hypotézu pokud je nepravdivá
  • ? 9-9) Jak lze vysvětlit pojem testové kritérium?
    • Veličina vypočítaná z dat výběru, podle které rozhodujeme o zamítnutí či nezamítnutí H_0.
  • $ 11-8) Jak se pozná, že jsou soubory nezávislé?
    • Výběr jedné jednotky neovlivňuje výběr druhé (dvě odlišné skupiny, např. muži vs. ženy).
  • ! 12-7) Jak lze definovat pojem neparametrický test?
    • Test, který nevyžaduje splnění předpokladů o konkrétním rozdělení (např. normalitě).
  • $ 12-8) Jaké následky má snížení síly testu?
    • Zvyšuje se riziko spáchání chyby 2. druhu (přijetí nesprávné H_0).
  • ! 25_1-7) Postup, jímž na základě výběru ověřujeme platnost hypotézy?
    • Testování statistických hypotéz 
      • proces, při kterém formulujeme nulovou a alternativní hypotézu, zvolíme hladinu významnosti, vypočítáme testové kritérium z výběrových dat a na základě výsledku rozhodneme o zamítnutí či nezamítnutí nulové hypotézy.

Korelační a regresní analýza

  • $ 2-10) 9-11) Pokud mají určité hodnoty jedné proměnné tendenci vyskytovat se společně s určitými hodnotami druhé proměnné, potom lze tyto proměnné označit jako _?
    • Závislé (nebo korelované).
  • ! 6-12) Jaký je rozdíl mezi jednoduchou a vícenásobnou závislostí?
    • V počtu nezávislých proměnných
      • 1=(mzda závisí na praxi), 2=(mzda závisí na praxi, vzdělání a věku.)
  • ! 12-12) Jak se stanoví intervalový odhad korelačního koeficientu u malých rozsahů?
    • Pomocí Fisherovy Z-transformace.
  • ! 14-11) Hodnota korelačního koeficientu pro nepřímou funkční lineární závislost?
    • r = -1.
  • $ 25_1-11) Hodnota korelačního koeficientu u nekorelovaných znaků?
    • r = 0.
  • ! 2-11) Jakých hodnot nabývá regresní koeficient?
    • Může nabývat libovolných reálných hodnot na intervalu od -∞ do ∞.
      • korelační: 1;1> (těstnost) || regrestní: (-∞,∞) (sklon přímky)
  • ? 10-12) Jaký cíl sleduje korelační analýza?
    • Měření síly (těsnosti) závislosti mezi proměnnými.
  • ? 14-10) Jaký je hlavní cíl regresní analýzy?
    • Popsat tvar závislosti (analytický model) pro účely predikce.
  • ! o2-10) Rozdíl mezi jednoduchou a vícenásobnou regresní funkcí?
    • V počtu  nezávislých (vysvětlujících) proměnných.
  • ! 25_1-10) Úkoly při analýze závislosti kvantitativních znaků?
    • Určení typu závislosti (regrese) a intenzity (korelace).
  • ! v-8) Kdy se používá Fisherova Z-transformace?
    • Při testování hypotéz a konstrukci intervalů spolehlivosti pro Pearsonův korelační koeficient.
  • ! 1-10) 5-10) Jak lze interpretovat regresní koeficient?
    • Regresní koeficient udává, o kolik jednotek se v průměru změní závislá proměnná (y), když se nezávislá proměnná (x) zvýší o jednu jednotku.
  • ! 3-11) Co znamená, že mezi znaky existuje formální korelace?
    • Když znaky mají vysokou korelaci (mění společně), ale neexistuje mezi nimi žádný skutečný příčinný vztah (kauzalita).
  • ! 4-12) Kdy hovoříme o oboustranné regresní závislosti?
    • Pokud nelze určit, která proměnná je závislá a která nezávislá (používají se sdružené regresní přímky).
      • Pokud jsou obě proměnné navzájem závislé a zkoumáme vztah v obou směrech.
  • ! 8-12) Kdy hovoříme o oboustranné závislosti?
    • Pokud nelze logicky určit směr vlivu (vztah je vzájemný, zkoumáme jen těsnost korelace).
  • ! 7-11) Jak lze vysvětlit pojem pořadová korelace?
    • Neparametrická metoda měřící závislost na základě pořadí hodnot (např. Spearmanův koeficient).
      • ( nikoliv konkrétních naměřených hodnot zachytí nelineární (ale monotónní) vztahy a je odolná vůči odlehlým hodnotám )
  • ! 7-12) Jakou informaci lze získat z korelačního pole?
    • Vizuální představu o typu závislosti (lineární/nelineární), směru a těsnosti vztahu.
  • ? 10-11) K čemu slouží metoda nejmenších čtverců?
    • K výpočtu parametrů regresní funkce pomocí minimalizace součtu čtverců odchylek.
  • ? 11-11) V jaké souvislosti se hovoří o minimalizaci součtu čtverců odchylek?
    • Při odhadu parametrů regresní funkce (Metoda nejmenších čtverců).
  • ! 11-12), o2-11) Jak lze vysvětlit/interpretovat koeficient determinace?
    • Podíl variability závislé proměnné vysvětlený regresním modelem.
      • Udává, z kolika procent je celková variabilita závislé proměnné vysvětlena regresním modelem.
  • ? 12-11) Jak stanovíme odhad konkrétní hodnoty závisle proměnné Y?
    • Dosazením hodnoty X do regresní funkce.
  • ! o1-10) Jaký je hlavní cíl regresní analýzy?
    • Najít vhodný matematický model popisující průběh závislosti.
  • ? o1-11) Jak lze vysvětlit pojem „pevná závislost“?
    • Funkční závislost, kdy je hodnota Y jednoznačně určena hodnotou X (|r|=1).