Obecně platí, že statistici (a každý rozumný člověk), bude používat nějaký statistický program, jako R nebo minitab, aby se jejich statistické grafy. Nicméně, to je stále překvapivě běžné vidět učebnic udělat vše po ruce a na konci, učení, jak udělat histogram v ruce, je skvělý způsob, jak získat lepší ve čtení a zjistit, co problém je, když počítač nebo kalkulačka vám dává něco, co jste nečekali., V této lekci se podíváme na postupný proces distribuce frekvence a histogramu.
Příklad (přeskočit na video příklad)
ukázat vám, jak to udělat, budeme používat datový soubor níže. Šel jsem dopředu a dal čísla v pořadí, které bude dělat všechno mnohem jednodušší.,
12 14 14 14 16 |
18 20 20 21 23 |
27 27 27 29 31 |
31 32 32 34 36 |
40 40 40 40 40 |
42 51 56 60 65 |
To make a histogram by hand, we must first find the frequency distribution., Myšlenkou frekvenčního rozdělení je rozdělit data do skupin (nazývaných třídy nebo koše), abychom mohli lépe vidět vzory. Je to něco jako rozdíl mezi dotazem na váš věk a dotazem, zda jste mezi 20 a 25. Ve druhé otázce seskupuji věky. Tímto způsobem, pokud mám obrovskou datovou sadu (jako mnoho z nich), vidím vzory (jako je většina lidí starších nebo mladších) mnohem jednodušší, než kdybych se jen pokusil rozluštit velký seznam čísel.,
kroky k rozdělení frekvence
Krok 1: Vypočítejte rozsah datové sady
rozsah je rozdíl mezi největší hodnotou a nejmenší hodnotou. Potřebujeme to, abychom zjistili, kolik „prostoru“ musíme rozdělit do skupin. V tomto příkladu:
\(\text{Range}=65-12=53\)
Krok 2: Rozdělte rozsahu tím, že počet skupin, které chcete, a pak zaokrouhlit nahoru
Dělá to nám umožňuje zjistit, jak velké jsou jednotlivé skupiny. Jako bychom desku rozřezali na stejné kousky., V kroku 1 jsme změřili, jak dlouho je deska a nyní rozhodujeme, jak velký bude každý kus.
Hmmm … ale kolik skupin má mít? Příliš mnoho a naše grafy a tabulky nebudou o moc lepší než seznam čísel. Příliš málo a vzor bude skryt s příliš malými detaily. Často je dobrý počet skupin 5 nebo 6, i když existují některá pravidla, která lidé používají k rozhodnutí. Častěji lidé nechají počítač rozhodnout a poté upravit, zda chtějí, zatímco učebnice vám řeknou, kolik skupin použít., Ale pokud pracujete s datovou sadou sami, budete muset vidět, jak graf vypadá, než si můžete být jisti, že jste si vybrali dobré číslo.
řekněme, že se rozhodneme mít 6 skupin. Pokud to uděláme, pak:
\(\dfrac{53}{6}=8.8\)
číslo, které jsme právě našli, se běžně nazývá šířka třídy. Zaokrouhlíme to na 9 jen proto, že je snazší pracovat s tímto způsobem. Počítač by pravděpodobně držel 8.8, takže si uvědomte, že někdy uvidíte toto číslo jako desetinné číslo. Poznámka: obecně platí, že lidé, kteří to dělají ručně, se vždy zaokrouhlují, i když to bylo 8.1!,
Krok 3: pomocí šířky třídy vytvořte své skupiny
začnu u nejmenšího čísla, které máme, což je 12, a počítat 9, dokud nemám své 6 skupiny. Například moje první skupina bude 12 až 21 od 12+9=21. Moje další skupina bude 21-30 od 21 + 9=30… a tak dále. Dám je do stolu a označím je „třídami“. Přidám také“ frekvenci “ do tabulky.,equency
Krok 4: Zjistit četnost pro jednotlivé skupiny
Tato část je pravděpodobně nejvíce únavné a hlavní důvod, proč je nereálné, aby se frekvenční distribuce nebo histogram po ruce pro velmi velké datové sady., Spočítáme, kolik bodů je v každé skupině. Začněme s naší první skupinou: 12-21. Chceme spočítat, kolik bodů je mezi 12 a 21 bez 21. Vidíte překrývání mezi skupinami správně? To má odpovídat za desetinná místa a necháme si je, i když žádné nemáme. Pravý koncový bod každé skupiny není v této skupině zahrnut. Jde to do další skupiny. To znamená, že 21 by bylo ve druhé skupině a všech 30, které máme, by bylo započítáno do třetí skupiny.
zpět do první skupiny: 12-21., Kroužil jsem kolem bodů, které by byly zahrnuty do této skupiny:
v pořádku-nyní aktualizuji tabulku s těmito informacemi!,
Classes | Frequency |
---|---|
12 – 21 | 8 |
21 – 30 | |
30 – 39 | |
39 – 48 | |
48 – 57 | |
57 – 66 |
Continuing with this pattern (each group is a different color!,):
Classes | Frequency |
---|---|
12 – 21 | 8 |
21 – 30 | 6 |
30 – 39 | 6 |
39 – 48 | 6 |
48 – 57 | 2 |
57 – 66 | 2 |
That last table is our frequency distribution!, Chcete-li z toho vytvořit histogram, použijeme skupiny na vodorovné ose a frekvenci na svislé ose. Nakonec použijeme tyče k reprezentaci frekvence každé jednotlivé skupiny. S těmito údaji bude hotový histogram vypadat jako ten níže.
můžete vidět další příklad toho, jak se to dělá ve videu níže.,
Video příklad:
V tomto příkladu, budeme jít přes stejný proces s jinou datovou sadu.
Co studovat další
Jakmile budete vědět, jak načrtněte histogram, byste měli studovat, jak je číst a jak interpretovat běžné tvary běžných tvarů a vzorů. Nakonec můžete také vidět, jak vytvořit histogramy na kalkulačce TI-83.,
Přihlásit se k odběru našeho Newsletteru!
vždy zveřejňujeme nové bezplatné lekce a přidáváme další studijní příručky, průvodce kalkulačkou a problémové balíčky.
Zaregistrujte se a získejte příležitostné e-maily (jednou za pár nebo tři týdny), abyste věděli, co je nového!,