
De normale verspreidingsformule is gebaseerd op twee eenvoudige parameters - gemiddelde en standaarddeviatie - die de kenmerken van een gegeven dataset. Terwijl het gemiddelde de "centrale" of gemiddelde waarde van de gehele gegevensset aangeeft, geeft de standaardafwijking de "spreiding" of variatie van gegevenspunten rond die gemiddelde waarde aan.
Overweeg de volgende 2 datasets:
Dataset 1 = {10, 10, 10, 10, 10, 10, 10, 10, 10, 10}
Gegevensset 2 = {6, 8, 10, 12, 14, 14, 12, 10, 8, 6}
Voor gegevensset1, gemiddelde = 10 en standaardafwijking (stddev) = 0
Voor Dataset2, mean = 10 en standaarddeviatie (stddev) = 2. 83
Laten we deze waarden plotten voor DataSet1:
Op dezelfde manier voor DataSet2:
De rode horizontale lijn in beide bovenstaande grafieken geeft het "gemiddelde" of de gemiddelde waarde van elke dataset aan (10 in beide gevallen). De roze pijlen in de tweede grafiek geven de spreiding of variatie van gegevenswaarden van de gemiddelde waarde aan. Dit wordt vertegenwoordigd door een standaardafwijkingswaarde van 2. 83 in het geval van DataSet2. Aangezien DataSet1 alle waarden hetzelfde heeft (zoals 10 elk) en geen variaties, is de stddev-waarde nul en daarom zijn geen roze pijlen van toepassing.
De stddev-waarde heeft enkele belangrijke en bruikbare kenmerken die uiterst nuttig zijn bij gegevensanalyse. Voor een normale verdeling zijn de gegevenswaarden symmetrisch verdeeld aan weerszijden van het gemiddelde. Voor elke normaal verdeelde gegevensset, grafiek plotten met stddev op horizontale as en nee. van gegevenswaarden op de verticale as, wordt de volgende grafiek verkregen.
Eigenschappen van een normale verdeling
- De normale curve is symmetrisch ten opzichte van het gemiddelde;
- Het gemiddelde bevindt zich in het midden en verdeelt het gebied in twee helften;
- Het totale gebied onder de curve is gelijk aan 1 voor gemiddelde = 0 en stdev = 1;
- De verdeling wordt volledig beschreven door het gemiddelde en stddev
Zoals te zien is in de bovenstaande grafiek, staat stddev voor het volgende:
- 68. 3% van gegevenswaarden liggen binnen 1 standaardafwijking van het gemiddelde (-1 tot +1)
- 95. 4% van gegevenswaarden liggen binnen 2 standaarddeviaties van het gemiddelde (-2 tot +2)
- 99. 7% van gegevenswaarden liggen binnen 3 standaarddeviaties van het gemiddelde (-3 tot +3)
Het gebied onder de klokvormige curve, indien gemeten, geeft de gewenste waarschijnlijkheid van een gegeven aan bereik:
- minder dan X: - e. g. kans dat de gegevenswaarden kleiner zijn dan 70
- groter dan X - e. g. kans dat gegevenswaarden groter zijn dan 95
- tussen X 1 en X 2 - e. g. kans op gegevenswaarden tussen 65 en 85
waarbij X een interessante waarde is (onderstaande voorbeelden).
Het plotten en berekenen van het gebied is niet altijd handig, omdat verschillende gegevenssets verschillende gemiddelde en stddev-waarden hebben.Om een uniforme standaardmethode voor eenvoudige berekeningen en toepasbaarheid op echte problemen mogelijk te maken, is de standaardconversie naar Z-waarden geïntroduceerd, die deel uitmaken van de normale distributietabel .
Z = (X - gemiddelde) / stddev, waarbij X de willekeurige variabele is.
Kort gezegd dwingt deze omzetting het gemiddelde en de standaardwaarde om te worden gestandaardiseerd naar respectievelijk 0 en 1, waardoor een standaard gedefinieerde reeks Z-waarden (van de normale distributietabel ) kan worden gebruikt voor eenvoudige berekeningen . Een momentopname van de standaard Z-waardetabel met waarschijnlijkheidswaarden is als volgt:
z |
0. 00 |
0. 01 |
0. 02 |
0. 03 |
0. 04 |
0. 05 |
0. 06 |
0. 0 |
0. 00000 |
0. 00399 |
0. 00.798 |
0. 01197 |
0. 01595 |
0. 01994 |
… |
0. 1 |
0. 0398 |
0. 04380 |
0. 04.776 |
0. 05172 |
0. 05.567 |
0. 05.966 |
… |
0. 2 |
0. 0793 |
0. 08.317 |
0. 08.706 |
0. 09.095 |
0. 09.483 |
0. 09871 |
… |
0. 3 |
0. 11791 |
0. 12172 |
0. 12552 |
0. 12930 |
0. 13307 |
0. 13683 |
… |
0. 4 |
0. 15542 |
0. 15910 |
0. 16276 |
0. 16640 |
0. 17003 |
0. 17364 |
… |
0. 5 |
0. 19146 |
0. 19497 |
0. 19847 |
0. 20194 |
0. 20540 |
0. 20884 |
… |
0. 6 |
0. 22575 |
0. 22907 |
0. 23237 |
0. 23565 |
0. 23891 |
0. 24215 |
… |
0. 7 |
0. 25804 |
0. 26115 |
0. 26424 |
0. 26730 |
0. 27035 |
0. 27337 |
… |
… |
… |
… |
… |
… |
… |
… |
… |
De waarschijnlijkheid vinden gerelateerd aan de z-waarde van 0. 239865 , ronden het eerst af tot 2 decimalen (oftewel 0. 24). Controleer vervolgens de eerste 2 significante cijfers (0. 2) in de rijen en voor het minst significante cijfer (overgebleven 0. 04) in de kolom. Dat zal leiden tot een waarde van 0. 09483.
De volledige normale distributietabel, met een nauwkeurigheid tot 5 decimalen voor waarschijnlijkheidswaarden (inclusief die voor negatieve waarden), is hier te vinden.
Laten we enkele voorbeelden uit het echte leven bekijken. De hoogte van individuen in een grote groep volgt een normaal verspreidingspatroon. Stel dat we een set van 100 personen hebben waarvan de hoogten zijn vastgelegd en het gemiddelde en stddev worden berekend tot respectievelijk 66 en 6 inch.
Hier zijn enkele voorbeeldvragen die eenvoudig kunnen worden beantwoord met behulp van de z-waardetabel:
- Wat is de kans dat een persoon in de groep 70 inch of minder is?
Vraag is het vinden van cumulatieve waarde van P (X <= 70) i. e. in de volledige dataset van 100, hoeveel waarden zullen liggen tussen 0 en 70.
Laten we eerst de X-waarde van 70 naar de equivalente Z-waarde converteren.
Z = (X - gemiddelde) / stddev = (70-66) / 6 = 4/6 = 0. 66667 = 0. 67 (rond naar 2 decimalen)
We moeten nu P (Z vinden <= 0. 67) = 0. 24857 (uit de z-tabel hierboven)
i. e. er is een waarschijnlijkheid van 24,87% dat een persoon in de groep minder dan of gelijk aan 70 inch zal zijn.
Maar wacht even - het bovenstaande is onvolledig.Vergeet niet dat we op zoek zijn naar de waarschijnlijkheid van alle mogelijke hoogten tot 70 i. e. van 0 tot 70. Het bovenstaande geeft u gewoon het gedeelte van gemiddelde naar gewenste waarde (dat wil zeggen 66 tot 70). We moeten de andere helft opnemen - van 0 tot 66 - om tot het juiste antwoord te komen.
Aangezien 0 tot 66 het halve deel vertegenwoordigt (dwz één uiterste tot gemiddelde gemiddelde), is de kans eenvoudig 0. 5.
Vandaar de juiste waarschijnlijkheid dat een persoon 70 inch of minder = 0. 24857 + 0. 5 = 0. 74857 = 74. 857%
Grafisch (door het gebied te berekenen), zijn dit de twee gesommeerde gebieden die de oplossing vertegenwoordigen:
- Wat is de kans dat een persoon 75 inch of hoger is?
i. e. Vind Complementaire cumulatieve P (X> = 75).
Z = (X - gemiddelde) / stddev = (75-66) / 6 = 9/6 = 1. 5
P (Z> = 1. 5) = 1 - P (Z <= 1. 5) = 1 - (0. 5 + 0. 43319) = 0. 06681 = 6. 681%
- Wat is de kans dat een persoon tussen 52 inch en 67 inch ligt?
Zoek P (52 <= x <= 67).
P (52 <= x <= 67) = p [(52-66) / 6 <= z <= (67-66) / 6] = p (-2. 33 <= z <= 0. 17)
= P (Z <= 0. 17) -p (Z <= -0. 233) = (0. 5 + 0. 56749) - (.40905) =
Dit normaal distributietabel (en z-waarden) vindt gewoonlijk gebruik voor alle waarschijnlijkheidsberekeningen op verwachte koersbewegingen op de aandelenmarkt voor aandelen en indices. Ze worden gebruikt in op afstand gebaseerde handel, waarbij uptrend- of downtrend-, ondersteunings- of weerstandsniveaus en andere technische indicatoren worden geïdentificeerd op basis van normale distributieconcepten van gemiddelde en standaarddeviatie.
Het Lipper Rating System verklaard

Gaan nader in op hoe Lipper Inc., een dochteronderneming van Thomson Reuters, de ratings voor beleggingsfondsen bepaalt in zijn Lipper Rating System.
Overgenomen IRA en 401 (k) regels verklaard

Wat u moet weten als het gaat om de complexe regels voor geërfde IRA's en 401 (k) s.
Dubbele exponentiële voortschrijdende gemiddelden verklaard

Deze aanpassing aan voortschrijdende gemiddelden geeft traders sneller toegang tot de informatie die ze nodig hebben.