Hypothese Testen in Finance: Concept & Voorbeelden

The Bayesian Trap (Mei 2024)

The Bayesian Trap (Mei 2024)
Hypothese Testen in Finance: Concept & Voorbeelden
Anonim

Uw beleggingsadviseur stelt u een maandelijkse inkomensinvesteringsregeling voor die elke maand een variabel rendement belooft. U investeert er alleen in als u verzekerd bent van een gemiddeld maandelijks inkomen van $ 180. Uw adviseur vertelt u ook dat in de afgelopen 300 maanden het schema rendementen had met een gemiddelde waarde van $ 190 en een standaardafwijking van $ 75. Moet u in dit schema investeren?

Het testen van hypotheses helpt een dergelijke beslissing.

Dit artikel veronderstelt dat de lezer vertrouwd is met concepten van een normale distributietabel, formule, p-waarde en gerelateerde basisprincipes van statistieken.

Voor meer informatie over praktische toepassingen van gegevens om het risico te bepalen, zie "5 manieren om het risico op onderlinge fondsen te meten."

Hypothesetesten (of significantietests) is een wiskundig model voor het testen van een claim, idee of hypothese over een parameter van belang in een gegeven populatieset, met behulp van gegevens die zijn gemeten in een bemonsteringsset. Berekeningen worden uitgevoerd op geselecteerde steekproeven om meer doorslaggevende informatie te verzamelen over kenmerken van de gehele populatie, wat een systematische manier mogelijk maakt om claims of ideeën over de gehele dataset te testen.

Hier is een eenvoudig voorbeeld: (A) Een schoolhoofd rapporteert dat studenten op haar school gemiddeld 7 van de 10 halen voor examens. Om deze "hypothese" te testen, noteren we cijfers van bijvoorbeeld 30 studenten (steekproef) uit de gehele studentenpopulatie van de school (zeg 300) en berekenen we het gemiddelde van die steekproef. We kunnen dan het (berekende) steekproefgemiddelde vergelijken met het (gerapporteerde) populatiegemiddelde en proberen de hypothese te bevestigen.

Nog een voorbeeld: (B) De jaarlijkse opbrengst van een bepaald beleggingsfonds is 8%. Neem aan dat het beleggingsfonds al 20 jaar bestaat. We nemen een willekeurige steekproef van jaarlijkse rendementen van het beleggingsfonds voor bijvoorbeeld vijf jaar (steekproef) en berekenen het gemiddelde. Vervolgens vergelijken we het (berekende) steekproefgemiddelde met het (geclaimde) populatiegemiddelde om de hypothese te verifiëren.

Er bestaan ​​verschillende methodologieën voor het testen van hypothesen. De volgende vier basisstappen zijn van belang:

Stap 1: Definieer de hypothese:

Gewoonlijk wordt de gerapporteerde waarde (of de claimstatistieken) vermeld als de hypothese en wordt verondersteld dat deze waar is. Voor de bovenstaande voorbeelden is de hypothese:

  • Voorbeeld A: leerlingen op school scoren gemiddeld 7 op 10 bij examens
  • Voorbeeld B: jaarlijkse opbrengst van het beleggingsfonds is 8% per jaar

Dit is vermeld beschrijving vormt de " Null-hypothese (H 0 ) " en is aangenomen om waar te zijn. Net als bij een rechtszaak begint de jury door onschuld aan te nemen van de verdachte, gevolgd door de vaststelling of de aanname onjuist is. Evenzo begint het testen van de hypothese door de "nulhypothese" te stellen en aan te nemen, en dan bepaalt het proces of de veronderstelling waarschijnlijk waar of onwaar is.

Het belangrijke punt om op te merken is dat we de nulhypothese testen omdat er een element van twijfel bestaat over de geldigheid ervan. Welke informatie dan ook die tegen de gestelde nulhypothese is, wordt vastgelegd in de Alternatieve hypothese (H 1 ). Voor de bovenstaande voorbeelden is de alternatieve hypothese:

  • Studenten scoren een gemiddelde dat niet is gelijk aan 7
  • Het jaarlijkse rendement van het beleggingsfonds is niet gelijk tot 8% per jaar

Samengevat, alternatieve hypothese is een directe tegenspraak met de nulhypothese.

Zoals bij een rechtszaak, neemt de jury de onschuld van de verdachte over (nulhypothese). De officier van justitie moet het tegendeel bewijzen (alternatief). Evenzo moet de onderzoeker bewijzen dat de nulhypothese waar of onwaar is. Als de officier van justitie de alternatieve hypothese niet kan bewijzen, moet de jury de 'verdachte' (baserend op de beslissing over nulhypothese) loslaten. Evenzo, als een onderzoeker geen alternatieve hypothese kan bewijzen (of simpelweg niets doet), wordt verondersteld dat de nulhypothese waar is.

Stap 2: Stel de beslissingscriteria in

De beslissingscriteria moeten gebaseerd zijn op bepaalde parameters van datasets en dit is waar de verbinding met de normale verdeling in beeld komt.

Volgens de standaardstatistieken is er postulaat over steekproefverdeling: "Voor steekproefomvang n is de steekproefverdeling van X̅ normaal als de populatie X waaruit het monster wordt getrokken normaal verdeeld is. "Vandaar dat de waarschijnlijkheden van alle andere mogelijke steekproefgemiddelden die men zou kunnen selecteren normaal verdeeld zijn.

Voor e. g. , bepalen of het gemiddelde dagelijkse rendement van elke beurs genoteerd op de XYZ-aandelenmarkt rond de jaarwisseling groter is dan 2%.

H 0 : Null-hypothese: gemiddelde = 2%

H 1 : alternatieve hypothese: gemiddelde> 2% (dit is wat we willen bewijzen)

Neem het monster (zeg van 50 aandelen op een totaal van 500) en bereken het gemiddelde van het monster.

Voor een normale verdeling ligt 95% van de waarden binnen 2 standaarddeviaties van het populatiegemiddelde. Vandaar dat deze normale verdeling en centrale limietveronderstelling voor de voorbeeldgegevensset ons in staat stelt 5% als significantieniveau vast te stellen. Het is logisch dat er onder deze aanname een kans van minder dan 5% (100-95) is om uitbijters te krijgen die meer dan 2 standaardafwijkingen van het populatiegemiddelde zijn. Afhankelijk van de aard van datasets, kunnen andere significantieniveaus worden genomen van 1%, 5% of 10%. Voor financiële berekeningen (inclusief gedragsfinanciering) is 5% de algemeen aanvaarde limiet. Als we berekeningen vinden die verder gaan dan de gebruikelijke 2 standaarddeviaties, dan hebben we een sterk aantal uitbijters om de nulhypothese af te wijzen. Standaardafwijkingen zijn uitermate belangrijk voor het begrijpen van statistische gegevens. Lees meer over hen door Investopedia's video over standaarddeviaties te bekijken.

Grafisch wordt dit als volgt weergegeven:

In het bovenstaande voorbeeld, als het gemiddelde van de steekproef veel groter is dan 2% (zeg 3. 5%), dan verwerpen we de nulhypothese.De alternatieve hypothese (gemiddelde> 2%) wordt geaccepteerd, wat bevestigt dat het gemiddelde dagelijkse rendement van de aandelen inderdaad boven de 2% ligt.

Echter, als het gemiddelde van het monster waarschijnlijk niet significant groter is dan 2% (en bijvoorbeeld rond de 2% blijft), dan KUNNEN we NIET de nulhypothese verwerpen. De uitdaging zit hem in het beslissen over dergelijke gevallen van dichtbij. Om een ​​conclusie te trekken uit geselecteerde monsters en resultaten, moet een significantieniveau worden bepaald, waardoor een conclusie kan worden getrokken over de nulhypothese. De alternatieve hypothese maakt het mogelijk het significantieniveau of het concept 'critical value' vast te stellen voor beslissingen over dergelijke kortetermijngevallen. Volgens de standaarddefinitie is 'Een kritieke waarde een afkapwaarde die de grenzen definieert waarboven minder dan 5% van het monster middelen kunnen worden verkregen als de nulhypothese waar is.Bijvoorbeeld betekent verkregen boven een kritische waarde zal resulteren in een beslissing om de nulhypothese te verwerpen. "In het bovenstaande voorbeeld, als we de kritische waarde hebben gedefinieerd als 2. 1%, en de het berekende gemiddelde komt op 2. 2%, dan verwerpen we de nulhypothese. Een kritieke waarde legt een duidelijke afbakening vast over acceptatie of afwijzing.

Meer voorbeelden om te volgen - Laten we eerst eens kijken naar enkele meer belangrijke stappen en concepten.

Stap 3: Bereken de teststatistiek:

Deze stap omvat het berekenen van de vereiste figuur (len), ook wel teststatistieken genoemd (zoals gemiddelde, z-score, p-waarde, etc.) voor het geselecteerde monster. De verschillende waarden die moeten worden berekend, zijn gedekt in een later gedeelte met voorbeelden.

Stap 4: maak conclusies over de hypothese

Bepaal met de berekende waarde (n) de nulhypothese. Als de kans om een ​​steekproefgemiddelde te krijgen kleiner is dan 5%, is de conclusie om de nulhypothese af te wijzen . Anders accepteert en behoudt u de nulhypothese.

Typen fouten bij het nemen van beslissingen:

Er kunnen vier mogelijke uitkomsten zijn in steekproefgebaseerde besluitvorming, met betrekking tot de juiste toepasbaarheid op de gehele populatie:

Beslissing om te behouden

Beslissing tot weigering > Geldt voor de gehele populatie

Correct

Niet correct

(TYPE 1 Error - a)

Geldt niet voor de gehele populatie

Niet correct

(TYPE 2 Error - b)

Correct

De "juiste" gevallen zijn die waarbij de beslissingen genomen op de monsters echt van toepassing zijn op de gehele populatie. De gevallen van fouten ontstaan ​​wanneer iemand beslist om de nulhypothese te behouden (of te verwerpen) op basis van steekproefberekeningen, maar die beslissing is niet echt van toepassing op de hele populatie. Deze gevallen vormen Type 1 (alfa) en Type 2 (beta) fouten, zoals aangegeven in de bovenstaande tabel.

Door de juiste kritieke waarde te selecteren, kunt u de alfa-fouten type 1 verwijderen of deze tot een acceptabel bereik beperken.

Alfa staat voor de fout op het niveau van significantie en wordt bepaald door de onderzoeker. Om de standaard significantie of betrouwbaarheidsniveau van 5% voor kansberekeningen te behouden, wordt deze behouden op 5%.

Conform de van toepassing zijnde beslissingsbenchmarks en -definities:

"Dit (alfa) criterium staat meestal op 0.05 (a = 0. 05), en we vergelijken het alfaniveau met de p-waarde. Wanneer de kans op een Type I-fout kleiner is dan 5% (p <0,05), besluiten we de nulhypothese af te wijzen; anders behouden we de nulhypothese. "

  • De technische term die voor deze kans wordt gebruikt, is
  • p-waarde . Het wordt gedefinieerd als "de waarschijnlijkheid van het verkrijgen van een steekproefuitkomst, aangezien de waarde die in de nulhypothese wordt vermeld, waar is. De p-waarde voor het verkrijgen van een steekproefuitkomst wordt vergeleken met het significantieniveau ". Een Type II-fout of bètafout wordt gedefinieerd als "de waarschijnlijkheid dat de nulhypothese niet correct wordt gehandhaafd, terwijl deze in feite niet van toepassing is op de gehele populatie. "
  • Een paar voorbeelden zullen deze en andere berekeningen aantonen.

Voorbeeld 1. Er bestaat een beleggingsplan voor maandelijkse inkomsten dat een variabel maandelijks rendement belooft. Een belegger zal er alleen in beleggen als hij verzekerd is van een maandelijks gemiddeld inkomen van $ 180. Hij heeft een voorbeeld van 300 maanden rendement wat een gemiddelde van $ 190 en een standaardafwijking van $ 75 betekent. Moet hij of zij in dit schema investeren?

Laten we het probleem oplossen. De belegger zal in de regeling investeren als hij of zij verzekerd is van zijn gewenste gemiddelde rendement van $ 180. Hier,

H

0 : Null-hypothese: gemiddelde = 180 H

1 : Alternatieve hypothese: gemiddelde> 180 Methode 1 -

Kritieke waardebenadering : Identificeer een kritieke waarde X

L voor het steekproefgemiddelde, dat groot genoeg is om de nulhypothese te verwerpen: i. e. verwerpt de nulhypothese als steekproefgemiddelde> = kritieke waarde X L P (identificeer een Type I-alfafout) = P (afwijzing H

0 gegeven dat H 0 is waar), , wat zou worden bereikt wanneer het steekproefgemiddelde de kritische limieten i overschrijdt. e.

= P (gegeven dat H

0 waar is) = alfa Grafisch,

Alfa nemen = 0,05 (dat wil zeggen 5% significantieniveau), Z

0. 05 = 1. 645 (uit de Z-tabel of normale distributietabel) => X

L = 180 +1. 645 * (75 / sqrt (300)) = 187. 12 Aangezien het steekproefgemiddelde (190) groter is dan de kritieke waarde (187. 12), wordt de nulhypothese afgewezen en de conclusie is dat het gemiddelde maandelijks rendement is inderdaad meer dan $ 180, dus de belegger kan overwegen te investeren in deze regeling.

Methode 2 - Gebruik van gestandaardiseerde teststatistieken

: Men kan ook de gestandaardiseerde waarde z gebruiken.

Teststatistiek, Z = (steekproefgemiddelde - populatiegemiddelde) / (std-dev / sqrt (aantal monsters), dwz

Vervolgens wordt het afstotingsgebied

Z = (190 - 180) / ( 75 / sqrt (300)) = 2. 309

Ons rejectiegebied op 5% significantieniveau is Z> Z

0. 05 = 1. 645 Aangezien Z = 2.309 is groter dan 1. 645, kan de nulhypothese worden verworpen met de vergelijkbare conclusie hierboven.

Methode 3 - Berekening van de P-waarde:

We willen P (steekproefgemiddelde> = 190, gemiddelde = 180) = (190-180) / (75 / sqrt (300))

= P (Z> = 2.309) = 0. 0084 = 0. 84%

De volgende tabel om p-waardeberekeningen af ​​te leiden, wordt geconcludeerd dat er bevestigd bewijs is dat het gemiddelde maandelijks rendement hoger is dan 180.

p-waarde

Inferentie

minder dan 1%

Bevestigd bewijs

met ondersteuning voor alternatieve hypothese

tussen 1% en 5% Sterk bewijs

ter ondersteuning van alternatieve hypothese > tussen 5% en 10%

Zwak bewijs ter ondersteuning van alternatieve hypothese

van meer dan 10%

Geen bewijs ter ondersteuning van alternatieve hypothese

Voorbeeld 2: een nieuwe effectenmakelaar (XYZ) beweert dat zijn makelaarscijfers lager zijn dan die van uw huidige effectenmakelaar (ABC). Gegevens die beschikbaar zijn van een onafhankelijk onderzoeksbureau geven aan dat het gemiddelde en de standaardwaarde van alle ABC-makelaarscliënten respectievelijk $ 18 en $ 6 bedragen.

Een steekproef van 100 klanten van ABC wordt genomen en makelaarskosten worden berekend met de nieuwe tarieven van XYZ-makelaar. Als het gemiddelde van het monster $ 18 is. 75 en std-dev is hetzelfde ($ 6), kan er een conclusie worden getrokken over het verschil in de gemiddelde bemiddelingsrekening tussen ABC en XYZ-tussenpersoon? H

0

: Null-hypothese: gemiddelde = 18

H 1 : alternatieve hypothese: gemiddelde 18 (dit is wat we willen bewijzen)

Afkeuringsgebied: Z <= - z 2. 5 en Z> = Z

2. 5 (uitgaande van 5% significantieniveau, split 2. 5 aan weerszijden) Z = (steekproefgemiddelde) / (std-dev / sqrt (aantal monsters) = (18 75 - 18) / (6 / (sqrt (100)) = 1. 25 Deze berekende Z-waarde valt tussen de twee limieten gedefinieerd door

- Z

2. 5

= -1 96 en Z

2. 5 = 1. 96. Dit concludeert dat er onvoldoende bewijs is om aan te nemen dat er enig verschil is tussen de tarieven van uw bestaande en nieuwe broker. De p-waarde = P (Z1, 25) = 2 * 0. 1056 = 0. 2112 = 21. 12%, wat groter is dan 0. 05 of 5%, leidend tot dezelfde conclusie.

Grafisch , wordt dit weergegeven door:

Kritiekpunten voor hypothetische testmethoden:

-

Statistische methode op basis van aannamen

- Foutgevoelig als uitgewerkt in termen van alfa- en bètafstanden

- Interpretatie van p-waarde kan ambigu zijn, leidend tot verwarrende resultaten De Bottom Line

Hypothese testen laten een wiskundig model toe om een ​​claim of idee te valideren met bepaald betrouwbaarheidsniveau. Net als de meeste statistische hulpmiddelen en modellen is ook dit aan een aantal beperkingen gebonden. Het gebruik van dit model voor het nemen van financiële beslissingen moet kritisch worden overwogen, waarbij alle afhankelijkheden in het achterhoofd moeten worden gehouden. Alternatieve methoden zoals Bayesian Inference zijn ook de moeite waard om te verkennen voor vergelijkbare analyses.