1973 publicerade Fischer Black, Myron Scholes och Robert Merton sin nu välkända alternativ prissättning formel, vilket skulle ha en betydande inverkan på utvecklingen av kvantitativ finansiering.,1 i sin modell (vanligtvis känd som Black-Scholes) beror värdet av ett alternativ på den framtida volatiliteten hos ett lager snarare än på dess förväntade avkastning. Deras prisformel var en teoridriven modell baserad på antagandet att aktiepriserna följer geometrisk Brownian motion., Med tanke på att Chicago Board Options Exchange (CBOE) öppnade 1973 diskett hade uppfunnits bara två år tidigare och IBM var fortfarande åtta år bort från att lansera sin första PC (som hade två diskettstationer), med hjälp av en data-strategi som bygger på verkliga alternativ priserna skulle ha varit ganska komplicerat vid tidpunkten för Black, Scholes och Merton. Även om deras lösning är anmärkningsvärd kan den inte reproducera några empiriska fynd., En av de största bristerna hos Black-Scholes är skillnaden mellan modellvolatiliteten hos det underliggande alternativet och den observerade volatiliteten från marknaden (den så kallade implicita volatilitetsytan).
idag har investerare ett val. Vi har mer beräkningskraft i våra mobiltelefoner än toppmoderna datorer hade på 1970-talet, och tillgängliga data växer exponentiellt. Som ett resultat kan vi använda en annan, datadriven strategi för alternativ prissättning. I den här artikeln presenterar vi en lösning för alternativ prissättning baserat på en empirisk metod med hjälp av neurala nätverk., Den största fördelen med maskininlärningsmetoder som neurala nätverk, jämfört med modelldrivna tillvägagångssätt, är att de kan reproducera de flesta av de empiriska egenskaperna hos alternativpriserna.
introduktion till alternativ prissättning
med de finansiella derivat som kallas optioner betalar köparen ett pris till säljaren för att köpa en rätt att köpa eller sälja ett finansiellt instrument till ett angivet pris vid en viss punkt i framtiden. Alternativ kan vara användbara verktyg för många finansiella applikationer, inklusive riskhantering, handel och hanteringskompensation., Inte överraskande har skapandet av tillförlitliga prissättningsmodeller för optioner varit ett aktivt forskningsområde inom den akademiska världen.
ett av de viktigaste resultaten av denna forskning var Black-Scholes-formeln, som ger priset på ett alternativ baserat på flera ingångsparametrar, såsom priset på det underliggande beståndet, marknadens riskfria ränta, tiden fram till optionens utgångsdatum, kontraktets lösenpris och volatiliteten hos det underliggande beståndet., Innan Black-Scholes använde utövare prissättningsmodeller baserade på put-call parity eller en antagen riskpremie som liknar värderingen av investeringsprojekt. Inom företagsfinansiering är en av de mest använda modellerna för värdering av företag den diskonterade kassaflödesmodellen (DCF), som beräknar nuvärdet av ett företag som summan av dess diskonterade framtida kassaflöden. Diskonteringsräntan baseras på den upplevda risken att investera kapital i det företaget., Den revolutionerande idén bakom Black-Scholes var att det inte är nödvändigt att använda riskpremien när man värderar ett alternativ, eftersom aktiepriset redan innehåller denna information. År 1997 tilldelades Kungliga Vetenskapsakademien Nobelpriset i ekonomi till Merton och Scholes för deras banbrytande arbete. (Black delade inte priset. Han dog 1995, och Nobelpriset tilldelas inte postumt.,)
om alla optionspriser är tillgängliga på marknaden kan Black-Scholes användas för att beräkna den så kallade implicita volatiliteten baserat på optionspriser, eftersom alla andra variabler i formeln är kända. Baserat på Black-Scholes bör den underförstådda volatiliteten vara densamma för alla strejkpriser för alternativet, men i praktiken fann forskare att den underförstådda volatiliteten för alternativ inte är konstant. Istället är det skevt eller leende-formad.
forskare söker aktivt modeller som kan prissätta alternativ på ett sätt som kan reproducera den empiriskt observerade implicita volatilitetsytan., En populär lösning är Heston-modellen, där volatiliteten hos den underliggande tillgången bestäms med hjälp av en annan stokastisk process. Modellen, uppkallad efter University of Maryland matematiker Steven Heston, kan reproducera många empiriska fynd — inklusive underförstådd volatilitet-men inte alla av dem, så finansiella ingenjörer har använt olika avancerade underliggande processer för att komma med lösningar för att generera empiriska fynd., När prismodellerna utvecklades uppstod följande svårigheter:
• * den underliggande prisdynamiken blev mer komplex matematiskt och blev mer allmän — till exempel med Lévy-processer istället för Brownian-rörelser.
• prissättningen av alternativ blev mer resurskrävande. Även om Black-Scholes-modellen har en sluten formlösning för prissättning av Europeiska samtalsalternativ, använder idag människor vanligtvis mer beräkningsintensiva Monte Carlo-metoder för att prissätta dem.
• det krävs djupare teknisk kunskap för att förstå och använda prismodellerna.,
tillämpa maskininlärningsmetoder till alternativ prissättning tar upp de flesta av dessa problem. Det finns olika algoritmer som kan approximera en funktion baserad på funktionens in-och utgångar om antalet datapunkter är tillräckligt stort. Om vi ser alternativet som en funktion mellan de kontrakterade villkoren (ingångar) och premien för alternativet (produktion), kan vi helt enkelt ignorera alla finansiella frågor relaterade till alternativ eller aktiemarknader., Senare kommer vi att se hur att lägga till lite finansiell kunskap tillbaka i modellen kan bidra till att förbättra resultatens noggrannhet, men på grundnivå behövs ingen finansiell information.
en av dessa approximationstekniker använder artificiella neurala nätverk, som har ett antal användbara egenskaper., Till exempel, vissa medlemmar av artificiella neurala nätverk är universella approximators — vilket innebär att om urvalet är tillräckligt stor och den algoritm som är tillräckligt komplex, då den funktion som nätverk lärt sig kommer att vara tillräckligt nära verkligheten för alla praktiska ändamål, som visade George Cybenko (1989)2 och Kurt Hornik, Maxwell B. Stinchcombe och Halbert Vit (1989).3 artificiella neurala nätverk är lämpliga för stora databaser eftersom beräkningarna kan göras enkelt på flera datorer parallellt., En av deras mest intressanta egenskaper är dualitet i beräkningshastighet: även om träningen kan vara ganska tidskrävande, när processen är klar och approximationen av funktionen är klar är förutsägelsen extremt snabb.
neurala nätverk
det väsentliga begreppet neurala nätverk är att modellera beteendet hos den mänskliga hjärnan och skapa en matematisk formulering av den hjärnan för att extrahera information från indata., Den grundläggande enheten i ett neuralt nätverk är en perceptron, som härmar beteendet av en neuron och uppfanns av den Amerikanska psykologen Frank Rosenblatt i 1957.4 Men potentialen för neurala nätverk var inte loss förrän 1986, när David Rumelhart, Geoffrey Hinton och Ronald Williams publicerade sina inflytelserika papper på backpropagation-algoritmen, som visar på ett sätt att träna artificiella neuroner.5 Efter denna upptäckt byggdes många typer av neurala nätverk, inklusive multilayer perceptron (MLP), vilket är fokus för denna artikel.,
MLP består av lager av perceptroner, som var och en har en ingång: summan av perceptronernas utgång från föregående lager multiplicerat med deras vikter; det kan vara annorlunda för varje perceptron. Perceptronerna använder en olinjär aktiveringsfunktion (som den S-formade sigmoidfunktionen) för att omvandla ingångssignalerna till utgångssignaler och skicka dessa signaler till nästa lager. Det första skiktet (inmatningsskiktet) är unikt; perceptroner i detta lager har bara en utgång, vilket är inmatningsdata., Det sista lagret (utgångsskiktet) är unikt i den meningen att det i regressionsproblem vanligtvis består av en enda perceptron. Alla lager mellan dessa två lager kallas vanligtvis dolda lager. För en MLP med ett dolt lager är visualiseringen enligt följande i Figur 1.,
Figur 1 kan skrivas matematiskt mellan det dolda lagret och inmatningsskiktet som: