1973 publicerade Fischer Black, Myron Scholes och Robert Merton sin nu välkända alternativ prissättning formel, vilket skulle ha en betydande inverkan på utvecklingen av kvantitativ finansiering.,1 i sin modell (vanligtvis känd som Black-Scholes) beror värdet av ett alternativ på den framtida volatiliteten hos ett lager snarare än på dess förväntade avkastning. Deras prisformel var en teoridriven modell baserad på antagandet att aktiepriserna följer geometrisk Brownian motion., Med tanke på att Chicago Board Options Exchange (CBOE) öppnade 1973 diskett hade uppfunnits bara två år tidigare och IBM var fortfarande åtta år bort från att lansera sin första PC (som hade två diskettstationer), med hjälp av en data-strategi som bygger på verkliga alternativ priserna skulle ha varit ganska komplicerat vid tidpunkten för Black, Scholes och Merton. Även om deras lösning är anmärkningsvärd kan den inte reproducera några empiriska fynd., En av de största bristerna hos Black-Scholes är skillnaden mellan modellvolatiliteten hos det underliggande alternativet och den observerade volatiliteten från marknaden (den så kallade implicita volatilitetsytan).

idag har investerare ett val. Vi har mer beräkningskraft i våra mobiltelefoner än toppmoderna datorer hade på 1970-talet, och tillgängliga data växer exponentiellt. Som ett resultat kan vi använda en annan, datadriven strategi för alternativ prissättning. I den här artikeln presenterar vi en lösning för alternativ prissättning baserat på en empirisk metod med hjälp av neurala nätverk., Den största fördelen med maskininlärningsmetoder som neurala nätverk, jämfört med modelldrivna tillvägagångssätt, är att de kan reproducera de flesta av de empiriska egenskaperna hos alternativpriserna.

introduktion till alternativ prissättning

med de finansiella derivat som kallas optioner betalar köparen ett pris till säljaren för att köpa en rätt att köpa eller sälja ett finansiellt instrument till ett angivet pris vid en viss punkt i framtiden. Alternativ kan vara användbara verktyg för många finansiella applikationer, inklusive riskhantering, handel och hanteringskompensation., Inte överraskande har skapandet av tillförlitliga prissättningsmodeller för optioner varit ett aktivt forskningsområde inom den akademiska världen.

ett av de viktigaste resultaten av denna forskning var Black-Scholes-formeln, som ger priset på ett alternativ baserat på flera ingångsparametrar, såsom priset på det underliggande beståndet, marknadens riskfria ränta, tiden fram till optionens utgångsdatum, kontraktets lösenpris och volatiliteten hos det underliggande beståndet., Innan Black-Scholes använde utövare prissättningsmodeller baserade på put-call parity eller en antagen riskpremie som liknar värderingen av investeringsprojekt. Inom företagsfinansiering är en av de mest använda modellerna för värdering av företag den diskonterade kassaflödesmodellen (DCF), som beräknar nuvärdet av ett företag som summan av dess diskonterade framtida kassaflöden. Diskonteringsräntan baseras på den upplevda risken att investera kapital i det företaget., Den revolutionerande idén bakom Black-Scholes var att det inte är nödvändigt att använda riskpremien när man värderar ett alternativ, eftersom aktiepriset redan innehåller denna information. År 1997 tilldelades Kungliga Vetenskapsakademien Nobelpriset i ekonomi till Merton och Scholes för deras banbrytande arbete. (Black delade inte priset. Han dog 1995, och Nobelpriset tilldelas inte postumt.,)

om alla optionspriser är tillgängliga på marknaden kan Black-Scholes användas för att beräkna den så kallade implicita volatiliteten baserat på optionspriser, eftersom alla andra variabler i formeln är kända. Baserat på Black-Scholes bör den underförstådda volatiliteten vara densamma för alla strejkpriser för alternativet, men i praktiken fann forskare att den underförstådda volatiliteten för alternativ inte är konstant. Istället är det skevt eller leende-formad.

forskare söker aktivt modeller som kan prissätta alternativ på ett sätt som kan reproducera den empiriskt observerade implicita volatilitetsytan., En populär lösning är Heston-modellen, där volatiliteten hos den underliggande tillgången bestäms med hjälp av en annan stokastisk process. Modellen, uppkallad efter University of Maryland matematiker Steven Heston, kan reproducera många empiriska fynd — inklusive underförstådd volatilitet-men inte alla av dem, så finansiella ingenjörer har använt olika avancerade underliggande processer för att komma med lösningar för att generera empiriska fynd., När prismodellerna utvecklades uppstod följande svårigheter:

• * den underliggande prisdynamiken blev mer komplex matematiskt och blev mer allmän — till exempel med Lévy-processer istället för Brownian-rörelser.

• prissättningen av alternativ blev mer resurskrävande. Även om Black-Scholes-modellen har en sluten formlösning för prissättning av Europeiska samtalsalternativ, använder idag människor vanligtvis mer beräkningsintensiva Monte Carlo-metoder för att prissätta dem.

• det krävs djupare teknisk kunskap för att förstå och använda prismodellerna.,

tillämpa maskininlärningsmetoder till alternativ prissättning tar upp de flesta av dessa problem. Det finns olika algoritmer som kan approximera en funktion baserad på funktionens in-och utgångar om antalet datapunkter är tillräckligt stort. Om vi ser alternativet som en funktion mellan de kontrakterade villkoren (ingångar) och premien för alternativet (produktion), kan vi helt enkelt ignorera alla finansiella frågor relaterade till alternativ eller aktiemarknader., Senare kommer vi att se hur att lägga till lite finansiell kunskap tillbaka i modellen kan bidra till att förbättra resultatens noggrannhet, men på grundnivå behövs ingen finansiell information.

en av dessa approximationstekniker använder artificiella neurala nätverk, som har ett antal användbara egenskaper., Till exempel, vissa medlemmar av artificiella neurala nätverk är universella approximators — vilket innebär att om urvalet är tillräckligt stor och den algoritm som är tillräckligt komplex, då den funktion som nätverk lärt sig kommer att vara tillräckligt nära verkligheten för alla praktiska ändamål, som visade George Cybenko (1989)2 och Kurt Hornik, Maxwell B. Stinchcombe och Halbert Vit (1989).3 artificiella neurala nätverk är lämpliga för stora databaser eftersom beräkningarna kan göras enkelt på flera datorer parallellt., En av deras mest intressanta egenskaper är dualitet i beräkningshastighet: även om träningen kan vara ganska tidskrävande, när processen är klar och approximationen av funktionen är klar är förutsägelsen extremt snabb.

neurala nätverk

det väsentliga begreppet neurala nätverk är att modellera beteendet hos den mänskliga hjärnan och skapa en matematisk formulering av den hjärnan för att extrahera information från indata., Den grundläggande enheten i ett neuralt nätverk är en perceptron, som härmar beteendet av en neuron och uppfanns av den Amerikanska psykologen Frank Rosenblatt i 1957.4 Men potentialen för neurala nätverk var inte loss förrän 1986, när David Rumelhart, Geoffrey Hinton och Ronald Williams publicerade sina inflytelserika papper på backpropagation-algoritmen, som visar på ett sätt att träna artificiella neuroner.5 Efter denna upptäckt byggdes många typer av neurala nätverk, inklusive multilayer perceptron (MLP), vilket är fokus för denna artikel.,

MLP består av lager av perceptroner, som var och en har en ingång: summan av perceptronernas utgång från föregående lager multiplicerat med deras vikter; det kan vara annorlunda för varje perceptron. Perceptronerna använder en olinjär aktiveringsfunktion (som den S-formade sigmoidfunktionen) för att omvandla ingångssignalerna till utgångssignaler och skicka dessa signaler till nästa lager. Det första skiktet (inmatningsskiktet) är unikt; perceptroner i detta lager har bara en utgång, vilket är inmatningsdata., Det sista lagret (utgångsskiktet) är unikt i den meningen att det i regressionsproblem vanligtvis består av en enda perceptron. Alla lager mellan dessa två lager kallas vanligtvis dolda lager. För en MLP med ett dolt lager är visualiseringen enligt följande i Figur 1.,

Figur 1 kan skrivas matematiskt mellan det dolda lagret och inmatningsskiktet som:

och mellan slutresultatet och det dolda lagret som:

där F1 och F2 är aktiveringsfunktioner, α Och β innehåller vikt matriser mellan lager, och ε är en felterm med 0 medelvärde.,

det första steget i beräkningen är att slumpmässigt initiera viktmatriserna; denna process kommer att användas för att omvandla inmatningsvariablerna till den prognostiserade utmatningen. Med hjälp av denna utgång kan värdet av förlustfunktionen beräknas, jämföra de verkliga och de prognostiserade resultaten med hjälp av träningsdata. Backpropagation-metoden kan användas för att beräkna modellens gradienter, som sedan kan användas för att uppdatera viktmatriserna., Efter att vikterna har uppdaterats bör förlustfunktionen ha ett mindre värde, vilket indikerar att prognosfelet på träningsdata har minskat. De tidigare stegen bör upprepas tills modellen konvergerar och prognosfelet är acceptabelt.

även om den tidigare processen kan verka komplicerad, finns det många programmeringspaket utanför hyllan som tillåter användare att koncentrera sig på problemet på hög nivå istället för implementeringsdetaljerna., Användarens ansvar är att konvertera inmatnings-och utmatningsdata till rätt form, ställa in parametrarna i det neurala nätverket och starta inlärningsfasen. Typiskt är de viktigaste parametrarna antalet neuroner i varje lager och antalet lager.

prissättningsalternativ med Flerskiktsperceptroner

som tidigare visats bygger de klassiska optionsmodellerna på en underliggande process som återger det empiriska förhållandet mellan optionsdata (strejkpris, tid till mognad, typ), underliggande data och optionens premie, vilket är observerbart på marknaden., Maskininlärningsmetoder antar inte något om den underliggande processen. de försöker uppskatta en funktion mellan inmatningsdata och premier, vilket minimerar en viss kostnadsfunktion (vanligtvis det genomsnittliga kvadratfelet mellan modellpriset och det observerade priset på marknaden) för att nå bra Out-of-sample-prestanda.

det finns en utvecklande litteratur som tillämpar andra datavetenskapliga metoder, såsom stöd vektorregression eller träd ensembler, men neurala nätverk som flerskiktsperceptroner passar i allmänhet bra för alternativ prissättning., I de flesta fall är option premium en monotonisk funktion av parametrarna, så endast ett dolt lager behövs för att leverera hög precision och modellen är svårare att övertrahera.

användning av maskininlärning för prissättningsalternativ är inte ett nytt koncept; två av de relevanta tidiga verk skapades i början av 1990-talet för att prisindexalternativ på s&p 100 och s& p 500.6,7 dessa metoder är praktiska nuförtiden tack vare tillgången på flera programpaket för neurala nätverk., Även om prissättningsalternativen blev enklare är det fortfarande något mer komplicerat än att ladda indata (optionsegenskaper, data för den underliggande tillgången) och måldata (premier) och trycka på ”enter.”Ett problem kvarstår: att utforma arkitekturen i det neurala nätverket och undvika att överfitta modellen.

de flesta maskininlärningsmetoder bygger på en iterativ process för att hitta lämpliga parametrar på ett sätt som minimerar skillnaden mellan resultaten av modellen och målet., De börjar vanligtvis genom att lära sig meningsfulla relationer, men efter ett tag minimerar de bara det provspecifika felet och minskar modellens allmänna prestanda på osynliga Out-of-sample-data. Det finns många sätt att hantera detta problem; en av de populära är tidigt stopp. Denna metod skiljer de ursprungliga utbildningsdata i utbildning och validering prover, instruera modellen endast på utbildningsdata och utvärdera det på validering provet., I början av inlärningsprocessen minskar felet i valideringsprovet synkront med felet i träningsprovet, men senare börjar utbildnings-och valideringsproverna avvika; felet minskar endast i träningsprovet och ökar i valideringsprovet. Detta fenomen signalerar överfittningen av parametrarna, och processen bör stoppas i slutet av den synkront minskande fasen.,

modeller som har fler parametrar kan överfittas lättare, så antalet perceptroner och lager bör balanseras mellan att lära sig de viktiga funktionerna och förlora viss precision på grund av överfittning. Inlärningshastigheten bestämmer hur mycket man ska ändra parametrarna i varje iteration; det är en viktig inställning och måste ställas in manuellt. Ibland bestäms dessa metaparametrar baserat på valideringsfel.att välja dem är mer konst än vetenskap., Plocka de” bästa ” parametrarna kan ge bättre resultat, men noggrannheten som uppnåtts under finjustering minskar vanligtvis, så den utbildade modellen är tillräckligt bra att använda efter bara några försök.

förbättra prestanda

de ovan nämnda metoderna kan i allmänhet användas för att förbättra neurala nätverksmodeller. I många fall kan tillägg av problemspecifik kunskap (i detta fall ekonomisk kunskap) förbättra modellens prestanda., Vid denna tidpunkt har MLP redan lärt sig en bra approximation av alternativ prissättning formel, men precisionen bestäms av provstorleken (som vanligtvis är fast) och indatavariablerna. Härifrån finns det tre sätt att ytterligare förbättra prestanda:

1. Lägg till fler indatavariabler som hjälper modellen att bättre förstå alternativ prissättning formel.

2. Öka kvaliteten på indatavariablerna genom att filtrera extremvärden.

3. Omvandla funktionen på ett sätt som är lättare att approximera.

det första tillvägagångssättet är ganska enkelt., Att införa en ny variabel i modellen ökar dess komplexitet och gör det lättare att överfitta. Som ett resultat måste varje ny variabel öka modellens prediktiva kraft för att kompensera för det ökade antalet parametrar. Och eftersom optionspriserna är beroende av den förväntade volatiliteten hos den underliggande säkerheten i framtiden, gör varje variabel som fungerar som en proxy för den historiska eller underförstådda volatiliteten vanligtvis MLP mer exakt., För att förbättra noggrannheten, Loyola University Chicago professorer Mary Malliaris och Linda Salchenberger föreslog att fördröjd priser på den underliggande säkerheten och alternativ.

den andra metoden är att öka kvaliteten på indatavariablerna. Eftersom priserna på mindre flytande alternativ vanligtvis innehåller mer buller än mer-flytande sådana, bör filtrering av dessa alternativ förbättra prissättningsmodellens noggrannhet., Men om vi skulle vilja uppskatta premien för djupt in-the-money eller out-of-the-money alternativ, kan denna rengöringsmetod eliminera en betydande del av den använda datauppsättningen. Således är det viktigt för forskare att välja filtreringskriterier som är det optimala valet mellan att släppa outliers och hålla den maximala mängden användbar information.

det tredje tillvägagångssättet — där art tar över metodik-väcker en öppen fråga:om det neurala nätverket kan approximera någon funktion, Vad ska vi förutse?, Detta är den punkt där det finns minst samförstånd bland utövare.

problemet är tydligt: vi behöver en slutlig utgång från det neurala nätverket som säger hur mycket ett alternativ med ingångsparametrarna är värt. Det betyder dock inte att det slutliga priset är det bästa målet att sikta på. Frågan är mindre relevant när vi har en stor provstorlek. När datauppsättningen är liten kan valet av det bästa sättet att mäta en funktion öka precisionen ytterligare., De vanligaste lösningarna är följande:

förutspår premien för alternativet direkt, eventuellt med hjälp av den information vi har från matematiska modeller — till exempel lägga till underförstådd volatilitet till indatavariablerna. Även om vi framgångsrikt minimerar felet för premium-funktionen betyder det inte att efter att ha omvandlat det till den slutliga förutsägelsen kommer felen fortfarande att vara det bästa möjliga för premien. Genom att förutsäga premien direkt tvingar vi det bästa resultatet.,

förutse optionens implicita volatilitet och sätt tillbaka den i Black-Scholes-formeln. Det borde göra premien läsbar. Den stora fördelen här är att den olika målvariabeln ligger i samma värdeområde även om premien för alternativet är olika i storlek. Andra Black-Scholes variabler kan användas för att försöka förutsäga optionspremier, men underförstådd volatilitet är den mest populära bland dem.8

uppskatta förhållandet mellan optionspremien och lösenpriset., Om de underliggande optionspriserna beter sig som geometriska Brownian-rörelser kan den egenskapen användas för att minska antalet ingångsparametrar. I det här fallet skulle forskaren använda förhållandet mellan det underliggande priset och strike-priset som en av ingångsparametrarna istället för att använda de underliggande Och strike-priserna separat. Denna lösning kan vara mycket användbar om storleken på datauppsättningen är liten och du är mer utsatt för överfittande problem.,

även om det finns oenighet om vilka funktionsforskare som ska försöka förutsäga, finns det en andra debatt om huruvida datauppsättningen ska delas upp i delmängder baserat på olika egenskaper. Malliaris och Salchenberger hävdar att in-the-money och Out-of-the-money alternativ bör delas upp i olika dataset. Ur praktisk synvinkel kan detta tillvägagångssätt vara användbart eftersom storleken på optionspremierna kan vara mycket olika i de två grupperna., Sovan Mitra, universitetslektor vid matematiska vetenskaper vid University of Liverpool, har hävdat att om data delas upp i alltför många delar, risken för overfitting ökar och modellens precision på out-of-sample resultat är nedsatt.9

världen har kommit en lång väg sedan Black, Scholes och Merton publicerade sin epokgörande uppsatser om alternativ prissättning 1973. Den exponentiella tillväxten i beräkningskraft och data, särskilt under det senaste decenniet, har gjort det möjligt för forskare att tillämpa maskininlärningstekniker för prisderivat med en precision som oförutsedda på 70-och 80-talet., Då drevs optionspriserna huvudsakligen av teoretiska modeller baserade på grunden för stokastisk kalkyl. I den här artikeln tillhandahåller vi en alternativ metod som använder maskininlärning, särskilt neurala nätverk, till prisalternativ med en datadriven strategi. Vi anser att detta tillvägagångssätt kan vara ett värdefullt komplement till verktygsuppsättningen av finansiella ingenjörer och kan ersätta traditionella metoder inom många tillämpningsområden.

Balazs Mezofi är en Kvantitativ Forskare vid WorldQuant, LLC, och har en MSc i Aktuariella och Finansiella Matematik från Corvinus Universitet i Budapest.,

Kristof Szabo är en Ledande Kvantitativa Forskare vid WorldQuant, LLC, och har en MSc i Aktuariella och Finansiella Matematik från Eötvös Loránd-Universitetet i Budapest.

slutnoter

1. Stephen M. Schaefer. ”Robert Merton, Myron Scholes och utvecklingen av Derivatpriser.”Scandinavian Journal of Economics 100, nr. 2 (1998): 425-445.

2. George Cybenko. ”Approximation av Superpositioner av en Sigmoidal funktion.”Matematik av kontroll, Signaler och system 2, nr 4 (1989): 303-314.

3. Kurt Hornik, Maxwell B. Stinchcombe och Halbert Vit., ”Multilayer Feedforward Networks Är Universella Approximatörer.”Neurala nätverk 2, nr 5 (1989): 359-366.

4. Frank Rosenblatt. ”Perceptron: en probabilistisk modell för informationslagring och organisation i hjärnan.”Psykologisk granskning 65, nr 6 (1958): 386-408.

6. Mary Malliaris och Linda M. Salchenberger. ”En Neural nätverks modell för att uppskatta optionspriser.”Tillämpad Intelligens 3, nr. 3 (1993): 193-206.

7. James M. Hutchinson, Andrew W. Lo och Tomaso Poggio. ”En icke-parametrisk metod för prissättning och säkring av derivatinstrument Via Inlärningsnätverk.,”Journal of Finance 49, nr. 3 (1994): 851-889.

8. Mary Malliaris och Linda Salchenberger. ”Använda neurala nätverk för att prognostisera S& p 100 implicit volatilitet.”Neurocomputing 10, nr. 2 (1996): 183-195.

9. Sovan K. Mitra. ”Ett alternativ prissättning modell som kombinerar neurala nätverk tillvägagångssätt och Black Scholes formel.”Global Journal of Computer Science och Teknik 12, nr. 4 (2012).

trodde Ledarskapsartiklar är förberedda av och tillhör WorldQuant, LLC, och görs endast tillgängliga för informations-och utbildningsändamål., Denna artikel är inte avsedd att relatera till någon specifik investeringsstrategi eller produkt, och utgör inte heller denna artikel investeringsrådgivning eller förmedlar ett erbjudande att sälja, eller uppmaning till ett erbjudande att köpa, några värdepapper eller andra finansiella produkter. Dessutom är informationen i någon artikel inte avsedd att tillhandahålla, och bör inte åberopas för, investering, redovisning, juridisk eller skatterådgivning. WorldQuant lämnar inga garantier eller utfästelser, uttryckliga eller underförstådda, om riktigheten eller lämpligheten av någon information, och du accepterar alla risker att förlita sig på sådan information., De åsikter som uttrycks häri är enbart de av WorldQuant från och med dagen för denna artikel och kan ändras utan föregående meddelande. Inga garantier kan ges att några mål, antaganden, förväntningar och / eller mål som beskrivs i denna artikel kommer att realiseras eller att de aktiviteter som beskrivs i artikeln gjorde eller kommer att fortsätta alls eller på samma sätt som de genomfördes under den period som omfattas av denna artikel. WorldQuant åtar sig inte att ge dig råd om några förändringar i de åsikter som uttrycks häri., WorldQuant och dess dotterbolag är inblandade i ett brett spektrum av värdepappershandel och investeringsverksamhet, och kan ha ett betydande finansiellt intresse i en eller flera värdepapper eller finansiella produkter som diskuteras i artiklarna.

Lämna ett svar

Din e-postadress kommer inte publiceras. Obligatoriska fält är märkta *