I 1973, Fischer-Svart, Myron Scholes og Robert Merton publisert sin nå-kjente alternativer priser formel, som ville ha en betydelig innflytelse på utviklingen av kvantitativ finans.,1 I sin modell (vanligvis kjent som Black-Scholes), verdien av en opsjon avhenger av fremtidig volatilitet på et lager heller enn på sin forventede avkastning. Deres priser formula var en teori-drevet modell basert på antagelsen om at aksjekursene følger geometriske Brownske bevegelser., Med tanke på at Chicago Board Alternativer for Exchange (CBOE) åpnet i 1973, diskett hadde blitt oppfunnet bare to år tidligere, og IBM var fortsatt åtte år borte fra å gjennomføre sin første PC (som hadde to diskettstasjoner), ved hjelp av en data-drevet tilnærming basert på virkelige liv valg prisene ville ha vært ganske komplisert på tidspunktet for Svart, Scholes og Merton. Selv om deres løsning er bemerkelsesverdig, ikke er i stand til å reprodusere noen empiriske funn., En av de største feilene i Black-Scholes er samsvar mellom modellen volatilitet i den underliggende alternativ, og det observert volatilitet fra markedet (såkalt implisitt volatilitet fra overflaten).

i Dag investorer har et valg. Vi har mer datakraft i våre mobiltelefoner enn state-of-the-art datamaskiner hadde på 1970-tallet, og tilgjengelige data er å vokse eksponentielt. Som et resultat, kan vi bruke et annet, data-drevet tilnærming for valg priser. I denne artikkelen presenterer vi en løsning for valg priser basert på en empirisk metode ved hjelp av neurale nettverk., Den største fordelen med maskinen læringsmål for eksempel nevrale nettverk, sammenlignet med modell-drevet tilnærminger, er at de er i stand til å gjengi det meste av det empiriske kjennetegn ved valg priser.

Introduksjon til Valg Priser

Med finansielle derivater som er kjent som valg, kjøperen betaler en pris for selger til å kjøpe en rett til å kjøpe eller selge et finansielt instrument på en bestemt pris på et bestemt tidspunkt i fremtiden. Alternativer kan være nyttige verktøy for mange finansielle applikasjoner, inkludert risikostyring, handel og avlønning., Ikke overraskende, er å lage pålitelige priser modeller for valg har vært en aktiv forskning-området i akademia.

En av de viktigste resultatene av denne forskningen ble Black-Scholes formelen, som gir prisen på et alternativ basert på flere parametere, som for eksempel prisen på den underliggende aksjen, markedet er risikofri rente, tiden frem til valget utløpsdato utøvelseskurs kontrakt og volatilitet i den underliggende aksjen., Før Black-Scholes, utøvere brukt prismodeller basert på put-call paritet eller en antatt risiko premium lik verdsettelse av investeringsprosjekter. I corporate finance, en av de mest brukte modellene for verdsettelse av selskaper som er diskontert kontantstrøm modell (DCF), som beregner nåverdien av et selskap som summen av neddiskonterte fremtidige kontantstrømmer. Diskonteringsrenten er basert på det som oppfattes som risiko for å investere kapital i selskapet., Den revolusjonerende ideen bak Black-Scholes var at det er ikke nødvendig å bruke risikopremien når verdsetter et alternativ, som lager pris allerede inneholder denne informasjonen. I 1997, det Kongelige svenske vitenskapsakademiet tildelt Nobels Fredspris i økonomisk vitenskap til Merton og Scholes for deres banebrytende arbeid. (Sort / ikke andel i premien. Han døde i 1995, og nobelpriser er ikke tildelt posthumt.,)

Hvis alle priser er tilgjengelig i markedet, Black-Scholes kan brukes til å beregne den såkalte implisitt volatilitet valget basert på prisene, som alle de andre variablene i formelen er kjent. Basert på Black-Scholes, det implisitt volatilitet bør være den samme for alle innløsningskurser av opsjonen, men i praksis har forskere funnet at implisitt volatilitet for opsjoner er ikke konstant. I stedet, det er skjev eller smil-formet.

Forskere søker aktivt etter modeller som er i stand til pris valg på en måte som kan reprodusere de empirisk observerte implisitte volatiliteten overflaten., En populær løsning er Heston modell, der volatilitet i den underliggende aktiva bestemmes ved å bruke en annen stokastisk prosess. Modellen, som er oppkalt etter University of Maryland matematiker Steven Heston, er i stand til å reprodusere mange empiriske funn — inkludert implisitt volatilitet — men ikke alle av dem, så finansielle ingeniører har brukt ulike avanserte underliggende prosesser for å komme opp med løsninger for å generere empiriske funn., Som prismodeller utviklet seg, følgende problemer oppsto:

• Den underliggende pris dynamics fikk mer komplekse matematiske og ble mer generelt, for eksempel ved hjelp av Lévy-prosesser i stedet for Brownske bevegelser.

• prising av opsjoner ble mer ressurskrevende. Selv om Black-Scholes-modellen har en lukket form løsning for prising Europeiske kjøpsopsjoner, i dag mennesker bruker vanligvis mer i beregninger intensiv Monte Carlo-metoder til å prise dem.

• Det tar dypere teknisk kunnskap til å forstå og bruke prismodeller.,

Søker maskinen lære metoder til valg priser adresser de fleste av disse problemene. Det er forskjellige algoritmer som er i stand til å anslå en funksjon basert på funksjonen er innganger og utganger hvis antall datapunkter er tilstrekkelig stor. Hvis vi ser på denne muligheten som en funksjon mellom den avtalte vilkår (innganger) og premium-alternativet (output), kan vi bare ignorere alle finansielle spørsmål knyttet til valg eller lager markeder., Senere vil vi se på hvordan du legger til noen økonomisk kunnskap tilbake i modellen kan bidra til å forbedre nøyaktigheten av resultatene, men på grunnleggende nivå ingen finans-relaterte informasjon er nødvendig.

En av disse tilnærming teknikker bruker kunstig nevrale nettverk, som har en rekke nyttige egenskaper., For eksempel, noen medlemmer av kunstige nevrale nettverk er universelle approximators — noe som betyr at hvis utvalget er stort nok, og algoritmen er komplisert nok, så den funksjonen at nettverket har lært, vil du være nær nok til ekte en for alle praktiske formål, som viste av George Cybenko (1989)2 og Kurt Hornik, Maxwell B. Stinchcombe og Halbert White (1989).3 Kunstige nevrale nettverk er egnet for store databaser fordi beregningene kan gjøres enkelt på flere datamaskiner samtidig., En av deres mest interessante egenskaper er dualiteten i beregningen hastighet: Selv om trening kan være ganske tidkrevende, når prosessen er ferdig og tilnærming av funksjonen er klar, prediksjon er ekstremt rask.

Nevrale Nettverk

De grunnleggende konseptet av nevrale nettverk er å modellere oppførselen av den menneskelige hjerne og lage en matematisk formulering av at hjernen til å trekke ut informasjon fra input-data., Den grunnleggende enhet av en nevrale nettverk er et perceptron, som mimics virkemåten til et nevron, og ble oppfunnet av Amerikanske psykologen Frank Rosenblatt i 1957.4 Men potensialet av nevrale nettverk ble ikke sluppet løs før 1986, da David Rumelhart, Geoffrey Hinton og Ronald Williams publisert sin innflytelsesrike papir på backpropagation algoritmen, som viste en måte å trene kunstig nevroner.5 Etter denne oppdagelsen, mange typer nevrale nettverk ble bygget, inkludert flerlags perceptron (MLP), som er fokus for denne artikkelen.,

MLP er bygd opp av lag av perceptrons, som hver har en inngang: summen av output av perceptrons fra tidligere laget multiplisert med sine vekter; det kan være forskjellig for hver enkelt perceptron. Den perceptrons bruker en ikke-lineær aktivering av funksjon (som den S-formede sigmoid-funksjon) for å forvandle input signaler inn-og utgangssignaler og sende disse signalene inn i det neste laget. Den første layer (input lag) er unik; perceptrons i dette laget har bare en utgang, som er input data., Det siste laget (output layer) er unik i den forstand at i regresjon problemer den består vanligvis av et enkelt perceptron. Alle lag mellom disse to lagene er vanligvis kalt skjulte lag. For et MLP med ett skjult lag, visualisering er som følger i Figur 1.,

Figur 1 kan skrives matematisk mellom det skjulte laget og input lag som:

og mellom sluttresultatet og det skjulte laget som:

hvor f1 og f2 er aktivering av funksjoner, α og β inneholde vekt matriser mellom lagene, og ε er et feil begrep med 0 mener.,

første trinn i beregningen er tilfeldig initialisere vekt matriser; denne prosessen vil bli brukt til å forvandle input-variablene til forventet effekt. Ved hjelp av denne utgang, verdien av tap av funksjon kan beregnes, sammenligne den virkelige og antatte resultater ved hjelp av treningsdata. Den backpropagation metoden kan brukes til å beregne graderinger av modellen, som deretter kan brukes til å oppdatere vekt matriser., Etter at den vekter har blitt oppdatert, tap funksjonen bør ha en mindre verdi, noe som indikerer at prognoser feil på trening data har blitt redusert. De forrige trinnene bør gjentas til modellen konvergerer og prognoser feil som er akseptabelt.

Selv om den forrige prosessen kan virke komplisert, det er mange off-the-sokkel programmering pakker som tillater brukere å konsentrere seg på det høye nivået av problemet i stedet for gjennomføringen detaljer., Brukerens ansvar å konvertere input og output data til riktig skjema, angi parametrene av det nevrale nettverket og starte læringsfasen. Vanligvis er de viktigste parametrene er antall nevroner i hvert lag og antall lag.

prisalternativer med Flerlags Perceptrons

Som vist tidligere, den klassiske valg prismodeller er bygget på en underliggende prosessen som gjengir den empiriske sammenhengen mellom alternativ data (streik pris, tid til forfall, type), underliggende data og toppkvalitets av alternativet, som er observerbare i markedet., Maskinlæring metoder ikke anta noe om den underliggende prosessen; de forsøker å anslå en funksjon mellom input data og overkurs, minimere en gitt kostnad funksjon (vanligvis mean squared error mellom modell pris og den observerte prisen på markedet) for å nå god out-of-sample ytelse.

Det er en utvikling litteratur som søker andre data science metoder, for eksempel støtte vektor regresjon eller tre ensembler, men nevrale nettverk som flerlags perceptrons generelt passer godt for valg priser., I de fleste tilfeller, alternativ premium er en monotonic funksjon av parametrene, slik at bare ett skjult lag er nødvendig for å levere høy presisjon og modellen er vanskeligere å overtrain.

ved Hjelp av maskinlæring for prisalternativer er ikke et nytt konsept; to av de relevante tidlige verk ble opprettet tidlig på 1990-tallet til pris stikkordregister alternativer på S&P 100 og S&P 500.6,7 Disse metodene er praktisk i dag takket være tilgjengeligheten av flere programvarepakker for nevrale nettverk., Selv om prisalternativer ble lettere, det er fortsatt litt mer komplisert enn å legge input data (valg egenskaper, data på den underliggende aktiva) og mål data (premie) og trykke «enter.»Ett problem gjenstår: å designe arkitektur av nevrale nettverk og unngå overfitting modellen.

de Fleste maskinlæring metodene er basert på en iterativ prosess for å finne de riktige parametrene på en måte som minimerer forskjellen mellom resultatene i modellen og mål., De starter som regel ved å lære meningsfulle relasjoner, men etter en stund de er å minimere bare prøve-spesifikke feil og redusere den generelle ytelsen av modellen på usynlige out-of-sample data. Det er mange måter å håndtere dette problemet; en av de populære er for tidlig å stoppe. Denne metoden skiller den opprinnelige treningsdata til trening og validering av prøvene, instruere modellen bare på trening data og evaluere den på validering eksempel., I begynnelsen av læringsprosessen, feil i validering eksempel reduserer synkront med feil på trening eksempel, men senere trening og validering av prøvene begynner å divergere; feil minsker bare i trening eksempel og øker i validering eksempel. Dette fenomenet signaler overfitting av parametrene, og prosessen bør stoppes på slutten av synkront redusere fase.,

– Modeller som har flere parametere kan være overfitted lettere, så antallet av perceptrons og lag bør være balansert mellom å lære viktige funksjoner og miste litt presisjon på grunn av overfitting. Læring pris bestemmer hvor mye du ønsker å endre parametre i hver iterasjon; det er en viktig arena, og må stilles inn manuelt. Noen ganger er disse metaparameters blir avgjort basert på validering feil, ved å velge dem er mer kunst enn vitenskap., Å plukke de «beste» parametere kan gi bedre resultater, men nøyaktigheten fikk i løpet av fin-tuning vanligvis avtar, så trente modellen er god nok til bruk etter bare et par forsøk.

Forbedre Ytelsen

metodene nevnt ovenfor kan bli generelt brukes til å forbedre nevrale nettverksmodeller. I mange tilfeller, å legge til problemet-spesifikk kunnskap (i dette tilfellet, finans-kunnskap) kan forbedre ytelsen av modellen., På dette punktet, MLP har allerede lært en god tilnærming av alternativene priser formula, men presisjonen er bestemt av utvalgsstørrelse (som er vanligvis fast) og input variabler. Fra her, det er tre måter å ytterligere forbedre ytelse:

1. Legg til mer input variabler som bidrar modellen til å forstå bedre valg priser formel.

2. Øke kvaliteten på input-variabler ved filtrering uteliggere.

3. Forvandle den fungerer på en måte at det er lettere å omtrentlig.

Den første tilnærmingen er ganske grei., Å innføre en ny variabel i modellen øker sin kompleksitet og gjør det lettere å overfit. Som et resultat, hver nye variabelen har for å øke prediktiv kraft av modellen for å kompensere for økt antall parametere. Og fordi alternativet prisene er avhengig av forventet volatilitet i den underliggende sikkerhet i fremtiden, en variabel som fungerer som en proxy for den historisk eller implisitt volatilitet vanligvis gjør MLP mer presis., For å forbedre nøyaktigheten, Loyola University Chicago professorer Mary Malliaris og Linda Salchenberger foreslått å legge forsinket priser på underliggende sikkerhet og mulighet.

Den andre metoden er å øke kvaliteten på input-variabler. Fordi prisene på mindre likvide valg vanligvis inneholder mer støy enn å gjøre mer flytende seg, filtrere ut disse alternativene bør forbedre nøyaktigheten av prismodell., Men hvis vi ønsker å beregne premie for dyp-in-the-money eller out-of-the-money opsjoner, dette rengjøring metoden kan eliminere en stor del av datasettet som er brukt. Dermed er det viktig for forskerne å velge filtrering kriterier som er det optimale valget mellom å slippe uteliggere og holde den maksimale mengden av nyttig informasjon.

Den tredje tilnærming — der kunst tar over metodikk — reiser et åpent spørsmål: Hvis nevrale nettverk kan omtrentlige noen funksjon, så hva skal vi prognose?, Dette er det punktet der det er minst mulig konsensus blant utøvere.

problemet er klar: Vi trenger endelige resultatet fra nevrale nettverk som sier hvor mye et alternativ med input parametere er verdt. Som, imidlertid, betyr ikke det at den endelige prisen er det beste målet for å sikte. Spørsmålet er mindre relevant når vi har et stort utvalg størrelse. Når datasettet er små, velge den beste måten å måle en funksjon som kan øke presisjonen videre., De hyppigst valgte løsningene er følgende:

Forutsi premium av opsjonen direkte, eventuelt ved hjelp av den informasjonen vi har fra matematiske modeller — for eksempel, legger implisitt volatilitet til input-variabler. Selv om vi lykkes minimere feil for funksjonen av premium, det betyr ikke at etter transformere det til den endelige prediksjon feil vil fortsatt være den beste oppnåelig for premium. Ved å forutsi premium direkte, vi tvinger det beste resultatet.,

Forutsi implisitt volatilitet av alternativet, og sett den tilbake i Black-Scholes formel. Det burde gjøre premium lesbar. Den store fordelen her er at de ulike målgrupper variabel er i samme rekke verdier selv om premium-for alternativet er forskjellige i størrelse. Andre Black-Scholes variabler kan brukes til å prøve å forutsi valg premie, men implisitt volatilitet er den mest populære blant dem.8

Estimere forholdet mellom alternativ premium og innløsningskurs., Hvis den underliggende valg priser oppføre seg som en geometrisk Brownske bevegelser, som eiendommen kan brukes til å redusere antall parametere. I dette tilfellet, forsker ville bruke forholdet mellom den underliggende pris-og innløsningskurs som en av input parametere i stedet for å bruke den underliggende og innløsningskurser separat. Denne løsningen kan være veldig nyttig hvis størrelsen på datasettet er liten, og du er mer utsatt for å overfitting problemer.,

Mens det er uenighet om hvilken funksjon forskere bør du prøve å forutsi, det er en annen debatt om datasettet skal være delt inn i undergrupper basert på ulike kvaliteter. Malliaris og Salchenberger hevde at in-the-money-og out-of-the-money opsjoner bør deles inn i forskjellige datasett. Fra et praktisk synspunkt, er denne tilnærmingen kan være nyttig fordi omfanget av alternativ premie kan være svært forskjellige i de to gruppene., Sovan Mitra, en førstelektor i matematiske fag ved Universitetet i Liverpool, hevder at hvis dataene er delt inn i altfor mange deler, sjansen for overfitting øker og modellens presisjon på out-of-sample resultater er redusert.9

verden har kommet en lang vei siden Svart, Scholes og Merton publisert sin banebrytende papers på valg priser i 1973. Den eksponentielle veksten i datakraft og data, spesielt i løpet av de siste tiår, har gjort det mulig for forskere å søke maskinen lære teknikker for å pris derivater med en presisjon uforutsette i ’70-og ’80-tallet., Tilbake da, valg priser var hovedsakelig drevet av teoretiske modeller basert på grunnlaget for stokastisk analyse. I denne artikkelen gir vi en alternativ metode som bruker maskinen læring, spesielt nevrale nettverk, til pris valg med en data-drevet tilnærming. Vi mener at denne tilnærmingen kan være et verdifullt tillegg til verktøysett for finansielle ingeniører, og kan erstatte tradisjonelle metoder i mange bruksområder.

Balazs Mezofi er en Kvantitativ Forsker ved WorldQuant, LLC, og har en MSc i de Aktuarmessige og Finansielle Matematikk fra Corvinus-Universitetet i Budapest.,

Kristof Szabo er en Ledende Kvantitative Forsker ved WorldQuant, LLC, og har en MSc i de Aktuarmessige og Finansielle Matematikk fra Eötvös Loránd University i Budapest.

REFERANSER

1. Stephen M. Schaefer. «Robert Merton, Myron Scholes og Utvikling av Derivater Priser.»Scandinavian Journal of Economics 100, nr. 2 (1998): 425-445.

2. George Cybenko. «Tilnærming av Superpositions av en Sigmoidal Funksjon.»Matematikk av Kontroll, Signaler og Systemer 2, nr. 4 (1989): 303-314.

3. Kurt Hornik, Maxwell B. Stinchcombe og Halbert Hvit., «Flerlags Feedforward-Nettverk Er Universelle Approximators.»Nevrale Nettverk 2, nr. 5 (1989): 359-366.

4. Frank Rosenblatt. «Det Perceptron: En Probabilistisk Modell for Lagring av Informasjon og Organisering i Hjernen.»Psychological Review 65, nr. 6 (1958): 386-408.

6. Mary Malliaris og Linda M. Salchenberger. «En Nevrale Nettverk Modell for Estimering Alternativ Priser.»Anvendt Intelligens 3, nr. 3 (1993): 193-206.

7. James M. Hutchinson, Andrew W. Lo og Tomaso Poggio. «En Nonparametric Tilnærming til Prising og Sikring Derivater Verdipapirer Via Læring Nettverk.,»Journal of Finance 49, nr. 3 (1994): 851-889.

8. Mary Malliaris og Linda Salchenberger. «Ved hjelp av Nevrale Nettverk til å Forutsi S&P 100 Implisitt Volatilitet.»Neurocomputing 10, nr. 2 (1996): 183-195.

9. Sovan K. Mitra. «En opsjonsprisingsmodell Som Kombinerer Nevrale Nettverk Tilnærming og Black Scholes Formel.»Global Journal of Computer Science and Technology 12, nr. 4 (2012).

Trodde Lederskap artiklene er utarbeidet av og varemerke holderen for WorldQuant, LLC, og blir gjort tilgjengelig for informative og pedagogiske formål bare., Denne artikkelen er ikke ment å forholde seg til noen bestemt investeringsstrategi eller produkt, og heller ikke denne artikkelen utgjør investeringsråd eller formidle et tilbud om å selge, eller en oppfordring til et tilbud om å kjøpe, verdipapirer eller andre finansielle produkter. I tillegg er informasjonen i en artikkel er ikke ment å gi, og burde ikke være lettelse opp på for -, investerings -, regnskap, juridisk eller skattemessig rådgivning. WorldQuant gir ingen garantier eller erklæringer, uttrykkelige eller underforståtte, med hensyn til nøyaktigheten eller tilstrekkeligheten av informasjon, og du godta all risiko i å stole på slik informasjon., Synspunktene som kommer til uttrykk her, er utelukkende av WorldQuant som på datoen for denne artikkelen og er gjenstand for endring uten varsel. Ingen garantier kan gis som alle har som mål, forutsetninger, forventninger og/eller mål som er beskrevet i denne artikkelen vil bli realisert, eller at de aktivitetene som er beskrevet i artikkelen gjorde eller vil fortsette, eller på samme måte som de ble utført i løpet av den perioden som dekkes av denne artikkelen. WorldQuant ikke forplikter seg til å informere deg om eventuelle endringer i synspunktene som er uttrykt her., WorldQuant og dets tilknyttede selskaper er involvert i et bredt spekter av verdipapirer, handel og investeringer, og kan ha en betydelig økonomisk interesse i ett eller flere verdipapirer eller finansielle produkter som omtales i artiklene.

Legg igjen en kommentar

Din e-postadresse vil ikke bli publisert. Obligatoriske felt er merket med *