Nel 1973, Fischer Black, Myron Scholes e Robert Merton pubblicarono la loro ormai nota formula di pricing delle opzioni, che avrebbe avuto un’influenza significativa sullo sviluppo della finanza quantitativa.,1 Nel loro modello (tipicamente noto come Black-Scholes), il valore di un’opzione dipende dalla volatilità futura di un titolo piuttosto che dal suo rendimento atteso. La loro formula dei prezzi era un modello basato sulla teoria basato sul presupposto che i prezzi delle azioni seguano il movimento geometrico browniano., Considerando che il Chicago Board Options Exchange (CBOE), inaugurato nel 1973, il dischetto era stato inventato solo due anni prima e IBM era ancora otto anni di distanza dall’introduzione del suo primo PC (che aveva due floppy disk), utilizzando un approccio basato sui dati basato sulla vita reale delle opzioni di prezzi sarebbe stato abbastanza complicato, al momento di Black, Scholes e Merton. Sebbene la loro soluzione sia notevole, non è in grado di riprodurre alcuni risultati empirici., Uno dei maggiori difetti di Black-Scholes è la mancata corrispondenza tra la volatilità del modello dell’opzione sottostante e la volatilità osservata dal mercato (la cosiddetta superficie di volatilità implicita).
Oggi gli investitori hanno una scelta. Abbiamo più potenza computazionale nei nostri telefoni cellulari di computer state-of-the-art avevano nel 1970, e i dati disponibili è in crescita esponenziale. Di conseguenza, possiamo utilizzare un approccio diverso e basato sui dati per i prezzi delle opzioni. In questo articolo, presentiamo una soluzione per i prezzi delle opzioni basata su un metodo empirico che utilizza le reti neurali., Il vantaggio principale dei metodi di apprendimento automatico come le reti neurali, rispetto agli approcci model-driven, è che sono in grado di riprodurre la maggior parte delle caratteristiche empiriche dei prezzi delle opzioni.
Introduzione ai prezzi delle opzioni
Con i derivati finanziari noti come opzioni, l’acquirente paga un prezzo al venditore per acquistare un diritto di acquistare o vendere uno strumento finanziario ad un prezzo specificato in un determinato punto in futuro. Le opzioni possono essere strumenti utili per molte applicazioni finanziarie, tra cui la gestione del rischio, il trading e la compensazione della gestione., Non sorprende che la creazione di modelli di prezzo affidabili per le opzioni sia stata un’area di ricerca attiva nel mondo accademico.
Uno dei risultati più importanti di questa ricerca è stata la formula Black-Scholes, che fornisce il prezzo di un’opzione in base a più parametri di input, come il prezzo del titolo sottostante, il tasso di interesse privo di rischio del mercato, il tempo fino alla data di scadenza dell’opzione, il prezzo di esercizio del contratto e la volatilità del titolo sottostante., Prima di Black-Scholes, i professionisti utilizzavano modelli di pricing basati sulla parità put-call o su un premio di rischio presunto simile alla valutazione dei progetti di investimento. Nella finanza aziendale, uno dei modelli più frequentemente utilizzati per la valutazione delle società è il discounted cash flow model (DCF), che calcola il valore attuale di una società come somma dei suoi flussi di cassa futuri scontati. Il tasso di sconto si basa sul rischio percepito di investire capitale in tale società., L’idea rivoluzionaria alla base di Black-Scholes era che non è necessario utilizzare il premio di rischio quando si valuta un’opzione, poiché il prezzo delle azioni contiene già queste informazioni. Nel 1997, l’Accademia Reale svedese delle Scienze ha assegnato il Premio Nobel per le scienze economiche a Merton e Scholes per il loro lavoro innovativo. (Il nero non ha condiviso il premio. È morto nel 1995 e i premi Nobel non vengono assegnati postumi.,)
Se tutti i prezzi delle opzioni sono disponibili sul mercato, Black-Scholes può essere utilizzato per calcolare la cosiddetta volatilità implicita basata sui prezzi delle opzioni, poiché tutte le altre variabili della formula sono note. Sulla base di Black-Scholes, la volatilità implicita dovrebbe essere la stessa per tutti i prezzi di esercizio dell’opzione, ma in pratica i ricercatori hanno scoperto che la volatilità implicita per le opzioni non è costante. Invece, è distorta o a forma di sorriso.
I ricercatori sono attivamente alla ricerca di modelli in grado di valutare le opzioni in modo da riprodurre la superficie di volatilità implicita osservata empiricamente., Una soluzione popolare è il modello Heston, in cui la volatilità dell’attività sottostante viene determinata utilizzando un altro processo stocastico. Il modello, dal nome del matematico dell’Università del Maryland Steven Heston, è in grado di riprodurre molti risultati empirici, inclusa la volatilità implicita, ma non tutti, quindi gli ingegneri finanziari hanno utilizzato diversi processi sottostanti avanzati per trovare soluzioni per generare risultati empirici., Man mano che i modelli di prezzo si evolvevano, sorsero le seguenti difficoltà:
• La dinamica dei prezzi sottostante divenne matematicamente più complessa e divenne più generale — ad esempio, usando i processi di Lévy invece dei moti browniani.
• Il prezzo delle opzioni è diventato più intensivo di risorse. Sebbene il modello Black-Scholes abbia una soluzione in forma chiusa per valutare le opzioni call europee, oggi le persone usano solitamente metodi Monte Carlo più computazionalmente intensivi per valutarle.
• Occorrono conoscenze tecniche più approfondite per comprendere e utilizzare i modelli di prezzo.,
L’applicazione di metodi di apprendimento automatico ai prezzi delle opzioni risolve la maggior parte di questi problemi. Esistono diversi algoritmi che sono in grado di approssimare una funzione in base agli input e agli output della funzione se il numero di punti dati è sufficientemente grande. Se vediamo l’opzione come una funzione tra i termini contrattuali (input) e il premio dell’opzione (output), possiamo semplicemente ignorare tutte le questioni finanziarie relative alle opzioni o ai mercati azionari., Più tardi vedremo come l’aggiunta di alcune conoscenze finanziarie nel modello può aiutare a migliorare l’accuratezza dei risultati, ma a livello di base non sono necessarie informazioni relative alla finanza.
Una di queste tecniche di approssimazione utilizza reti neurali artificiali, che hanno una serie di proprietà utili., Per esempio, alcuni membri delle reti neurali artificiali sono universali approximators — il che significa che, se il campione è abbastanza grande e l’algoritmo è abbastanza complesso, quindi, la funzione che la rete imparato sarà abbastanza vicino a quello reale per qualsiasi scopo pratico, come mostrato da George Cybenko (1989)2 e Kurt Hornik, Maxwell B. Stinchcombe e Halbert Bianco (1989).3 Le reti neurali artificiali sono adatte per database di grandi dimensioni perché i calcoli possono essere eseguiti facilmente su più computer in parallelo., Una delle loro proprietà più interessanti è la dualità nella velocità di calcolo: sebbene l’allenamento possa richiedere molto tempo, una volta che il processo è terminato e l’approssimazione della funzione è pronta, la previsione è estremamente veloce.
Reti neurali
Il concetto essenziale di reti neurali è quello di modellare il comportamento del cervello umano e creare una formulazione matematica di quel cervello per estrarre informazioni dai dati di input., L’unità di base di una rete neurale è un perceptron, che imita il comportamento di un neurone ed è stato inventato dallo psicologo americano Frank Rosenblatt nel 1957.4 Ma il potenziale delle reti neurali non è stato scatenato fino al 1986, quando David Rumelhart, Geoffrey Hinton e Ronald Williams hanno pubblicato il loro documento influente sull’algoritmo backpropagation, che ha5 Dopo questa scoperta, sono stati costruiti molti tipi di reti neurali, tra cui il perceptron multistrato (MLP), che è al centro di questo articolo.,
L’MLP è costituito da strati di percettroni, ognuno dei quali ha un input: la somma dell’output dei percettroni dal livello precedente moltiplicato per i loro pesi; può essere diverso per ogni percettrone. I percettori utilizzano una funzione di attivazione non lineare (come la funzione sigmoide a forma di S) per trasformare i segnali di ingresso in segnali di uscita e inviare questi segnali nel livello successivo. Il primo livello (il livello di input) è unico; i percettori in questo livello hanno solo un output, che è i dati di input., L’ultimo livello (il livello di output) è unico nel senso che nei problemi di regressione di solito consiste in un singolo perceptron. Tutti i livelli tra questi due livelli sono solitamente chiamati livelli nascosti. Per un MLP con un livello nascosto, la visualizzazione è la seguente in Figura 1.,
Figura 1 può essere scritto matematicamente tra il livello nascosto e il livello di input come:
e tra l’output finale e il livello nascosto come:
dove f1 e f2 sono funzioni di attivazione, α e β contengono matrici di pesi tra gli strati, e ε è un termine di errore con 0 media.,
Il primo passo del calcolo consiste nell’inizializzare casualmente le matrici di peso; questo processo verrà utilizzato per trasformare le variabili di input nell’output previsto. Utilizzando questo output, è possibile calcolare il valore della funzione di perdita, confrontando i risultati reali e quelli previsti utilizzando i dati di allenamento. Il metodo backpropagation può essere utilizzato per calcolare i gradienti del modello, che quindi può essere utilizzato per aggiornare le matrici di peso., Dopo che i pesi sono stati aggiornati, la funzione di perdita dovrebbe avere un valore inferiore, indicando che l’errore di previsione sui dati di allenamento è stato diminuito. I passaggi precedenti devono essere ripetuti fino a quando il modello non converge e l’errore di previsione è accettabile.
Anche se il processo precedente può sembrare complicato, ci sono molti pacchetti di programmazione off-the-shelf che consentono agli utenti di concentrarsi sul problema di alto livello invece dei dettagli di implementazione., La responsabilità dell’utente è quella di convertire i dati di input e output nella forma corretta, impostare i parametri della rete neurale e avviare la fase di apprendimento. In genere, i parametri più importanti sono il numero di neuroni in ogni strato e il numero di strati.
Opzioni di Pricing con percettori multistrato
Come mostrato in precedenza, i modelli di pricing delle opzioni classiche sono costruiti su un processo sottostante che riproduce la relazione empirica tra i dati delle opzioni (strike price, time to maturity, type), i dati sottostanti e il premio dell’opzione, osservabile sul mercato., I metodi di apprendimento automatico non assumono nulla sul processo sottostante; stanno cercando di stimare una funzione tra i dati di input e i premi, riducendo al minimo una determinata funzione di costo (di solito l’errore medio quadrato tra il prezzo del modello e il prezzo osservato sul mercato) per raggiungere buone prestazioni fuori campione.
Esiste una letteratura in evoluzione che applica altri metodi di scienza dei dati, come la regressione vettoriale di supporto o gli insiemi di alberi, ma le reti neurali come i percettori multistrato generalmente si adattano bene ai prezzi delle opzioni., Nella maggior parte dei casi, l’opzione premium è una funzione monotona dei parametri, quindi è necessario un solo livello nascosto per fornire alta precisione e il modello è più difficile da sovraccaricare.
l’Utilizzo di machine learning per la determinazione del prezzo di opzioni non è un concetto nuovo; due rilevanti prime opere sono stati creati nei primi anni 1990 per l’indice dei prezzi delle opzioni sull’S&P 100 e il S&P 500.6,7 di Questi metodi sono comodi, oggi, grazie alla disponibilità di diversi pacchetti software per reti neurali., Sebbene le opzioni di prezzo siano diventate più semplici, è ancora leggermente più complicato caricare i dati di input (caratteristiche delle opzioni, dati dell’attività sottostante) e i dati di destinazione (premi) e premere “invio.”Rimane un problema: progettare l’architettura della rete neurale ed evitare di sovraccaricare il modello.
La maggior parte dei metodi di apprendimento automatico si basa su un processo iterativo per trovare i parametri appropriati in modo da ridurre al minimo la differenza tra i risultati del modello e il target., Di solito iniziano imparando relazioni significative, ma dopo un po ‘ riducono al minimo solo l’errore specifico del campione e riducono le prestazioni generali del modello su dati fuori campione non visti. Ci sono molti modi per gestire questo problema; uno di quelli popolari è l’arresto precoce. Questo metodo separa i dati di allenamento originali in campioni di allenamento e validazione, istruendo il modello solo sui dati di allenamento e valutandolo sul campione di validazione., All’inizio del processo di apprendimento, l’errore del campione di validazione diminuisce in modo sincrono con l’errore del campione di allenamento, ma in seguito i campioni di allenamento e validazione iniziano a divergere; l’errore diminuisce solo nel campione di allenamento e aumenta nel campione di validazione. Questo fenomeno segnala l’overfitting dei parametri e il processo deve essere interrotto alla fine della fase di diminuzione sincrona.,
I modelli che hanno più parametri possono essere sovralimentati più facilmente, quindi il numero dei percettori e dei livelli dovrebbe essere bilanciato tra l’apprendimento delle caratteristiche importanti e la perdita di precisione a causa del sovralimentazione. Il tasso di apprendimento determina quanto modificare i parametri in ogni iterazione; è un’impostazione importante e deve essere impostata manualmente. A volte questi metaparametri sono decisi in base a errori di convalida; sceglierli è più arte che scienza., Scegliere i parametri “migliori” può produrre risultati migliori, ma la precisione acquisita durante la messa a punto di solito diminuisce, quindi il modello addestrato è abbastanza buono da usare dopo poche prove.
Miglioramento delle prestazioni
I metodi sopra menzionati possono essere generalmente utilizzati per migliorare i modelli di rete neurale. In molti casi, l’aggiunta di conoscenze specifiche del problema (in questo caso, conoscenze finanziarie) può migliorare le prestazioni del modello., A questo punto, l’MLP ha già imparato una buona approssimazione della formula dei prezzi delle opzioni, ma la precisione è determinata dalla dimensione del campione (che di solito è fissa) e dalle variabili di input. Da qui, ci sono tre modi per migliorare ulteriormente le prestazioni:
1. Aggiungi altre variabili di input che aiutano il modello a comprendere meglio la formula dei prezzi delle opzioni.
2. Aumentare la qualità delle variabili di input filtrando valori anomali.
3. Trasforma la funzione in un modo che è più facile da approssimare.
Il primo approccio è abbastanza semplice., L’introduzione di una nuova variabile nel modello aumenta la sua complessità e rende più facile l’overfit. Di conseguenza, ogni nuova variabile deve aumentare la potenza predittiva del modello per compensare l’aumento del numero di parametri. E poiché i prezzi delle opzioni dipendono dalla volatilità attesa del titolo sottostante in futuro, qualsiasi variabile che funge da proxy per la volatilità storica o implicita di solito rende il MLP più preciso., Per migliorare l’accuratezza, i professori della Loyola University di Chicago Mary Malliaris e Linda Salchenberger hanno suggerito di aggiungere i prezzi ritardati del titolo sottostante e dell’opzione.
Il secondo metodo consiste nell’aumentare la qualità delle variabili di input. Poiché i prezzi delle opzioni meno liquide in genere contengono più rumore di quelli più liquidi, filtrare tali opzioni dovrebbe migliorare l’accuratezza del modello di prezzo., Ma se vogliamo stimare il premio per le opzioni deep-in-the-money o out-of-the-money, questo metodo di pulizia potrebbe eliminare una parte significativa del set di dati utilizzato. Pertanto, è importante che i ricercatori scelgano criteri di filtraggio che siano la scelta ottimale tra l’abbandono dei valori anomali e il mantenimento della quantità massima di informazioni utili.
Il terzo approccio — dove l’arte prende il sopravvento sulla metodologia — solleva una domanda aperta: se la rete neurale può approssimare qualsiasi funzione, allora cosa dovremmo prevedere?, Questo è il punto in cui c’è la minor quantità di consenso tra i professionisti.
Il problema è chiaro: abbiamo bisogno di un output finale dalla rete neurale che dica quanto vale un’opzione con i parametri di input. Ciò, tuttavia, non significa che il prezzo finale sia il miglior obiettivo a cui mirare. La domanda è meno rilevante quando abbiamo una grande dimensione del campione. Quando il set di dati è piccolo, la scelta del modo migliore per misurare una funzione può aumentare ulteriormente la precisione., Le soluzioni scelte più frequentemente sono le seguenti:
Prevedere direttamente il premio dell’opzione, potenzialmente utilizzando le informazioni che abbiamo dai modelli matematici, ad esempio aggiungendo volatilità implicita alle variabili di input. Anche se minimizziamo con successo l’errore per la funzione del premio, ciò non significa che dopo averlo trasformato nella previsione finale gli errori saranno comunque i migliori realizzabili per il premio. Prevedendo direttamente il premio, stiamo forzando il miglior risultato.,
Prevedere la volatilità implicita dell’opzione e rimetterla nella formula di Black-Scholes. Questo dovrebbe rendere il premio leggibile. Il grande vantaggio qui è che la variabile target diversa si trova nello stesso intervallo di valori anche se il premio dell’opzione è diverso in grandezza. Altre variabili Black-Scholes possono essere utilizzati per cercare di prevedere i premi opzioni, ma la volatilità implicita è il più popolare tra di loro.8
Stimare il rapporto tra il premio dell’opzione e il prezzo di esercizio., Se i prezzi delle opzioni sottostanti si comportano come moti browniani geometrici, tale proprietà può essere utilizzata per ridurre il numero di parametri di input. In questo caso, il ricercatore utilizzerebbe il rapporto tra il prezzo sottostante e il prezzo di esercizio come uno dei parametri di input invece di utilizzare separatamente il sottostante e i prezzi di esercizio. Questa soluzione può essere molto utile se la dimensione del set di dati è piccola e si è più esposti a problemi di overfitting.,
Mentre c’è disaccordo su quale funzione i ricercatori dovrebbero cercare di prevedere, c’è un secondo dibattito sul fatto che il set di dati debba essere suddiviso in sottoinsiemi basati su varie qualità. Malliaris e Salchenberger sostengono che le opzioni in-the-money e out-of-the-money dovrebbero essere suddivise in diversi set di dati. Da un punto di vista pratico, questo approccio può essere utile perché l’entità dei premi di opzione può essere molto diversa nei due gruppi., Sovan Mitra, un docente senior in scienze matematiche presso l’Università di Liverpool, sostiene che se i dati sono divisi in troppe parti, la possibilità di overfitting aumenta e la precisione del modello sui risultati out-of-campione è ridotta.9
Il mondo ha fatto molta strada da quando Black, Scholes e Merton hanno pubblicato i loro documenti seminali sui prezzi delle opzioni nel 1973. La crescita esponenziale della potenza computazionale e dei dati, in particolare nell’ultimo decennio, ha permesso ai ricercatori di applicare tecniche di apprendimento automatico ai derivati dei prezzi con una precisione imprevista negli anni ’70 e ’80., Allora, il prezzo delle opzioni era guidato principalmente da modelli teorici basati sul fondamento del calcolo stocastico. In questo articolo, forniamo un metodo alternativo che utilizza l’apprendimento automatico, in particolare le reti neurali, per valutare le opzioni con un approccio basato sui dati. Riteniamo che questo approccio potrebbe essere una preziosa aggiunta al set di strumenti degli ingegneri finanziari e potrebbe sostituire i metodi tradizionali in molte aree di applicazione.
Balazs Mezofi è un ricercatore quantitativo presso WorldQuant, LLC, e ha un Master in Matematica attuariale e finanziaria presso l’Università Corvinus di Budapest.,
Kristof Szabo è un ricercatore quantitativo senior presso WorldQuant, LLC, e ha un master in Matematica attuariale e finanziaria presso l’Università Eötvös Loránd di Budapest.
NOTE DI CHIUSURA
1. Stefano M. Schaefer. “Robert Merton, Myron Scholes e lo sviluppo dei prezzi dei derivati.”Scandinavian Journal of Economics 100, no. 2 (1998): 425-445.
2. George Cybenko. “Approssimazione per sovrapposizione di una funzione sigmoidale.”Mathematics of Control, Signals and Systems 2, no. 4 (1989): 303-314.
3. Kurt Hornik, Maxwell B. Stinchcombe e Halbert White., “Le reti Feedforward multistrato sono approssimatori universali.”Neural Networks 2, no. 5 (1989): 359-366.
4. Frank Rosenblatt. “The Perceptron: A Probabilistic Model for Information Storage and Organization in the Brain.”Psychological Review 65, no. 6 (1958): 386-408.
6. Mary Malliaris e Linda M. Salchenberger. “Un modello di rete neurale per stimare i prezzi delle opzioni.”Applied Intelligence 3, no. 3 (1993) ” 193-206.
7. Il film è stato prodotto da Tomaso Poggio e prodotto da James M. Hutchinson, Andrew W. Lo e Tomaso Poggio. “Un approccio non parametrico ai prezzi e alla copertura dei titoli derivati tramite reti di apprendimento.,”Journal of Finance 49, no. 3 (1994): 851-889.
8. Mary Malliaris e Linda Salchenberger. “Utilizzo di reti neurali per prevedere la volatilità implicita di S& P 100.” Neurocomputing 10, no. 2 (1996): 183-195.
9. Sovan K. Mitra. “Un modello di prezzo delle opzioni che combina l’approccio della rete neurale e la formula di Black Scholes.”Global Journal of Computer Science and Technology 12, no. 4 (2012).
Gli articoli di Thought Leadership sono preparati e sono di proprietà di WorldQuant, LLC e vengono resi disponibili solo a scopo informativo ed educativo., Questo articolo non è destinato a riguardare alcuna strategia di investimento o prodotto specifico, né costituisce consulenza in materia di investimenti o trasmettere un’offerta di vendita, o la sollecitazione di un’offerta di acquisto, titoli o altri prodotti finanziari. Inoltre, le informazioni contenute in qualsiasi articolo non sono destinate a fornire, e non dovrebbero essere invocate per, consulenza di investimento, contabile, legale o fiscale. WorldQuant non fornisce alcuna garanzia o dichiarazione, esplicita o implicita, in merito all’accuratezza o adeguatezza di qualsiasi informazione e l’utente accetta tutti i rischi nell’affidarsi a tali informazioni., Le opinioni espresse nel presente documento sono esclusivamente quelle di WorldQuant alla data di questo articolo e sono soggette a modifiche senza preavviso. Nessuna garanzia può essere data che gli scopi, le ipotesi, le aspettative e/o gli obiettivi descritti in questo articolo saranno realizzati o che le attività descritte in questo articolo hanno o continueranno affatto o nello stesso modo in cui sono state condotte durante il periodo coperto da questo articolo. WorldQuant non si impegna a informarvi di eventuali cambiamenti nelle opinioni espresse nel presente documento., WorldQuant e le sue affiliate sono coinvolte in una vasta gamma di attività di negoziazione e di investimento in titoli e possono avere un interesse finanziario significativo in uno o più titoli o prodotti finanziari discussi negli articoli.