în 1973, Fischer Black, Myron Scholes și Robert Merton și-au publicat formula de stabilire a prețurilor opțiunilor, care ar avea o influență semnificativă asupra dezvoltării finanțelor cantitative.,1 în modelul lor (de obicei cunoscut sub numele de Black-Scholes), valoarea unei opțiuni depinde de volatilitatea viitoare a unui stoc, mai degrabă decât de randamentul așteptat. Formula lor de stabilire a prețurilor a fost un model bazat pe teorie, bazat pe presupunerea că prețurile acțiunilor urmează o mișcare browniană geometrică., Având în vedere că Chicago Board Options Exchange (CBOE) s-a deschis în 1973, discheta a fost inventată cu doar doi ani mai devreme, iar IBM era încă la opt ani distanță de introducerea primului său PC (care avea două dischete), folosind o abordare bazată pe date bazată pe opțiuni din viața reală prețurile ar fi fost destul de complicate la acea vreme pentru Black, Scholes Deși soluția lor este remarcabilă, nu este în măsură să reproducă unele constatări empirice., Unul dintre cele mai mari defecte ale Black-Scholes este nepotrivirea dintre volatilitatea modelului opțiunii de bază și volatilitatea observată de pe piață (așa-numita suprafață de volatilitate implicită).astăzi investitorii au posibilitatea de a alege. Avem mai multă putere de calcul în telefoanele noastre mobile decât computerele de ultimă generație au avut în anii 1970, iar datele disponibile cresc exponențial. Drept urmare, putem folosi o abordare diferită, bazată pe date, pentru stabilirea prețurilor opțiunilor. În acest articol, prezentăm o soluție pentru stabilirea prețurilor opțiunilor pe baza unei metode empirice care utilizează rețele neuronale., Principalul avantaj al metodelor de învățare automată, cum ar fi rețelele neuronale, în comparație cu abordările bazate pe model, este că acestea sunt capabile să reproducă majoritatea caracteristicilor empirice ale prețurilor opțiunilor.cu instrumentele financiare derivate cunoscute ca opțiuni, cumpărătorul plătește un preț vânzătorului pentru a cumpăra un drept de a cumpăra sau de a vinde un instrument financiar la un preț specificat la un anumit punct în viitor. Opțiunile pot fi instrumente utile pentru multe aplicații financiare, inclusiv gestionarea riscurilor, tranzacționarea și compensarea managementului., Nu este surprinzător faptul că crearea unor modele de prețuri fiabile pentru opțiuni a fost un domeniu activ de cercetare în mediul academic.unul dintre cele mai importante rezultate ale acestei cercetări a fost formula Black-Scholes, care oferă prețul unei opțiuni pe baza mai multor parametri de intrare, cum ar fi prețul acțiunilor subiacente, rata dobânzii fără risc a pieței, timpul până la data expirării opțiunii, prețul de exercitare al contractului și volatilitatea acțiunilor subiacente., Înainte de Black-Scholes, practicienii au folosit modele de stabilire a prețurilor bazate pe paritatea put-call sau o primă de risc asumată similară evaluării proiectelor de investiții. În domeniul finanțelor corporative, unul dintre cele mai frecvent utilizate modele pentru evaluarea companiilor este modelul fluxului de numerar actualizat (DCF), care calculează valoarea actuală a unei companii ca sumă a fluxurilor de numerar viitoare actualizate. Rata de actualizare se bazează pe riscul perceput de a investi capital în acea companie., Ideea revoluționară din spatele Black-Scholes a fost că nu este necesar să se utilizeze prima de risc atunci când se evaluează o opțiune, deoarece prețul acțiunilor conține deja aceste informații. În 1997, Academia regală suedeză de științe a acordat Premiul Nobel pentru științe Economice lui Merton și Scholes pentru munca lor inovatoare. (Black nu a împărțit premiul. A murit în 1995, iar premiile Nobel nu sunt acordate postum.,dacă toate prețurile opțiunilor sunt disponibile pe piață, Black-Scholes poate fi utilizat pentru a calcula așa-numita volatilitate implicită pe baza prețurilor opțiunilor, deoarece toate celelalte variabile ale formulei sunt cunoscute. Pe baza Black-Scholes, volatilitatea implicită ar trebui să fie aceeași pentru toate prețurile de grevă ale opțiunii, dar, în practică, cercetătorii au descoperit că volatilitatea implicită pentru opțiuni nu este constantă. În schimb, este înclinat sau în formă de zâmbet.cercetătorii caută în mod activ modele care sunt capabile să ofere opțiuni de preț într-un mod care să poată reproduce suprafața de volatilitate implicită observată empiric., O soluție populară este modelul Heston, în care volatilitatea activului suport este determinată folosind un alt proces stocastic. Modelul, numit după matematicianul Steven Heston de la Universitatea din Maryland, este capabil să reproducă multe descoperiri empirice — inclusiv volatilitatea implicită — dar nu toate, astfel încât inginerii financiari au folosit diferite procese avansate de bază pentru a veni cu soluții pentru a genera constatări empirice., Pe măsură ce modelele de prețuri au evoluat, au apărut următoarele dificultăți:
• dinamica prețurilor de bază a devenit mai complexă din punct de vedere matematic și a devenit mai generală — de exemplu, folosind procese Lévy în loc de mișcări Browniene.
• * prețul opțiunilor a devenit mai intensiv în resurse. Deși modelul Black-Scholes are o soluție de formă închisă de stabilire a prețurilor Europene opțiuni de apel, astăzi, oamenii folosesc de obicei mai multe calcul intensiv Monte Carlo, prețul pentru ele.
• este nevoie de cunoștințe tehnice mai profunde pentru a înțelege și utiliza modelele de tarifare.,
aplicarea metodelor de învățare automată la opțiunile de stabilire a prețurilor abordează majoritatea acestor probleme. Există diferiți algoritmi care sunt capabili să aproximeze o funcție bazată pe intrările și ieșirile funcției dacă numărul de puncte de date este suficient de mare. Dacă vedem opțiunea ca o funcție între Termenii contractați (intrări) și prima opțiunii (ieșire), putem ignora pur și simplu toate întrebările financiare legate de opțiuni sau piețe bursiere., Mai târziu vom vedea cum adăugarea unor cunoștințe financiare înapoi în model poate contribui la îmbunătățirea acurateței rezultatelor, dar la nivel de bază nu sunt necesare informații legate de Finanțe.una dintre aceste tehnici de aproximare utilizează rețele neuronale artificiale, care au o serie de proprietăți utile., De exemplu, unii membri ai rețelele neuronale artificiale sunt universale approximators — în sensul că dacă eșantionul este suficient de mare și algoritmul este destul de complex, atunci funcția care rețeaua a învățat va fi destul de aproape de cea reală pentru orice scop practic, după cum a arătat de către George Cybenko (1989)2 și Kurt Hornik, Maxwell B. Stinchcombe și Riech Alb (1989).3 rețelele neuronale artificiale sunt potrivite pentru baze de date mari, deoarece calculele se pot face cu ușurință pe mai multe computere în paralel., Una dintre proprietățile lor cele mai interesante este dualitatea în viteza de calcul: deși antrenamentul poate fi destul de consumator de timp, odată ce procesul este terminat și aproximarea funcției este gata, predicția este extrem de rapidă.
rețele neuronale
conceptul esențial al rețelelor neuronale este de a modela comportamentul creierului uman și de a crea o formulare matematică a creierului pentru a extrage informații din datele de intrare., Unitatea de bază de o rețea neuronală este un perceptron, care imită comportamentul unui neuron și a fost inventat de psihologul American Frank Rosenblatt în 1957.4 Dar potențialul de rețele neuronale nu a fost dezlănțuit până în 1986, când David Rumelhart, Geoffrey Hinton și Ronald Williams a publicat lor influente hârtie pe algoritmul de retropropagare, care a arătat o modalitate de a instrui neuroni artificiali.5 După această descoperire, au fost construite multe tipuri de rețele neuronale, inclusiv perceptronul multistrat (MLP), care este punctul central al acestui articol.,MLP este alcătuit din straturi de perceptroni, fiecare având o intrare: suma ieșirii percepttronilor din stratul anterior înmulțită cu greutățile lor; poate fi diferit pentru fiecare perceptron. Perceptronii folosesc o funcție de activare neliniară (cum ar fi funcția sigmoidă în formă de S) pentru a transforma semnalele de intrare în semnale de ieșire și a trimite aceste semnale în stratul următor. Primul strat (stratul de intrare) este unic; perceptronii din acest strat au doar o ieșire, care este datele de intrare., Ultimul strat (stratul de ieșire) este unic în sensul că în problemele de regresie constă de obicei dintr-un singur perceptron. Orice straturi între aceste două straturi sunt de obicei numite straturi ascunse. Pentru un MLP cu un strat ascuns, vizualizarea este după cum urmează în Figura 1.,
Figura 1 poate fi scrisă matematic dintre stratul ascuns și stratul de intrare ca:
și între rezultatul final și stratul ascuns ca:
în cazul în care f1 și f2 sunt funcții de activare, α și β conține matricile de greutate între straturi, iar ε este termenul de eroare cu 0 spun.,primul pas al calculului este inițializarea aleatorie a matricelor de greutate; acest proces va fi utilizat pentru a transforma variabilele de intrare în ieșirea prognozată. Folosind această ieșire, valoarea funcției de pierdere poate fi calculată, comparând rezultatele reale și cele prognozate folosind datele de antrenament. Metoda backpropagation poate fi utilizată pentru a calcula gradienții modelului, care apoi pot fi utilizate pentru a actualiza matricele de greutate., După ce greutățile au fost actualizate, funcția de pierdere ar trebui să aibă o valoare mai mică, indicând faptul că eroarea de prognoză a datelor de antrenament a fost scăzută. Etapele anterioare trebuie repetate până când modelul converge și eroarea de prognoză este acceptabilă.deși procesul anterior poate părea complicat, există multe pachete de programare off-the-shelf care permit utilizatorilor să se concentreze asupra problemei la nivel înalt în loc de detaliile de implementare., Responsabilitatea utilizatorului este de a converti datele de intrare și ieșire în forma corectă, de a seta parametrii rețelei neuronale și de a începe faza de învățare. De obicei, cei mai importanți parametri sunt numărul de neuroni din fiecare strat și numărul de straturi.după cum s-a arătat anterior, modelele clasice de tarifare a opțiunilor sunt construite pe un proces de bază care reproduce relația empirică dintre datele opțiunilor (prețul de exercitare, timpul până la maturitate, tipul), datele de bază și prima opțiunii, care este observabilă pe piață., Metodele de învățare automată nu presupun nimic despre procesul de bază; ei încearcă să estimeze o funcție între datele de intrare și primele, minimizând o funcție de cost dată (de obicei eroarea medie pătrată între prețul modelului și prețul observat pe piață) pentru a atinge performanțe bune în afara eșantionului.există o literatură în evoluție care aplică alte metode de știință a datelor, cum ar fi regresia vectorială de suport sau ansamblurile de arbori, dar rețelele neuronale precum perceptronii multistrat se potrivesc în general bine pentru opțiunile de stabilire a prețurilor., În cele mai multe cazuri, opțiunea premium este o funcție monotonă a parametrilor, astfel încât este nevoie de un singur strat ascuns pentru a oferi o precizie ridicată, iar modelul este mai greu de depășit.
Folosind masina de învățare pentru opțiuni de stabilire a prețurilor nu este un concept nou; două relevante lucrări timpurii au fost create la începutul anilor 1990 la indicele prețurilor de opțiuni pe S&P 100 și S&P 500.6,7 Aceste metode sunt convenabile în zilele noastre datorită disponibilității mai multor pachete software pentru rețele neuronale., Deși opțiunile de stabilire a prețurilor au devenit mai ușoare, este încă puțin mai complicat decât încărcarea datelor de intrare (caracteristicile opțiunilor, datele activului suport) și datele țintă (primele) și apăsând „enter.”O problemă rămâne: Proiectarea arhitecturii rețelei neuronale și evitarea suprapunerii modelului.majoritatea metodelor de învățare automată se bazează pe un proces iterativ pentru a găsi parametrii corespunzători într-un mod care să minimizeze diferența dintre rezultatele modelului și țintă., De obicei, încep prin a învăța relații semnificative, dar după un timp minimizează doar eroarea specifică eșantionului și reduc performanța generală a modelului pe date nevăzute din eșantion. Există multe modalități de a rezolva această problemă; una dintre cele mai populare este oprirea timpurie. Această metodă separă datele de instruire originale în eșantioane de instruire și validare, instruind modelul numai pe datele de instruire și evaluându-l pe eșantionul de validare., La începutul procesului de învățare, eroarea eșantionului de validare scade sincron cu eroarea eșantionului de formare, dar mai târziu probele de formare și validare încep să se abată; eroarea scade numai în eșantionul de formare și crește în eșantionul de validare. Acest fenomen semnalează supraîncărcarea parametrilor, iar procesul trebuie oprit la sfârșitul fazei de scădere sincronă.,
Modele care au mai mulți parametri pot fi overfitted mai ușor, astfel încât numărul de perceptrons și straturi ar trebui să fie echilibrat între învățare cele mai importante caracteristici și de a pierde din precizie, pentru că de overfitting. Rata de învățare determină cât de mult să modificați parametrii în fiecare iterație; este o setare importantă și trebuie setată manual. Uneori, aceste metaparametre sunt decise pe baza erorilor de validare; alegerea lor este mai mult artă decât știință., Alegerea parametrilor” cei mai buni ” poate da rezultate mai bune, dar precizia obținută în timpul reglării fine se diminuează de obicei, astfel încât modelul instruit este suficient de bun pentru a fi utilizat după doar câteva încercări.metodele menționate mai sus pot fi utilizate în general pentru îmbunătățirea modelelor de rețele neuronale. În multe cazuri, adăugarea de cunoștințe specifice problemelor (în acest caz, cunoștințe financiare) poate îmbunătăți performanța modelului., În acest moment, MLP a învățat deja o bună aproximare a formulei de stabilire a prețurilor opțiunilor, dar precizia este determinată de dimensiunea eșantionului (care este de obicei fixată) și de variabilele de intrare. De aici, există trei moduri de a îmbunătăți în continuare performanța:
1. Adăugați mai multe variabile de intrare care ajută modelul să înțeleagă mai bine formula de stabilire a prețurilor opțiunilor.
2. Creșteți calitatea variabilelor de intrare prin filtrarea valorilor aberante.
3. Transformați funcția într-un mod care este mai ușor de aproximat.
prima abordare este destul de simplă., Introducerea unei noi variabile în model crește complexitatea acestuia și face mai ușor să se suprapună. Ca urmare, fiecare variabilă nouă trebuie să crească puterea predictivă a modelului pentru a compensa numărul crescut de parametri. Și deoarece prețurile opțiunilor depind de volatilitatea preconizată a securității subiacente în viitor, orice variabilă care acționează ca un proxy pentru volatilitatea istorică sau implicită face de obicei MLP mai precis., Pentru a îmbunătăți precizia, profesorii de la Universitatea Loyola din Chicago, Mary Malliaris și Linda Salchenberger, au sugerat adăugarea prețurilor întârziate ale securității de bază și a opțiunii.a doua metodă este de a crește calitatea variabilelor de intrare. Deoarece prețurile opțiunilor mai puțin lichide conțin de obicei mai mult zgomot decât cele mai lichide, filtrarea acestor opțiuni ar trebui să îmbunătățească acuratețea modelului de stabilire a prețurilor., Dar dacă am dori să estimăm prima pentru opțiunile deep-in-the-money sau out-of-the-money, această metodă de curățare ar putea elimina o parte semnificativă a setului de date utilizat. Astfel, este important ca cercetătorii să aleagă criterii de filtrare care sunt alegerea optimă între renunțarea la valori și păstrarea cantității maxime de informații utile.a treia abordare — unde arta preia metodologia-ridică o întrebare deschisă: dacă rețeaua neuronală poate aproxima orice funcție, atunci ce ar trebui să prognozăm?, Acesta este punctul în care există cel mai mic consens între practicieni.
problema este clară: avem nevoie de o ieșire finală din rețeaua neuronală care să spună cât de mult merită o opțiune cu parametrii de intrare. Cu toate acestea, acest lucru nu înseamnă că prețul final este cel mai bun obiectiv pentru care trebuie să vizați. Întrebarea este mai puțin relevantă atunci când avem o dimensiune mare a eșantionului. Atunci când setul de date este mic, alegerea celui mai bun mod de a măsura o funcție poate crește precizia în continuare., Soluțiile cele mai frecvent alese sunt următoarele:
preziceți prima opțiunii direct, potențial folosind informațiile pe care le avem de la modelele matematice — de exemplu, adăugând volatilitate implicită la variabilele de intrare. Chiar dacă minimizăm cu succes eroarea pentru funcția primei, asta nu înseamnă că, după transformarea acesteia în predicția finală, erorile vor fi în continuare cele mai bune realizabile pentru prima. Prin prezicerea directă a primei, forțăm cel mai bun rezultat.,
preziceți volatilitatea implicită a opțiunii și puneți-o înapoi în formula Black-Scholes. Asta ar trebui să facă prima lizibilă. Marele avantaj aici este că variabila țintă diferită este în același interval de valori, chiar dacă prima opțiunii este diferită în mărime. Alte variabile Black-Scholes pot fi folosite pentru a încerca să prezică primele de opțiuni, dar volatilitatea implicită este cea mai populară dintre ele.8
estimați raportul dintre opțiunea premium și prețul de exercitare., Dacă prețurile opțiunilor de bază se comportă ca mișcări Browniene geometrice, acea proprietate poate fi utilizată pentru a reduce numărul de parametri de intrare. În acest caz, cercetătorul ar folosi raportul dintre prețul de bază și prețul de grevă ca unul dintre parametrii de intrare, în loc să utilizeze separat prețurile de bază și cele de grevă. Această soluție poate fi foarte utilă dacă dimensiunea setului de date este mică și sunteți mai expus la probleme de suprasolicitare., deși există un dezacord cu privire la funcția pe care cercetătorii ar trebui să încerce să o prezică, există oa doua dezbatere cu privire la faptul dacă setul de date ar trebui împărțit în subseturi bazate pe diferite calități. Malliaris și Salchenberger susțin că opțiunile în bani și în afara banilor ar trebui împărțite în seturi de date diferite. Din punct de vedere practic, această abordare poate fi utilă deoarece amploarea primelor de opțiune poate fi foarte diferită în cele două grupuri., Sovan Mitra, lector superior în științe matematice la Universitatea din Liverpool, susține că, dacă datele sunt împărțite în prea multe părți, șansa de supraîncărcare crește și precizia modelului pe rezultatele în afara eșantionului este redusă.9
lumea a parcurs un drum lung de când Black, Scholes și Merton și-au publicat lucrările seminale despre prețurile opțiunilor în 1973. Creșterea exponențială a puterii computaționale și a datelor, în special în ultimul deceniu, a permis cercetătorilor să aplice tehnici de învățare automată la derivatele de preț cu o precizie neprevăzută în anii ’70 și ’80., Pe atunci, prețurile opțiunilor erau determinate în principal de modele teoretice bazate pe fundamentul calculului stocastic. În acest articol, oferim o metodă alternativă care utilizează învățarea automată, în special rețelele neuronale, la opțiunile de preț cu o abordare bazată pe date. Noi credem că această abordare ar putea fi un plus valoros la setul de instrumente de ingineri financiare și poate înlocui metodele tradiționale în multe domenii de aplicare.Balazs Mezofi este cercetător cantitativ la WorldQuant, LLC și are un master în matematică actuarială și financiară de la Universitatea Corvinus din Budapesta.,Kristof Szabo este cercetător cantitativ principal la WorldQuant, LLC și are un master în matematică actuarială și financiară de la Universitatea Eötvös Loránd din Budapesta.
note finale
1. Stephen M. Schaefer. „Robert Merton, Myron Scholes și dezvoltarea prețurilor derivate.”Scandinavian Journal of Economics 100, no. 2 (1998): 425-445.
2. George Cybenko. „Aproximarea prin Superpoziții a unei funcții sigmoidale.”Mathematics of Control, Signals and Systems 2, no. 4 (1989): 303-314.
3. Kurt Hornik, Maxwell B. Stinchcombe și Halbert White., „Rețelele Feedforward Multistrat Sunt Aproximatoare Universale.”Neural Networks 2, no. 5 (1989): 359-366.
4. Frank Rosenblatt. „The Perceptron: a Probabilistic Model for Information Storage and Organization in the Brain.”Psychological Review 65, no. 6 (1958): 386-408.
6. Mary Malliaris și Linda M. Salchenberger. „Un model de rețea neuronală pentru estimarea prețurilor opțiunii.”Applied Intelligence 3, no. 3 (1993): 193-206.
7. James M. Hutchinson, Andrew W. Lo și Tomaso Poggio. „O abordare Neparametrică a prețurilor și a acoperirii valorilor mobiliare derivate prin intermediul rețelelor de învățare.,”Journal of Finance 49, no. 3 (1994): 851-889.
8. Mary Malliaris și Linda Salchenberger. „Utilizarea rețelelor neuronale pentru a Prognoza volatilitatea implicită s&P 100.”Neurocomputing 10, no. 2 (1996): 183-195.
9. Sovan K. Mitra. „Un model de stabilire a prețurilor opțiune care combină abordarea rețelei neuronale și Formula Scholes Negru.”Global Journal of Computer Science and Technology 12, no. 4 (2012).articolele de conducere a gândirii sunt pregătite și sunt proprietatea WorldQuant, LLC și sunt puse la dispoziție numai în scopuri informaționale și educaționale., Acest articol nu este destinat să se refere la orice strategie de investiții specifice sau produs, nici nu acest articol constituie consultanță de investiții sau transmite o ofertă de a vinde, sau solicitarea unei oferte de a cumpăra, orice valori mobiliare sau alte produse financiare. În plus, informațiile conținute în orice articol nu este destinat să furnizeze, și nu ar trebui să fie invocate pentru, de investiții, contabilitate, consultanță juridică sau fiscală. WorldQuant nu oferă garanții sau declarații, exprese sau implicite, cu privire la exactitatea sau adecvarea oricărei informații și acceptați toate riscurile în baza acestor informații., Opiniile exprimate aici sunt exclusiv cele ale WorldQuant de la data acestui articol și pot fi modificate fără notificare prealabilă. Nu se pot da asigurări că orice scopuri, ipoteze, așteptări și/sau obiective descrise în acest articol vor fi realizate sau că activitățile descrise în articol au făcut sau vor continua deloc sau în același mod în care au fost desfășurate în perioada acoperită de acest articol. WorldQuant nu se angajează să vă informeze cu privire la orice modificări ale opiniilor exprimate aici., WorldQuant și afiliații săi sunt implicați într-o gamă largă de activități de tranzacționare și investiții de valori mobiliare și pot avea un interes financiar semnificativ pentru una sau mai multe valori mobiliare sau produse financiare discutate în articole.