v roce 1973 zveřejnili Fischer Black, Myron Scholes a Robert Merton svůj nyní známý vzorec cen opcí, který by měl významný vliv na vývoj kvantitativních financí.,1 ve svém modelu (obvykle známém jako Black-Scholes) závisí hodnota opce spíše na budoucí volatilitě akcie než na očekávaném výnosu. Jejich cenový vzorec byl teoreticky řízený model založený na předpokladu, že ceny akcií sledují geometrický Brownianův pohyb., Vzhledem k tomu, že Chicago Board Options Exchange (CBOE), postavený v roce 1973, diskety byly vynalezeny, jen o dva roky dříve, a IBM byl ještě osm let od zavedení své první PC (který měl dvě disketové mechaniky), pomocí data-driven přístup založený na reálných možností, ceny by byly poměrně složité na čas, pro Black, Scholes a Merton. Ačkoli je jejich řešení pozoruhodné, není schopno reprodukovat některé empirické nálezy., Jedním z největších nedostatků z Black-Scholes je nesoulad mezi modelem volatility podkladového možnost a pozorované volatility z trhu (tzv. implikovaná volatilita povrchu).

dnes mají investoři na výběr. V našich mobilních telefonech máme více výpočetní síly než nejmodernější počítače v 70. letech a dostupná data exponenciálně rostou. V důsledku toho můžeme použít jiný přístup založený na datech pro stanovení cen opcí. V tomto článku představujeme řešení cen opcí založené na empirické metodě využívající neuronové sítě., Hlavní výhodou metody strojového učení, jako jsou neuronové sítě, ve srovnání s modelem řízené přístupy, je, že jsou schopni reprodukovat většinu empirické vlastnosti, možnosti, ceny.

Úvod do Oceňování Opcí

S finančními deriváty známé jako možnosti, že kupující zaplatí prodávajícímu kupní právo k nákupu nebo prodeji finančního nástroje za stanovenou cenu ve stanoveném okamžiku v budoucnosti. Možnosti mohou být užitečnými nástroji pro mnoho finančních aplikací, včetně řízení rizik, obchodování a kompenzace řízení., Není divu, že vytváření spolehlivých cenových modelů pro možnosti bylo aktivní oblastí výzkumu v akademické sféře.

Jedním z nejdůležitějších výsledků tohoto výzkumu bylo Black-Scholes vzorec, který dává cenu opce na základě několika vstupních parametrů, jako je cena podkladových akcií, na trhu je bezriziková úroková míra, doba do expirace opce datem, cenou zakázky a volatilitu podkladových akcií., Před Black-Scholes, praktici používali cenové modely založené na paritě put-call nebo předpokládané rizikové prémii podobné ocenění investičních projektů. V oblasti podnikových financí, jeden z nejčastěji používaných modelů pro ocenění společností je model diskontovaných peněžních toků (DCF), která vypočítá současnou hodnotu podniku jako součet jejích diskontovaných budoucích peněžních toků. Diskontní sazba je založena na vnímaném riziku investování kapitálu do této společnosti., Revoluční myšlenkou Black-Scholes bylo, že při oceňování opce není nutné používat rizikovou prémii, protože cena akcií již tyto informace obsahuje. V roce 1997 udělila Královská švédská akademie věd Nobelovu cenu za ekonomické vědy Mertonovi a Scholesovi za jejich průkopnickou práci. (Černý se na ceně nepodílel. Zemřel v roce 1995 a Nobelovy ceny nejsou udělovány posmrtně.,)

pokud jsou na trhu k dispozici všechny opční ceny, lze Black-Scholes použít k výpočtu tzv. implikované volatility na základě cen opcí, protože jsou známy všechny ostatní proměnné vzorce. Na základě Black-Scholes by implikovaná volatilita měla být stejná pro všechny stávkové ceny opce, ale v praxi vědci zjistili, že implikovaná volatilita opcí není konstantní. Místo toho je zkosená nebo ve tvaru úsměvu.

vědci aktivně hledají modely, které jsou schopny cenové možnosti způsobem, který dokáže reprodukovat empiricky pozorovaný implikovaný povrch volatility., Jedním z populárních řešení je model Heston, ve kterém je volatilita podkladového aktiva stanovena pomocí jiného stochastického procesu. Model, pojmenovaný po University of Maryland matematik Steven Heston, je schopen reprodukovat mnoho empirických zjištění — včetně implikované volatility — ale ne všechny z nich, takže finanční inženýři používají různé pokročilé základní procesy přijít s řešením, jak generovat empirické poznatky., Jako modely oceňování vyvinul, tyto potíže vznikly:

• základní cena dynamics mám složitější matematicky, a stal se více obecné — například pomocí Lévyho procesů místo Brownovy pohyby.

• ceny možností se staly náročnějšími na zdroje. Ačkoli model Black-Scholes má uzavřené řešení pro stanovení cen evropských možností volání, dnes lidé obvykle používají výpočetně náročnější metody Monte Carlo k jejich ceně.

• pochopení a používání cenových modelů vyžaduje hlubší technické znalosti.,

použití metod strojového učení k cenovým možnostem řeší většinu těchto problémů. Existují různé algoritmy, které jsou schopny přiblížit funkci na základě vstupů a výstupů funkce, pokud je počet datových bodů dostatečně velký. Pokud vidíme možnost jako funkce mezi sjednané podmínky (vstupy) a prémie možnost (výstup), můžeme jednoduše ignorovat všechny finanční otázky týkající se volby nebo akciové trhy., Později uvidíme, jak přidat některé finanční znalosti zpět do modelu, může pomoci zlepšit přesnost výsledků, ale na základní úrovni, ne finance-související informace je potřeba.

jedna z těchto aproximačních technik používá umělé neuronové sítě, které mají řadu užitečných vlastností., Například, někteří členové umělé neuronové sítě jsou univerzální approximators — což znamená, že je-li vzorek dostatečně velký a algoritmus je dostatečně složité, pak je funkce, že síť se dozvěděl, bude dost blízko, aby ten pravý pro jakýkoli praktický účel, jak ukázal George Cybenko (1989)2 a Kurt Hornik, Maxwell B. Stinchcombe a Halbert White (1989).3 umělé neuronové sítě jsou vhodné pro velké databáze, protože výpočty lze provádět snadno na více počítačích paralelně., Jednou z jejich nejzajímavějších vlastností je dualita v rychlosti výpočtu: ačkoli trénink může být poměrně časově náročný, jakmile je proces dokončen a aproximace funkce je připravena, predikce je extrémně rychlá.

Neuronové Sítě

základní koncept neuronových sítí je model chování lidského mozku a vytvořit matematické formulace, že mozek extrahuje informace ze vstupních údajů., Základní jednotkou neuronové sítě je perceptron, který napodobuje chování neuronu a byl vynalezen Americký psycholog Frank Rosenblatt v 1957.4 Ale potenciál neuronových sítí nebyl vypuštěn do roku 1986, kdy David Rumelhart, Geoffrey Hinton a Ronald Williams publikoval své vlivné knize o backpropagation algoritmus, který ukázal způsob, jak trénovat umělé neurony.5 po tomto objevu bylo postaveno mnoho typů neuronových sítí, včetně vícevrstvého perceptronu (MLP), který je předmětem tohoto článku.,

MLP se skládá z vrstev perceptrons, z nichž každá má vstup: součet výstup perceptrons z předchozí vrstvy vynásobí jejich váhy; to může být různé pro každý perceptron. Perceptrony používají nelineární aktivační funkci (jako je sigmoidní funkce ve tvaru S) k transformaci vstupních signálů na výstupní signály a odesílání těchto signálů do další vrstvy. První vrstva (vstupní vrstva) je jedinečná; perceptrony v této vrstvě mají pouze výstup, což jsou vstupní data., Poslední vrstva (výstupní vrstva) je jedinečná v tom smyslu, že v regresních problémech se obvykle skládá z jediného perceptronu. Jakékoli vrstvy mezi těmito dvěma vrstvami se obvykle nazývají skryté vrstvy. U MLP s jednou skrytou vrstvou je vizualizace na obrázku 1 následující.,

Číslo 1 lze zapsat matematicky mezi skrytou vrstvou a vstupní vrstvy, jako jsou:

a mezi konečné výstupní a skryté vrstvě jako:

kde f1 a f2 jsou aktivační funkce, α a β obsahují matice hmotnosti mezi vrstvami, a ε je chybová termín s 0 mysli.,

prvním krokem výpočtu je náhodná inicializace hmotnostních matic; tento proces bude použit k transformaci vstupních proměnných na předpokládaný výstup. Pomocí tohoto výstupu lze vypočítat hodnotu funkce ztráty porovnáním skutečných a předpokládaných výsledků pomocí údajů o školení. Metodu backpropagation lze použít k výpočtu gradientů modelu, které pak lze použít k aktualizaci hmotnostních matic., Po aktualizaci závaží by měla mít funkce ztráty menší hodnotu, což naznačuje, že chyba prognózy na tréninkových datech byla snížena. Předchozí kroky by se měly opakovat, dokud se model konverguje a chyba prognózy není přijatelná.

přestože se předchozí proces může zdát komplikovaný, existuje mnoho programovacích balíčků mimo polici, které uživatelům umožňují soustředit se na problém na vysoké úrovni namísto podrobností o implementaci., Odpovědností uživatele je převést vstupní a výstupní data do správné formy, nastavit parametry neuronové sítě a zahájit fázi učení. Obvykle jsou nejdůležitějšími parametry počet neuronů v každé vrstvě a počet vrstev.

Cenové Možnosti s Multilayer Perceptrons

Jak je uvedeno dříve, klasické oceňování opcí, modely jsou postaveny na základní proces, který reprodukuje empirický vztah mezi volbou data (realizační cena, doba do splatnosti, typ), podkladová data a prémie možnost, která je pozorovatelná na trhu., Metody strojového učení nepředpokládejte nic o základní proces; snaží se odhadnout, funkce mezi vstupní data a pojistného, čímž se minimalizuje dané nákladové funkce (obvykle střední čtvercová chyba mezi modelem cenou a zjištěnou cenou na trhu), k dosažení dobré out-of-sample výkon.

Tam je vyvíjející literatury použití jiných údajů, věda, metody, jako je podpora vektor regrese nebo strom souborů, ale neuronových sítí jako multilayer perceptrons obecně dobře hodí pro oceňování opcí., Ve většině případů je Option premium monotónní funkcí parametrů, takže k dosažení vysoké přesnosti je zapotřebí pouze jedna skrytá vrstva a model je těžší předjíždět.

Pomocí strojového učení pro cenové možnosti, není nový koncept; dva příslušných rané práce byly vytvořeny v časných 1990 index cen opcí na S&P 100 a S&P 500.6,7 Tyto metody jsou vhodné v dnešní době, díky dostupnosti z několika softwarových balíčků pro neuronové sítě., Ačkoli cenové možnosti se staly jednoduššími, je to stále o něco složitější než načítání vstupních dat (charakteristiky opcí, data podkladového aktiva) a cílových dat (prémie) a stisknutí klávesy „enter“.“Jeden problém zůstává: navrhování architektury neuronové sítě a vyhnout se overfitting modelu.

Většina metod strojového učení jsou založeny na iterativním procesu najít vhodné parametry, způsobem, který minimalizuje rozdíl mezi výsledky modelu a cíl., Obvykle začínají učením smysluplných vztahů, ale po chvíli minimalizují pouze chybu specifickou pro vzorek a snižují obecný výkon modelu na neviditelných datech mimo vzorek. Existuje mnoho způsobů, jak tento problém vyřešit; jedním z populárních je brzké zastavení. Tato metoda odděluje původní tréninková data do vzorků školení a validace, instruuje model pouze na tréninkových datech a vyhodnocuje je na ověřovacím vzorku., Na začátku procesu učení, chyby ověření vzorku klesá synchronně s chybou přípravy vzorku, ale později se školení a ověření vzorků začnou rozcházet, chyba se snižuje pouze v tréninkovém vzorku a zvyšuje ve validační vzorek. Tento jev signalizuje přetížení parametrů a proces by měl být zastaven na konci synchronně klesající fáze.,

Modely, které mají více parametrů, může být overfitted snadněji, takže počet perceptrons a vrstvy by měla být vyvážená mezi učení na důležité funkce a ztrácejí přesnost, protože overfitting. Míra učení určuje, kolik upravit parametry v každé iteraci; je to důležité nastavení a musí být nastaveno ručně. Někdy jsou tyto metaparametry rozhodovány na základě chyb ověření; jejich výběr je více umění než věda., Výběrem „nejlepší“ parametry mohou přinést lepší výsledky, ale přesnost získaných během doladění obvykle snižuje, takže trénovaný model je dost dobrý k použití po jen pár zkoušek.

zlepšení výkonu

výše uvedené metody lze obecně použít pro zlepšení modelů neuronových sítí. V mnoha případech může přidání problémů specifických znalostí (v tomto případě finančních znalostí) zlepšit výkon modelu., V tomto okamžiku se MLP již naučil dobrou aproximaci vzorce cen opcí, ale přesnost je určena velikostí vzorku (která je obvykle pevná) a vstupními proměnnými. Odtud existují tři způsoby, jak dále zlepšit výkon:

1. Přidejte další vstupní proměnné, které pomáhají modelu lépe porozumět vzorci cen voleb.

2. Zvyšte kvalitu vstupních proměnných filtrováním odlehlých hodnot.

3. Transformujte funkci tak, aby bylo snazší ji přiblížit.

první přístup je poměrně přímočarý., Zavedení nové proměnné do modelu zvyšuje jeho složitost a usnadňuje overfit. V důsledku toho musí každá nová proměnná zvýšit prediktivní sílu modelu, aby kompenzovala zvýšený počet parametrů. A protože opční ceny jsou závislé na očekávané volatilitě podkladového zabezpečení v budoucnu, jakákoli proměnná, která působí jako proxy pro historickou nebo implikovanou volatilitu, obvykle činí MLP přesnější., Pro zlepšení přesnosti navrhli profesoři Loyola University Chicago Mary Malliaris a Linda Salchenberger přidání zpožděných cen základní bezpečnosti a možnosti.

druhou metodou je zvýšení kvality vstupních proměnných. Vzhledem k tomu, že ceny Méně tekutých možností obvykle obsahují více šumu než ty více tekuté, odfiltrování těchto možností by mělo zlepšit přesnost cenového modelu., Pokud bychom však chtěli odhadnout prémii za hluboké peníze nebo možnosti mimo peníze, tato metoda čištění by mohla eliminovat významnou část použitého datového souboru. Tak, to je důležité, aby vědci vyberte kritéria filtrování, které jsou optimální volbou mezi vrácení odlehlé hodnoty a udržet maximální množství užitečné informace.

třetí přístup-kde art přebírá metodiku-vyvolává otevřenou otázku: pokud neuronová síť může přiblížit jakoukoli funkci, co bychom měli předpovídat?, To je bod, ve kterém existuje nejmenší množství konsensu mezi odborníky.

problém je jasný: potřebujeme konečný výstup z neuronové sítě, který říká, kolik stojí volba se vstupními parametry. To však neznamená, že konečná cena je nejlepším cílem. Otázka je méně relevantní, když máme velkou velikost vzorku. Když je datová sada malá, výběr nejlepšího způsobu měření funkce může dále zvýšit přesnost., Nejčastěji zvolená řešení jsou následující:

Předvídat prémie možnost přímo, případně pomocí informací, které máme z matematické modely — například, přidání implikovaná volatilita na vstupních proměnných. I když úspěšně minimalizujeme chybu funkce prémie, neznamená to, že po její transformaci na konečnou predikci budou chyby stále nejlepší dosažitelné pro prémii. Tím, že předpovídáme prémii přímo, vynucujeme nejlepší výsledek.,

předpovídají implikovanou volatilitu opce a vloží ji zpět do vzorce Black-Scholes. To by mělo učinit prémii čitelnou. Velkou výhodou je, že různá Cílová proměnná je ve stejném rozsahu hodnot, i když je prémie této možnosti odlišná. Jiné Black-Scholes proměnné mohou být použity, aby se pokusili předvídat možnosti prémie, ale implicitní volatilita je nejpopulárnější mezi nimi.8

odhadněte poměr mezi opční prémií a stávkovou cenou., Pokud základní možnosti, ceny se chovají jako geometrický Brownův pohyby, že vlastnost lze použít ke snížení počtu vstupních parametrů. V tomto případě by výzkumník použil poměr mezi podkladovou cenou a stávkovou cenou jako jeden ze vstupních parametrů namísto použití podkladových a stávkových cen Samostatně. Toto řešení může být velmi užitečné, pokud je velikost datové sady malá a jste více vystaveni problémům s nadměrným zatížením.,

zatímco existuje neshoda o tom, kterou funkci by se vědci měli pokusit předpovědět, existuje druhá debata o tom, zda by měl být datový soubor rozdělen na podmnožiny založené na různých kvalitách. Malliaris a Salchenberger tvrdí, že Možnosti in-the-money a out-of-the-money by měly být rozděleny do různých datových sad. Z praktického hlediska může být tento přístup užitečný, protože velikost opčního pojistného může být ve dvou skupinách velmi odlišná., Sovan Mitra, docent v matematických věd na Univerzitě v Liverpoolu, tvrdí, že pokud jsou data rozdělena na příliš mnoho částí, možnost overfitting zvyšuje a model je přesnost na out-of-sample výsledky je snížena.9

svět má za sebou dlouhou cestu, protože Black, Scholes a Merton zveřejnili své klíčové dokumenty o cenách opcí v roce 1973. Exponenciální růst výpočetního výkonu a dat, zejména v posledních deseti letech, umožnila výzkumníkům použít strojového učení, aby cena deriváty s přesností nepředvídaných v 70. a 80.let., V té době byly ceny opcí poháněny především teoretickými modely založenými na základu stochastického počtu. V tomto článku poskytujeme alternativní metodu, která využívá strojové učení, zejména neuronové sítě, k cenovým možnostem s přístupem založeným na datech. Věříme, že tento přístup by mohl být cenným doplňkem sady nástrojů finančních inženýrů a může nahradit tradiční metody v mnoha aplikačních oblastech.

Balazs Mezofi je Kvantitativní Výzkumník na WorldQuant, LLC, a má titul MSc v Pojistně-matematické a Finanční Matematiky z Corvinus University v Budapešti.,

Krištof Szabo je vedoucí kvantitativní výzkumník na WorldQuant, LLC, a má MSc v pojistně-matematické a finanční matematice z Eötvös Loránd University v Budapešti.

ENDNOTES

1. Stephen M. Schaefer. „Robert Merton, Myron Scholes a vývoj cen derivátů.“Scandinavian Journal of Economics 100, no. 2 (1998): 425-445.

2. George Cybenko. „Aproximace pomocí Superpozic sigmoidální funkce.“Matematika řízení, signálů a systémů 2, č. 4( 1989): 303-314.

3. Kurt Hornik, Maxwell B. Stinchcombe a Halbert White., „Vícevrstvé Sítě Feedforward Jsou Univerzální Aproximátory.“Neuronové sítě 2, č. 5( 1989): 359-366.

4. Frank Rosenblatt. „Perceptron: pravděpodobnostní Model pro ukládání informací a organizaci v mozku.“Psychologický přehled 65, č. 6 (1958): 386-408.

6. Mary Malliaris a Linda m. Salchenberger. „Model neuronové sítě pro odhad cen opcí.“Aplikovaná inteligence 3, č. 3 (1993): 193-206.

7. James M. Hutchinson, Andrew W. Lo a Tomaso Poggio. „Neparametrický přístup k cenám a zajišťování derivátových cenných papírů prostřednictvím vzdělávacích sítí.,“Journal of Finance 49, no. 3 (1994): 851-889.

8. Mary Malliaris a Linda Salchenbergerová. „Použití neuronových sítí k předpovědi implikované Volatility s&p 100.“Neurocomputing 10, no. 2 (1996): 183-195.

9. Sovan K. Mitra. „Model cenové volby, který kombinuje přístup neuronové sítě a vzorec Black Scholes.“Global Journal of Computer Science and Technology 12, no. 4 (2012).

myšlenky vedení články jsou připraveny a jsou majetkem WorldQuant, LLC, a jsou zpřístupněny pouze pro informační a vzdělávací účely., Tento článek není určen, aby se vztahují na konkrétní investiční strategii nebo produkt, ani tento článek nepředstavuje investiční poradenství nebo zprostředkovat nabídku k prodeji ani žádost o nabídku ke koupi cenných papírů nebo jiných finančních produktů. Kromě toho Informace obsažené v jakémkoli článku nejsou určeny k poskytování investičního, účetního, právního nebo daňového poradenství a neměly by se na ně spoléhat. WorldQuant neposkytuje žádné záruky nebo prohlášení, výslovné nebo předpokládané, pokud jde o přesnost nebo přiměřenost jakýchkoli informací, a přijímáte všechna rizika při spoléhání se na takové informace., Názory zde vyjádřené jsou pouze názory WorldQuant k datu tohoto článku a mohou se změnit bez předchozího upozornění. Žádné záruky, může být vzhledem k tomu, že žádné cíle, předpoklady, očekávání a/nebo cíle popsané v tomto článku bude realizována, nebo že činnosti popsané v článku udělal, nebo bude pokračovat vůbec, nebo stejným způsobem, jak byly provedeny během období, na které se vztahuje tento článek. WorldQuant se nezavazuje, aby vám poradil o jakýchkoli změnách v názorech zde vyjádřených., WorldQuant a jeho přidružené společnosti se podílejí na široké škále obchodních a investičních činností s cennými papíry a mohou mít významný finanční zájem na jednom nebo více cenných papírech nebo finančních produktech diskutovaných v článcích.

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna. Vyžadované informace jsou označeny *