neděle, září 04, 2011

Spread, Model Uncertainty, BMA

Spread vládních dluhopisů je běžné užívanou proměnnou pro hodnocení pravděpodobnosti státních bankrotů. I v ekonometrii jej lze použít jako synonymum pro rating států. V době dluhových krizí Řecka a USA se o ratingu hodně mluví a zřejmě spousta investorů na něj spoléhá. Je tajemstvím ratingových agentur jako Standard&Poor's, Moody's nebo Fitch jak sestavují svoje žebříčky a hodnocení. Zčásti je založené na tvrdých datech, zčásti zřejmě na úsudku a spekulacích. Spread vládních dluhopisů má tu výhodu, že namísto tří písmen nabízí přesnou numerickou hodnotu. Přesto, že odráží tvrdá data i úsudek investorů, je založen více na tržních mechanismech, než na marketingových nálepkách ratingu.

Ti, které zajímá na čem závisí výše spreadu a jestli je lze vůbec předvídat a měřit, mohou číst dále. Dále mohou číst také ti, kteří loví hvězdičky statistické signifikance bez kontroly nad zahrnutím nebo vyřazením proměnných. Pro ně bude představena robustní metoda "Bayesovské modelové průměrování".

Kterými veličinami lze předpovídat velikost spreadu vládních dluhopisů? O tom existují přehledové papery, které udávají četnost veličin publikovaných studií. Jejich sčítací metoda má malý háček, nebo alespoň dva. Jedním z nich je "publication bias", kdy někdy je lepší publikovat něco než nic. Ten způsobuje zejména zkreslení koeficientů u jimi použitých publikovaných studií (bývají v absolutních hodnotách větší). Druhým je zkreslení důležitosti proměnných, kdy jako ukazatel slouží počet publikací v přehledu. Potom je obtížné porovnat vzájemnou důležitost proměnných.

Další věcí je předpovídací schopnost modelu, která se s narůstajícím počtem zahrnutých proměnných snižuje. Zahrnout všechny dostupné proměnné tedy také není správná cesta.
Zůstává tedy otázkou, které proměnné vlastně do modelu patří (tzv. "model uncertainty") a také jak z nich vybrat ty nejdůležitější pro předpověď spreadu.

"Bayesian Model Averaging" (BMA) je metoda, která se s těmito problémy umí poprat. Vytváří podmodely z kombinace dostupných proměnných a podle věrohodnostní funkce (a z koef. determinace) jim přiřazuje důležitost. Když si tyto podmodely seřadíte od nejlepšího po nejhorší a podíváte se na nejlepších 5000 podmodelů, bude možné, že půjde snadno vybrat několik nejdůležitějších.

BMA má i svá úskalí. Jednotlivé veličiny nesmí být příliš korelované. Vysoký korelační koeficient mezi dvěma proměnnými může tyto dvě postavit proti sobě, vzájemně se eliminující. Dále jde např. o počet možných kombinací proměnných. Když byste měli jednu proměnnou, máte dvě možnosti: zahrnout do podmodelu nebo ji z něho vynechat. S každou další proměnnou se tento počet zdvojnásobí. Počet podmodelů je exponenciální řadou. Jestli máte rychlý počítač a zvládne zhruba 1000 běžných OLS modelů za sekundu, můžete 20 proměnných vyhodnotit do dvaceti minut. Jestliže to zkusíte pro 40 proměnných, potrvá to 35 let. Naštěstí existují algoritmy, které to umí docela zkrátit.

Byla použita panelová data pro 48 zemí (zejména OECD), obsahující 20 proměnných za období 1980 - 2010.

Metoda BMA aplikovaná na předpovídání spreadu ukazuje následující obrázek. Podle něj lze vybrat zhruba deset nejdůležitějších proměnných. Od těch s největší důležitostí: úrokové sazby, nezaměstnanost, inflace, růst HDP, otevřenost, odchylka směnného kurzu od trendu, státní výdaje, nominální směnný kurz k USD, výše cizoměnových rezerv k HDP a veřejný dluh k HDP.

Obrázek 1: Zahrnutí proměnných do skutečného modelu, pro 5000 podmodelů


Výsledek metody BMA graficky zobrazuje, jak moc jsou které proměnné důležité. Na svislé ose jsou proměnné, na horizontální jsou kumulované pravděpodobnosti podmodelů jakožto skutečného modelu (true model). Ve sloupcích jsou řazeny podmodely s různou kombinací proměnných. Modrá barva znamená, že proměnná se podílí na rozšiřování spreadu, červená barva naopak spread snižuje. Snižování spreadu (červená) znamená nižší pravděpodobnost bankrotu a vyšší (lepší) rating. Šíře sloupců znamená pravděpodobnost podmodelu jako skutečného modelu. Výška řádků znamená poměrově reprezentuje pravděpodobnost zahrnutí proměnné do skutečného modelu (poměr barevných částí řádku k celé ploše rádku).

BMA umí i koeficienty. Jako jedna z robustních metod průměruje koeficienty z podmodelů. Jako váhy přitom používá právě pravděpodobnost podmodelů jako skutečných modelů (šířky sloupců v obrázku 1). Koeficienty tady nehledejte, nejsou tu. Pro jejich interpretaci je potřeba znát jejich konstrukci (poměry, růsty, někdy logaritmy) a použití (fixed effects model), které tu také nejsou. Obecně jsou tyto koeficienty střídmější (nižší v absolutních hodnotách), kvůli tomu, že z podmodelů, které je neobsahují jsou počítány s nulovou hodnotou (bílá pole ve sloupcích obrázku 1) ale nenulovou pravděpodobností (šířka bílých sloupců v obrázku 1).

BMA poměřil vzájemnou důležitost jednotlivých proměnných, používaných pro určení spreadu. Mezi tyto proměnné byly přidány i některé další, např. nezaměstnanost a otevřenost ekonomiky, které se pro předpověď spreadu zařadily mezi ty nejlepší. Překvapivě, výše veřejného dluhu k HDP (v obrázku jako proměnná s názvem L1PUDP), která se tolik diskutuje a uvádí, není nejlepší proměnnou pro předpověď spreadu a tedy ani ratingu.

Investoři spoléhající na rating zemí, by měli vědět, že se za ním skrývá něco víc, než jen tři písmena. Potom by nebyli tolik překvapení, když se o stupínek nebo o dva změní.

Teď to ještě příští týden obhájit u státnic.

úterý, června 21, 2011

40 dni a 40 noci


Chvilku mi to vydrželo, než spadly okna. Nakonec to bylo 42 dní, z čehož čistých 15 dnů v provozu, zbytek spánek. Na začátku jelo Rko nonstop 5 dnů, potom TeX a hlavně Chrome.

úterý, května 17, 2011

Diplomka...

...uz klepe na dvere. Proto posilam obrazkovy navod, jak rychle napsat diplomku. Nesebere to cas a povzbudi to vasi cinnost.

GP Brno

pondělí, března 21, 2011

Bydlete v hospode

Proč si v pátek večer ořezat tužku?

Proč ji večer nosit v kapse?

Proč se o půlnoci někam schovat do budovy?

Protože informace "rozhodný okamžik sčítání" je zavádějící. Na koleji jsem dostal sčítací formulář s dotazem, kde budu o půlnoci v rozhodný okamžik. Když jsem jim ho přišel vrátit prázdný, řekl jsem na to, že mě nedostanou, protože stejně bydlím doma, tak se paní kolejní rozčertila. Zvláště když jsem jí přečetl odstavec vysvětlivek, tak mi tomu pomohla porozumět, jsem podle ní natvrdlej a přitom mám bejt vysokoškolák. Uklidnilo ji až to, když jsem jí řekl, že to radši půjdu o půlnoci do nonstopu naproti na pivo.

Sice do žádný hospody nepůjdu, anžto pojedeme na hory, díky paní Sixtové ale budu vědět odpověď na tuhletu otázku:

Proč má 20 % Čechů jako své bydliště uvedenou hospodu?

Nemám jí to za zlý, jí to řekla asi sčítací komisařka, aby nutila studenty uvést, že doma jsou na koleji a ne doma. Taky webový stránky obcí napovídaj, že sčítat se začne až o půlnoci. Uvádějí jediný příklad s miminkem narozeným po půlnoci v rozhodný okamžik, který do sčítání už nepatří. Přitom jako jeden z top důvodů sčítání je prý budoucí organizace a plánování školství, takže nevím, proč se připravovat takhle hloupě připravovat o data (tipuju tak 100 dětí/den x 30 dnů, cha, je to jenom 1/12 sčítacího roku, prům. +/- 3 děti ve třídě, nejvýše +/-9 dětí ve třídě (třída bude mít mezi 12 a 30 žáky - ale to se nestane, zákl. školy si počty stejně cílujou samy). Proč se ale ve sčítání vlastně na nic neptali, tomu nerozumím. Kdyby za těch šest věcí dávali 150 Kč (-náklady za admin loginů a hesel) při online vyplnění, každý by se cítil líp.

"Církev nejlepších dnů megaarciekonopapeže M.R." se mi nevešla na počet znaků. A klidně se pochlubím, že jsem to vypsal o týden dřív, když se z toho aspoň někomu naježí chlupy.

Přeju hezký jaro.

čtvrtek, ledna 20, 2011

Štěstí

Happiness neboli štěstí je prej smyslem života. Tak se na mě dneska trochu usmálo. První zkoušková písemka z Ekonometrie. Pass level 33 bodů z 65. Já měl dokonce 3 % NAD. Psalo 58 lidí z 90. Dole je hustota rozdělení bodů, srovnáno s čárou normálního rozdělení. Vychází tam nějaké shluky, vypadá to, že některý skupinky se spolu učily stejný věci, proto ty výčnělky. Šikmost možná vychází z toho, že testové otázky se neshodují přímo s tím, co bylo na přednáškách a cvičeních. Odvozovat se dá skutečně všechno, jako v matice. Problém je v tom, že tady žádnej seznam definic, vět a důkazů neexistuje. Všechna čest těm na špici a kuráž těm níže.


Distribuce bodů z písemky



Kabyho los evropský

neděle, ledna 16, 2011

Beautiful sunny afternoon here in Prague Czech Republic

Už jsem si přestal něco myslet. Nebo jsem to zapomněl. Až si o něčem začnu něco myslet a bude to statisticky signifikantní, přitom to nezapomenu, podělím se.

Teď si vzpomínám, venku svítí slunko. Poslední dny spím tak 9 hodin přes noc a k tomu ještě 5 hodin odpoledne. Vysadil jsem totiž kávu, kterou jsem se poslední týden poháněl. Co jsem chtěl říct?

Jo, tak zeširoka z posledních měsíců: na tento semestr mi zbyl jen jeden předmět - ekonometrie (kombinace statistiky a ekonomie). A abych volný čas rozumně využil, rozeslal jsem v září CV. Kolotoč pohovorů se přestal točit, když jsem zjistil, že čas, který bych mohl příštích pár měsíců věnovat "práci" nebude tak flexibilní, protože volnej semestr mezitím zmizel. A nastala verze beta. Přes absolventa CEU Ivana jsem se tak koncem listopadu nalogoval do ekonomicko-finanční sekce institutu Glopolis.org, abych jim tam pomohl s pojednáním o příčinách kritiky činnosti EIB. Přesné zadání nebylo, měl jsem dost volnosti. Cílem bylo do konce prosince odevzdat paper o 15 stránkách.

K tomu se přidala ta ekonometrie a ještě odevzdání 20 stran diplomky. Samotný napsání paperu jsem odkládal na dobu, kdy toho budu vědět víc a budu mít víc načteno. Strávil jsem s tím veselé vánoce. Pět dnů před deadlinem posunutým na konec prvního lednovýho týdne jsem zjistil, že schválená struktura paperu nejde publikovat a rozhodl jsem se ji celou změnit. Bohužel, mám malou RAM v hlavě a v lineárním textu to nešlo. Mám z toho i obrázek, strukturu jsem dělal off-line, manuálně, s nůžkama a lepící páskou.


Postupně jsem různé verze paperu, rozstříhal, vytřídil a seskupil jinak, abych je mohl popsat z finálního pohledu, aby jsem nevynechal žádnou klíčovou myšlenku a aby se neopakovaly. Nešlo tam o čísla, spíše o institucionální pohled na zřízení a plnění cílů EIB. Poslední víkend začal stříháním, sobota zhruba tak, jak ukazuje obrázek, proběhlo třídění. V neděli jsme celý den hráli volejbal v amatérské lize. V šest večer došlo na lámání chleba a psaní se už nedalo vyhnout. Tak jsem si sedl, dal si kafe, a začal psát. Pak druhý a třetí, spolubydlící odešli do školy. V poledne jsem omluvenku, že to dopisuju. Další kafe a už v šest večer posílám 30 normostran. Stačilo to vysedět.




Pondělí jsem tak šel spát brzo. Zbytek týdne jsem si přál věnovat ekonometrii. Nevím proč, nějak se mi do toho nechtělo. Přál jsem si to postavit na pár typech příkladů, který umím i pozadu. Bohužel se odvození předem neznámých vychytávek pro různý druhy modelů neumím naučit (byly by toho kvanta a je to všechno v učebnicích). Takže jsem do svýho portfolia přidal pár jednodušších univerzálnějších odvození. A zalil to omáčkou své omezené představivosti. Tohle zní krátce a taky je, prokládal jsem to hodně fotbálkem, volejbalem a surfováním (po netu). Páteční písemka opět překvapila, opravdu oceňuji tvořivost lektorů tohoto předmětu. Jo a k tomu ještě před písemkou bylo potřeba vytvořit projekt.

Od tý doby jsem kafe neměl a spím. Včera jsem si dal asi hodinovou procházku po Praze. Dnes už mám po snídani a půjdu zas. Večer bude trénink freedivingu i se saunou. To mi připomíná sehnat k tomu jízdenky, prý tu teď bude výlučně nějaká Openkrad.

Dozvěděl jsem se, že fakultní požadavky na diplomku jsou 70 stránek. Průměrně dlouhý paper s ekonometrií jich má odhadem 20. Rozhodl jsem se diplomku rozdělit na dvě eseje. Jednu povídací - institucionální. Druhou na kvantifikaci vztahu mezi konkurenceschopností země a její pravděpodobností bankrotu. Ta druhá mi přijde lehce vyčerpatelná, nemůžu k ní najít dostatek relevantní teoretické literatury. Třeba ani ratingové agentury nepodávají vysvětlení jak k hodnocení došly. Budu si to asi muset vymyslet sám, což bude kratší. Test vaší RAM:",co myslíte, o čem bude povídací esej?"

Čekám na výsledky ekonometrie. Já to psal, teď je to na nich.