středa, července 25, 2012

Ranem do roboty

Je dobry si obcas rano privstat, probehnout mlhou, senem, pozdravit kravy v ohrade. Vsem se kourilo od huby. I mne. Skrz hradby a pevnosti vysplhat na kopec. Najednou se oteplilo. Klicku mezi muzeem a filharmonii, obejit soud a brankou do zahrady. U bazenu sprchu a v kostymu pokracovat volnym tempem na snidani do kavarny na dvorku. V poledne trocha slunce na terase. A trocha vina k tomu, budou prece prazdniny. Tohle uz znam z Jednoty. Zatim me to bavi. Navic neprsi. Preji vam hezky den z Lucemburku.

pátek, července 20, 2012

Kde je ta pravda?

Daleko.

Už nějakou dobu mi říkáte, že tu nic dlouho nepřibylo. A když to mám napravit, tak musím opravit výsledky z toho předchozího příspěvku, který se objevil, tramtadadá, už skoro před rokem. Budu to mít z hlavy a půjdu dál.
Když nevíte coby, udělejte průměr. Když je čísel víc, tak jenom seďte. Ono se to nějak vyvrbí. Pro předpověď výše spreadu vládních dluhopisů (rozdíl mezi mezibankovní sazbou a sazbou za vládní dluhopisy) jsem zahrnul nejčastěji používané proměnné z literatury a pár navíc. A jak to dopadlo, se můžete podívat tady. Od poslední verze narostl počet srovnávaných prací. Jako jeden z nejlepších indikátorů pořád vychází nezaměstnanost. Proč ji ale nikdo nepoužívá, to nevím. Každopádně je za tím pěkná historka. Obecně, čím vyšší nezaměstnanost, tím bude mít vláda méně peněz a bude vyšší riziko, že nebude splácet svoje dluhy. Nejlepší proměnné mají pěknou historku. Čím více bude vláda utrácet za hovadiny, tím méně peněz jí zůstane, zvýší se riziko nesplácení atd. Naopak když by výdaje byly vedený jako investice, zřejmě by se nějak vrátily. Ve veřejných financích bývá ale obtížný říct, co je přínos, protože subjektivní hodnoty se hůř srovnávají.

srovnání s literaturou, efekty, podle pravděpodobnosti zahrnutí

Všimněte si, jak moc se shoduji s literaturou. Ty nejlepší proměnné jsou odshora.

Omalovánky pro R, statistický program, sloupce jsou modely, který obsahujou ty proměnné, které jsou vybarveny červenou (-) nebo modrou (+)

Všimněte si, že se mi tu některé proměnné vyskytují častěji než ostatní. Taky si všimněte jak je těch nejlepších 5 tisíc modelů užitečných, dohromady vysvětlují 2 % ze všech kombinací, kterých je 2^44 (móóóc).
 Pro zvídavé jsou taky shrnuté výsledky. Častěji se vyskytující proměnné mají vyšší čísla u koeficientů, některé nestojí za řeč.

Odhady koeficientů, průměrované přes pravděpodobnost výskytu v nejlepších modelech

Zdarec




jestli to někdo dočte až sem, tak respekt a napište, jestli chcete k tomu nějaký další poznámky.

neděle, září 04, 2011

Spread, Model Uncertainty, BMA

Spread vládních dluhopisů je běžné užívanou proměnnou pro hodnocení pravděpodobnosti státních bankrotů. I v ekonometrii jej lze použít jako synonymum pro rating států. V době dluhových krizí Řecka a USA se o ratingu hodně mluví a zřejmě spousta investorů na něj spoléhá. Je tajemstvím ratingových agentur jako Standard&Poor's, Moody's nebo Fitch jak sestavují svoje žebříčky a hodnocení. Zčásti je založené na tvrdých datech, zčásti zřejmě na úsudku a spekulacích. Spread vládních dluhopisů má tu výhodu, že namísto tří písmen nabízí přesnou numerickou hodnotu. Přesto, že odráží tvrdá data i úsudek investorů, je založen více na tržních mechanismech, než na marketingových nálepkách ratingu.

Ti, které zajímá na čem závisí výše spreadu a jestli je lze vůbec předvídat a měřit, mohou číst dále. Dále mohou číst také ti, kteří loví hvězdičky statistické signifikance bez kontroly nad zahrnutím nebo vyřazením proměnných. Pro ně bude představena robustní metoda "Bayesovské modelové průměrování".

Kterými veličinami lze předpovídat velikost spreadu vládních dluhopisů? O tom existují přehledové papery, které udávají četnost veličin publikovaných studií. Jejich sčítací metoda má malý háček, nebo alespoň dva. Jedním z nich je "publication bias", kdy někdy je lepší publikovat něco než nic. Ten způsobuje zejména zkreslení koeficientů u jimi použitých publikovaných studií (bývají v absolutních hodnotách větší). Druhým je zkreslení důležitosti proměnných, kdy jako ukazatel slouží počet publikací v přehledu. Potom je obtížné porovnat vzájemnou důležitost proměnných.

Další věcí je předpovídací schopnost modelu, která se s narůstajícím počtem zahrnutých proměnných snižuje. Zahrnout všechny dostupné proměnné tedy také není správná cesta.
Zůstává tedy otázkou, které proměnné vlastně do modelu patří (tzv. "model uncertainty") a také jak z nich vybrat ty nejdůležitější pro předpověď spreadu.

"Bayesian Model Averaging" (BMA) je metoda, která se s těmito problémy umí poprat. Vytváří podmodely z kombinace dostupných proměnných a podle věrohodnostní funkce (a z koef. determinace) jim přiřazuje důležitost. Když si tyto podmodely seřadíte od nejlepšího po nejhorší a podíváte se na nejlepších 5000 podmodelů, bude možné, že půjde snadno vybrat několik nejdůležitějších.

BMA má i svá úskalí. Jednotlivé veličiny nesmí být příliš korelované. Vysoký korelační koeficient mezi dvěma proměnnými může tyto dvě postavit proti sobě, vzájemně se eliminující. Dále jde např. o počet možných kombinací proměnných. Když byste měli jednu proměnnou, máte dvě možnosti: zahrnout do podmodelu nebo ji z něho vynechat. S každou další proměnnou se tento počet zdvojnásobí. Počet podmodelů je exponenciální řadou. Jestli máte rychlý počítač a zvládne zhruba 1000 běžných OLS modelů za sekundu, můžete 20 proměnných vyhodnotit do dvaceti minut. Jestliže to zkusíte pro 40 proměnných, potrvá to 35 let. Naštěstí existují algoritmy, které to umí docela zkrátit.

Byla použita panelová data pro 48 zemí (zejména OECD), obsahující 20 proměnných za období 1980 - 2010.

Metoda BMA aplikovaná na předpovídání spreadu ukazuje následující obrázek. Podle něj lze vybrat zhruba deset nejdůležitějších proměnných. Od těch s největší důležitostí: úrokové sazby, nezaměstnanost, inflace, růst HDP, otevřenost, odchylka směnného kurzu od trendu, státní výdaje, nominální směnný kurz k USD, výše cizoměnových rezerv k HDP a veřejný dluh k HDP.

Obrázek 1: Zahrnutí proměnných do skutečného modelu, pro 5000 podmodelů


Výsledek metody BMA graficky zobrazuje, jak moc jsou které proměnné důležité. Na svislé ose jsou proměnné, na horizontální jsou kumulované pravděpodobnosti podmodelů jakožto skutečného modelu (true model). Ve sloupcích jsou řazeny podmodely s různou kombinací proměnných. Modrá barva znamená, že proměnná se podílí na rozšiřování spreadu, červená barva naopak spread snižuje. Snižování spreadu (červená) znamená nižší pravděpodobnost bankrotu a vyšší (lepší) rating. Šíře sloupců znamená pravděpodobnost podmodelu jako skutečného modelu. Výška řádků znamená poměrově reprezentuje pravděpodobnost zahrnutí proměnné do skutečného modelu (poměr barevných částí řádku k celé ploše rádku).

BMA umí i koeficienty. Jako jedna z robustních metod průměruje koeficienty z podmodelů. Jako váhy přitom používá právě pravděpodobnost podmodelů jako skutečných modelů (šířky sloupců v obrázku 1). Koeficienty tady nehledejte, nejsou tu. Pro jejich interpretaci je potřeba znát jejich konstrukci (poměry, růsty, někdy logaritmy) a použití (fixed effects model), které tu také nejsou. Obecně jsou tyto koeficienty střídmější (nižší v absolutních hodnotách), kvůli tomu, že z podmodelů, které je neobsahují jsou počítány s nulovou hodnotou (bílá pole ve sloupcích obrázku 1) ale nenulovou pravděpodobností (šířka bílých sloupců v obrázku 1).

BMA poměřil vzájemnou důležitost jednotlivých proměnných, používaných pro určení spreadu. Mezi tyto proměnné byly přidány i některé další, např. nezaměstnanost a otevřenost ekonomiky, které se pro předpověď spreadu zařadily mezi ty nejlepší. Překvapivě, výše veřejného dluhu k HDP (v obrázku jako proměnná s názvem L1PUDP), která se tolik diskutuje a uvádí, není nejlepší proměnnou pro předpověď spreadu a tedy ani ratingu.

Investoři spoléhající na rating zemí, by měli vědět, že se za ním skrývá něco víc, než jen tři písmena. Potom by nebyli tolik překvapení, když se o stupínek nebo o dva změní.

Teď to ještě příští týden obhájit u státnic.