Scheme snadno a rychle - 3. Vyhodnocovani
potom co jsme poresili gramatiky a takove ty veci a mame hezky derivacni strom. muzeme prejit k vyhodnocovani, resp. k samotnemu vypoctu. takze vsechno doted byly jenom takove pomocne plky a ted si drzte klobouky, protoze jedeme z kopce
3.1. vyhodnoceni symbolu
jak jsem psal v predchozi kapitole, po rozparsovani mame jenom nejaky seznam, ktery obsahuje symboly po pripade nejake dalsi seznamy symbolu. proste nic uzasneho. k jednotlivym symbolum musime priradit nejake skutecne hodnoty. to se ve schemu deje pomoci tzv. prostredi (nekde jsem videl oznaceni ramce), coz jsou zkratka a dobre asociativni pole, kde jako klic slouzi symbol a jako hodnota realne prirazena hodnota. prostredi maji jeste jednu vlastnost -- jsou hierarchicky usporadany. pokud se hledany symbol v danem prostredi nenachazi prohleda se nadrazene a pokud ani tam neni, je bud vyhodnocen na svou prirozenou vazbu (napriklad cislo se vyhodnoti na cislo) a pokud takovou vazbu nema, je vracena chyba.
v praxi se osvedcilo mit dva typy prostredi, jeden typ schopny pojmout velke pocty symbolu (radove desitky, stovky, tisice) a druhy zase male (radove jednotky). ty velke jsou urceny pro pocatecni prostredi a ty mensi pro prostredi jednotlivych funkci. v praxi se pak pro prostredi s velkym poctem symbolu pouzivaji hash-tabulky a pro male bud spojove seznamy nebo pole. (zajimavych vysledku jde dosahnout v obou pripadech i pomoci binarnich stromu, s tim ze pro velka prostredi je potreba je nejakym zpusobem, nejlepe narazove vyvazovat)
z r5rs plyne, ze az na pocatecni prostredi, maji jednotliva prostredi konstantni velikost. ale rada implementaci to umi prehlizet.
3.2. vyhodnoceni seznamu vychodilovym modelem
otazka zni: jak vyhodnotit treba? (+ 1 (+ 2 3))
mohl bych zde uvest trivialni model na bazi stromove rekurze, kdy se overi, jestli je na vstupu seznam, tak se vyhodnoti prvni prvek a kdyz je to funkce tak se vyhodnoti i ostatni casti seznamu, ktere se funkci predaji jako parametry a vraci se vysledek. ale to sebou nese neprijemne dusledky typu, jak resit call/cc nebo koncova volani.
existuje rada sofistikovanych vyhodnocovacich modelu, at uz na bazi registrovych ci zasobnikovych procesoru. ja jsem prevzal model doc. vychodila, ktery tento model prednasi prvakum na katedre informatiky univerzity palackeho v olomouci a mirne jej modifikoval. (ty odkazy jsou proto, ze jsem slibil, nejake "kredity" pro katedru ;-]) jedna se o zasobnikovy model, pravda neni z nejrychlejsich, ale ma nektere prijemne rysy, napr. snadne rozsireni na implicitne paralelni vyhodnocovani, ale o tom az nekdy jindy, kdyby vas to zajimalo.
takze predstavme si vyhodnocovani jako virtualni procesor, ktery ma dva zasobniky -- jeden na zpracovani ukolu (exct) a druhy na ukladani mezivysledku (rslt). na zasobnik s ukoly (execution stack) se budou ukladat jednotlive instrukce, vcetne argumentu a prostredi, ve kterem ma byt dana instrukce vyhodnocena. v momente kdy zasobnik s ukoly je prazdny. mel by byt na zasobniku s mezivysledky prave jeden prvek. ktery je vysledkem.
pro zacatek zavedeme nasledujici instrukce:
3.2.1 vyhodnoceni vyrazu
3.2.1.1. instrukce eval
[eval arg env (tail-priznak)]
-- po jejim odebrani z vrcholu zasobniku se vyhodnoti argument arg v danem prostredi. tzn. pokud je argument symbol. vyhodnoti se na vazbu v danem prostredi a hodnota se zapise na zasobnik s vysledky. (tail-priznak slouzi k vyhodnoceni vyrazu v tail-pozici, coz zatim nebudeme resit a budeme jej s naprostym klidem ignorovat) pokud je argument arg seznam, nachysta se vyhodnoceni prvniho prvku a dalsi casti seznamu cakaji na zpracovani pomoci instrukce "inspect".
napr. ("|" znaci dno zasobniku)
exct: [eval #<symbol 158> #env] | rslt: | => exct: | rslt: #<int 158> nebo exct: [eval (+ 1 2) #env] | rslt: | => exct: [eval #<symbol +> #env] [inspect (1 2) #env] | rslt: |
3.2.1.2. instrukce inspect
pokud je na vrcholu zasobniku s mezivysledky (rslt) funkce, provede se vyhodnoceni jednotlivych argumentu a aplikace jako argument dane funkce. (specialni formy se vyhodnocuji trochu jinak, ale o tom az v pristi kapitole)
napr.exct: [eval #<symbol +> #env] [inspect (1 2) #env] | rslt: | => exct: [inspect (1 2) #env] | rslt: #<func +> | => exct: [eval #<symbol 1> #env] [eval #<symbol 2> #env] [run 2 #env] | rslt: #<func +> | =>....=> exct: [run 2 #env] | rslt: #<int 2> #<int 1> #<func +> |
3.2.1.3. instrukce run
odebere z vrcholu zasobniku dany pocet prvku a aplikuje je na funkci na vrcholu, kterou taky odebere. vysledek volani pak umisti opet na zasobnik.
napr.exct: [run 2 #env] | rslt: #<int 2> #<int 1> #<func +> | => exct: | rslt: #<int 3> |
3.2.2. implementacni poznamky
no, v predchozi casti, operuju s hodnotou typu func, kterou jsem zatim nikde nedefinoval. jedna se o ukazatel na funkci, ktera prijima pocet parametru a po le parametru a vysledek operace vraci. zavedeme tedy typ scm_func jako ukazatel na funkci.
typedef struct scm_value * (*scm_func)(int cnt, struct scm_value **);
a union v scm_value rozsirime o tento typ. jako argument by sel pouzit i jeden seznam -- na druhou stranu jsem si rikal, ze pristup k poli bude rychlejsi, navic aserce na pocet vstupu muze byt dost casta, tak se oplati mit predem spocitany pocet argumentu pred volanim funkce.
dalsi veci, ktera vyrazne zrychli beh, je agresivni inlinovani vetsiny funkci. operace se zasobnikem (fyzickeho procesoru) jsou sice rychle, ale kdyz se vo laji mooooockrat jde to poznat.
samozrejme kompilace s -O3 udela taky hodne.
3.3. specialni formy
u beznych funkci se predpoklada, ze argumnety budou vyhodnocovany naraz v libovolnem poradi i kdyz r5rs rika, ze by to melo byt v jednom nebo druhem smeru a poporade. u specialnich forem uz to poradi specifikovane je a treba v pripade kosntrukce (define foo bar)
by vyhodnoceni hodnoty foo vedlo k chybe.
3.3.1. ukazka vyhodnoceni nekterych spec. forem.
3.3.1.1. spec. forma if
exct: [eval (if condition result1 result2) #env] | rslt: | => exct: [inspect (condition result1 result2) #env] | rslt: #<specform if> | => exct: [eval condition #env] [if #env] | rslt: result1 result2 | => exct: [if #env] | rslt: #<bool #t> result1 result2 | => exct: [eval result1 #env] | rslt: |
3.3.1.2. spec. forma define
exct: [eval (define foo bar) #env] | rslt: | => exct: [inspect (foo bar) #env] | rslt: #<specform define> | => exct: [eval bar #env] [define #env] | rstl: #<symbol foo> | => exct: [define #env] | rslt: bar #<symbol foo> | => exct: | rslt: bar
3.3.2. a dalsi
dalsi specialni formy se daji definovat obdobne, ale to je mimo rozsah tohoto textu. asi nikomu neuniklo, ze sice umime vyhodnocovat spoustu vyrazu, ale diky chybejici abstrakci ne vsechny, ale o dalsich hezkych konstruktech jako lambda nebo call/cc bude rec v dalsi kapitole.
zaverem, doufam ze to bylo aspon trochu srozumitelne a nekdo to docetl az na konec.Vytvořil(a) deda.jabko v 14. 03. 2007, 23:53
Přidat komentář