Dnes je 6. 7. 2020
Zpravodajství
O projektu

Dobrá zpráva pro čtenáře jidiš: program Jochre

29. 11. 2019, rjw |  Věda a technika

AMHERST – Badatelé v oblasti jidiš literatury mluví o průlomu ve svém oboru: Veškerý obsah digitalizované knihovny Centra jidiš knihy (Yiddish Book Center ; YBC), která byla zatím přístupná jen v PDF, je nyní k dispozici k plnému vyhledávání. – To znamená, že v celé zásobě knih můžete najít každé slovo! Umožňuje to program Jochre (zkr. Java Optical Character Recognition), jehož otcem je Assaf Urieli (píšící též pod pseudonymem Moyshele Rosencrantz). Lingvista a programátor, který pracuje mimo jiné pro francouzský vesmírný program CNS na něm pracoval od roku 2009. Když objevil knihovnu YBC, rozhodl se ji zpřístupnit plnému vyhledávání a v prvotním optimismu doufal, že se mu to podaří za několik měsíců. S jidiš tisky to nebylo tak jednoduché, takže zpřístupnění 97% mu trvalo „celé“ dva roky. – A dalších několik let trvala práce na zbylých třech procentech.

Program Jochre a jeho tvůrce

Program nabídl YBC zdarma, s jedinou podmínkou: že jej YBC poskytne zdarma všem dalším institucím a archivům, pracujícím s jidiš texty. A tak je na stránkách YBC přístupná beta-verze. Co je to za člověka, který – místo aby se věnoval lukrativním zakázkám – věnuje tolik času a úsilí jazyku, který mnozí považují za „prostě vymírající“? Odpovědí je zájem o rodinné kořeny, který se v něm po třicítce probudil: Assaf Urieli se narodil v Jihoafrické republice, dětství strávil v Izraeli, výpočetní techniku studoval v USA, nějaký čas pobýval v Irsku a nyní žije ve francouzských Pyrenejích. – Jedna z jeho babiček však pocházela z Litvy, z města Šiauliai (v jidiš Šavl). Když se Urieli začetl do pamětní knihy o této druhé největší litevské komunitě (v r. 1939 to bylo 8000 židovských obyvatel) i Šiauliaiském ghettu zřízeném v roce 1941 nacisty, říkal si, oč lépe by se mu s knihou pracovalo, kdyby v ní mohl vyhledávat jména jednotlivých míst a rodin. – A tak se pomalu zrodil plán, nenechat to jen tak… vždyť jeho oborem je počítačová lingvistika.

Jak Jochre pracuje?

V době, kdy Urieli přemýšlel, jak na to, už samozřejmě existovaly OCR (Optical Character Recognition) programy, schopné rozpoznat písmena v tištěném textu, i slovo, které dávají dohromady. Byly ale uzpůsobeny jazykům, používajícím latinku, primárně angličtině. Jidiš je však psaná v hebrejské alefbetě. A nejen to: řada slov má více variant psaní, v tiscích před rokem 1900 je často těžké rozpoznat některá písmena (např. samech – ס od koncového mem – ם nebo koncové kaf – ך od reš ר). A dodejme, že některé tisky mají pravopisné chyby a že v chudých tiskárnách si sazeči občas vypomohli podobným písmenem… A tak nestačilo naučit Jochreho jenom standardizovanou jidiš, jak ji známe z dnešních učebnic a slovníků: musel zvládnout i starší verze, místní výrazy a zahrnout do tezauru i jejich skloňování a časování. Kdo si chce přiblížit, co to znamenalo, ať si představí počítačový slovník, schopný nejen rozpoznat ve starém tisku slova jako „ondyno“, „medle“ a „item“, ale i všechny místní a nářeční podoby slov, objevující se v české literatuře… od „bát se nehumíme, my jsme Domažlíci“ přes „už ti pučíja parohy” po „stavila se matriálistovi pro petrolku“. Možnosti, které Jochre lingvistům otevírá, jsou takřka nekonečné. Od nynějška mohou sledovat mnohem podrobněji vývoj tohoto jazyka včetně vlivů a třeba zaniklých slov. Zároveň mají zcela nový pohled na to, o čem se v jidiš vlastně psalo – například jaká (poltická, náboženská, kulturní) témata jsou zmiňována v literatuře takříkajíc „mezi řečí“, tam, kde by je člověk běžně nehledal.

Další plány; program nepomáhá jen jidiš

Předseda YBC Aaron Lansky doufá, že se využití Mokrého nezastaví u jeho instituce. Jeho plánem do nejbližší budoucnosti je vytvoření velké elektronické jidiš knihovny, propojující sbírky YBC a Izraelské národní knihovny; samozřejmě, s plně vyhledavatelnými texty. Eddy Portnoy, odbornice na židovskou lidovou kulturu z institutu pro židovská studia YIVO, zase sní o plném zpřístupnění jidiš tisku – archiválií, časopisů i novin. Jidiš ovšem není jediným jazykem, pro který byl Jochre využit. Urieli jej už aplikoval na okcitánštinu a alemánštinu, jež patří k dalším Urieliho zájmům. – A pokud vše půjde dobře, nemuselo by zůstat jen u nich. Na hodnocení, zda se zlepší situace jidiš na úrovni běžného zájmu a užívání, je zatím brzy. Každopádně, odborníci jako Eddy Portnoy tvrdí, že ve zkoumání tohoto jazyka právě nastala revoluce…