Kuidas saab raamat arvutisse

Võib juhtuda selline lugu, et raamatukogus on mõni väärt raamat, mida on kindlasti tarvis lugeda, kuid seda ei saa seal õigel ajal kätte. Või on vaja mõni vana raamat teha arvutis loetavaks, et saaks läpakast seda rannas lugeda vajaduse korral.

Mida siis teha? Katsetame. Tarvilikud on järgnevad asjad.

1. raamat

2. aparatuur

3. fotoaparaat

4. arvuti

5. tarkvara

6. aeg

1.Raamat on kõige olulisem aga selle hankimisest ma siinkohal ei kirjuta, selle hankimise oskus on eelduseks asjaga tegelemisele.

2. Aparatuur on päris huvitav. See tuleb valmis ehitada. Meie kasutasime selleks teipi, kääre, pappkasti, puust nõuderesti, lampi. Teip tuli kotist, käärid ja nõuderest leidusid kummutis, lamp oli laual ja pappkast tuli supermarketist. Vot nii saab neid asju hankida. Kokku pandud aparatuur nägi välja selline:

3. Fotoaparaat. Fotoaparaat võib olla suhteliselt suvaline uuema ajastu digikaamera. Abiks on kindlasti pult kiireks piltide klõpsimiseks. Põnev osa on fotoka kinnitamine aparatuuri külge, pisikest fotokat saab kinnitada teibiga, suuremale on kasulik omada statiivi. Kuna meie statiiv viibis kaugel, kasutasime papist alust, mille sisse sai lõigatud objektiivikujuline auk. Aparatuur ja fotoaparaat töös näeb välja selline:

4. Arvuti peab kindlasti olema.

5. Arvutis peab olema tarkvara. Kuna minul olevas arvutis jookseb Ubuntu Linux, siis kasutasin vastavat tarkvara. Hea on omada mingit kavalat vahendit, et pildid ilusti automaatselt ümber nimetada, et neid õieti järjestada. Selleks on Thunar filemanageris vahend olemas. Järgmisena tuleb kasutusele väärt tööriist Scan Taylor, mis teeb pildid mustvalgeks tekstiks. Pdfiks teeb need aga gscan2pdf. Viimane oskab kasutada ka OCR tarkvara, ning tesseract-ocr abil sain raamatu sisu ka enamvähem otsitavaks. Lugemiseks minu katsetuse puhul veel päriselt ei piisanud.

Uuendus: tegelikult ocropuse abil OCR tegemine andis juba päris loetava tulemuse. Gscan2pdf suudab ka seda tarkvara kasutada ,kui viimane on installeritud.

6. Kogu selle asja jaoks on vaja aega. Ühe korraliku kahetulbalise tekstiga raamatu jaoks läheb 1,5 tundi kindlasti. Lihtsama raamatu, hea aparatuuri ja fotoka ühenduse ja korraliku kadreeringu puhul on võimalik hilisemat töökulu arvutis kõvasti optimeerida.

Ja tegelikult – vanade raamatute digitaliseerimine on väärt tegevus.

This entry was posted in Uudis. Bookmark the permalink.

Leave a Reply

Your email address will not be published. Required fields are marked *