Prieš darant atpažinimą su FineReader knygų paveiksliukus verta apdoroti nemokama programa ScanTailor. Ją atsisiųsti galima iš čia. Mac kompiuteriams skirta verisja yra čia: https://code.google.com/archive/p/scantailor-osx/
Tai verta padaryti, nes:
Išvalomos šiukšlės fone, kraštuose ir pan – FineReader atpažindamas tekstą palieka mažiau neaiškų simbolių
Puslapių pasvirimas ScanTailore ištiesinamas geriau nei FineReaderyje.
Visi puslapiai padaromi vienodo dydžio
Programiškai padidinama raiška iki 600 DPI (kartu atsisakant pilkų atspalvių), todėl FineReader palieka mažiau neaiškių simbolių (ypač jei šriftas mažas)
Visi puslapiai padaromi juodai/balti kaip ir normalioje knygoje. Tokį PDF failą jau galima normaliai skaityti planšetėje (tablet), o kartu sumažėja PDF failo dydis.

Aišku tai turi ir šiek tiek neigiamų pasekmių, nes tam papildomai gaištamas laikas.
Dėl geresnio atpažinimo rezultato galima šiek tiek padirbėti ir su ScanTailoru.

Taigi pasileidžiat Scantailora, darote naują projektą, sudedate savo JPG paveikslėlius. Jei reikės paprašys Fix DPI – tada pasirenkat 300 dpi.
Daug nesigilindami į keistą ScanTailor vartotojo interfeisą, pasirenkate Margins ir paspaudziat ant jo esanti Play mygtuką:
Scantailor
Dabar Scantailoras analizuoja knygos paveikslelius. Ramiai laukiate.
Pasirenkate Select Content. Dešiniam apatiniame kampe spaudžiate surūšiavimą pagal “Width”. Einate į apačią. Ten Scantailorui galbūt nepavyko gerai atpažinti naudingo turinio. Pataisote Content box, kad apimtų tik raides jį sumažindami, nes aprastai taip būna dėl kokios skanavimo šiukšlės. Peržiūrimi ir kiti puslapiai apačioje, kol matote kad Scantailoras apima tik spausdintą tekstą ar mėlynas plotas yra labai arti jo. Po to važiuojame į viršų ir peržiūrime siauriausius lapus.
scantailor1
Taip pat patikriname ir visus puslapius surūšiavę pagal “Height”. Čia kartais Scantailoras nepaima puslapių numerių iš apačios.
Pabagę su “Content“, vėl pasirenkate Margins. Marginus galima padidinti iki 10 mm iš visų pusių, spaudžiate Apply -> All pages. Priklausomai nuo knygos puslapius lygiuojame pagal puslapio numerį į viršų ar į apačia (jei puslapio numeriai viršuje – renkatė viršų, jei apačioje – apačią).
Scantailor2
Vel surūšiuojate pagal aukštį, ir viršutinius puslapius patikrinate kad puslapiai atitiktų originalų knygos layoutą. Kai kuriuos puslapius reikia Centruoti, kai kuriuos lygiuoti pagal viršų.

Viršelių puslapiams visus Margins reitų nustatyti į 0, ir Nuimti varnelę nuo “Match size with other pages“ checkboxo. Aišku tokiu atveju Content turi apimti pilnai visą viršelį. Viršeliai tada gaunasi kitokio dydžio nei visi likę puslapiai, bet PDFe to net nesimatys.

Pagaliau einate i Output. Jei skano kokybė gera verta saugoti viską Black/White režime su raiška 600 DPI t.y. paliekate kas nustatyta. Virseliams ir paveikslėliu puslapiams paliekate Color/Greyscale ir raišką 300 DPI. Jei knygoje yra paveiksliukų, tiems puslapiams reikia rankiniu būdu pasirinkti Mixed output režimą arba tiems puslapiams taikyti Color režimą.
ScanTailor projektą dėl visa ko išsaugome
Einate į priekinį viršelį ir ant Output spaudžiate Play mygtuka.
Viskas.
Dabar Scantailoras gamina jums naujus juodai baltus išvalytus TIFF paveiksliukus out kataloge, kuriuos galite atsidaryti su FineReaderiu.

Parašykite komentarą

Įveskite savo duomenis žemiau arba prisijunkite per socialinį tinklą:

WordPress.com Logo

Jūs komentuojate naudodamiesi savo WordPress.com paskyra. Atsijungti /  Pakeisti )

Google photo

Jūs komentuojate naudodamiesi savo Google paskyra. Atsijungti /  Pakeisti )

Twitter picture

Jūs komentuojate naudodamiesi savo Twitter paskyra. Atsijungti /  Pakeisti )

Facebook photo

Jūs komentuojate naudodamiesi savo Facebook paskyra. Atsijungti /  Pakeisti )

Connecting to %s

%d bloggers like this: