Помогите с программой для сканирования и распознавания книг!

Forums: 

Я совсем зеленая в деле делания электронных книг, так что не пинайте меня, пожалуйста, больно и, возможно, ногами, если поместила топик не туда, куда надо, но прочесав весь сайт и сделав то же самое на торрент.ру я не нашла ни одного упоминания о программе сканирования и распознавания текстов.

У меня есть уникальная книга Л.Салдадзе "Ибн Сина", и мне хотелось бы выложить ее здесь для общественности. Но когда я попробовала просканировать ее - вот тут и началось в колхозе утро. У меня есть программка OmniPage SE, бывшая в комплекте со сканером. Просканировав для пробы (никогда не делала этого раньше) одну страницу русского текста, пришла в ужас. Весь текст состоял из сплошных закорючек и букв латинского алфавита, отдаленно напоминающих русские. Пытаться вычитать ТАКОЕ - это то же самое, что перепечатать всю книгу руками.

Может, кто-нибудь даст совет - какой программой для сканирования пользоваться? Как настроить распознавание русского языка? Ну и все прочие соображения по теме принимаются с благодарностью.

Ну, на мой взгляд - FineReader 9.0 для распознавания - вне конкуренции. Для собственно сканирования - сейчас более компетентные товарищи подтянутся.

Ulenspiegel написал:
Ну, на мой взгляд - FineReader 9.0 для распознавания - вне конкуренции. Для собственно сканирования - сейчас более компетентные товарищи подтянутся.

Ну не знаю кто может быть компетентней вас :) но с утверждением согласен - он хоть и дрянь но наилучшая из имеющихся :)
Лично я в начале сканирую в PDF по двум причинам - во первых оставляю себе этот PDF , во вторых можно края порезать(crop) так как PDF умеет выполнять операции отдельно на четные и отдельно на не четные страницы.

Советую не сканировать, а фотографировать. Это десятикратно производительней, а при некотором навыке (свет, штатив) получается очень качественно. Мне хватает моего 5Мпикс фотоаппарата.

Digit написал:
при некотором навыке (свет, штатив) получается очень качественно

А без навыка, света и штатива (или других приспособ) - куча отрицательных эмоций и масса потерянного времени из-за массы ошибок распознавания...
Для новичка в деле сканежки, имхо, лучше начинать с того варианта, который без всяких особых навыков даст приемлимый результат )

Вот только ресурс затвора фотоаппарата совсем не безграничен. Да и установка света для качественной съемки - задача нетривиальная.

Lord KiRon написал:

Лично я в начале сканирую в PDF по двум причинам - во первых оставляю себе этот PDF , во вторых можно края порезать(crop) так как PDF умеет выполнять операции отдельно на четные и отдельно на не четные страницы.

Аргумент сильный, конечно ))
Кто тебе мешает собрать pdf в любой желаемый момент из имеющихся отдельных картинок-сканов (tiff, jpg, png)? И дальше кропить как угодно? ))

TaKir написал:

Аргумент сильный, конечно ))
Кто тебе мешает собрать pdf в любой желаемый момент из имеющихся отдельных картинок-сканов (tiff, jpg, png)? И дальше кропить как угодно? ))

А зачем мне трудиться :) его собирать если у меня сканер сразу умеет PDF делать , то есть плюст есть (хоть и не большие) а минусов никаких.

sonate10
Можно и 8 версию portable (без установки) скачать, например, тут:
http://www.filefactory.com/dlf/f/4b6398/b/6/h/7041f2cb7a8ed89ac3d7f01ec18a4788cb00c486/j/0/n/FR8_rar

Ну или по другим ссылкам в гугле.
http://www.google.ru/search?hl=ru&q=finereader+portable+%D1%81%D0%BA%D0%B0%D1%87%D0%B0%D1%82%D1%8C&lr=&aq=0&oq=finereader+portable

Видимо, OmniPage SE под английский язык заточена...

Ссылочка на FB8 померла :(
Отследили видно.

Кстати, а если кто FR9 portable поделится.... Я его обойму и к сердцу прижму.... :)

Ulenspiegel написал:
Кстати, а если кто FR9 portable поделится.... Я его обойму и к сердцу прижму.... :)

А чем он от "обычного" Про отличается ?

Видимо, тем, что установка не нужна.
Можно прям с флешки, например запускать и работать )

Ulenspiegel написал:
Кстати, а если кто FR9 portable поделится.... Я его обойму и к сердцу прижму.... :)

http://forum.ru-board.com/topic.cgi?forum=35&topic=43954&start=0&limit=1&m=2#1

P.S. Обниматься предпочитаю с женщинами :-)
P.P.S. На руборде нужно зарегистрироваться сначала, спам не шлют.

На ру-борде был?
ЗЫ. обойму вот в меня разряжать не надо ;)
ЗЫ2, пока курил опередили ))

sonate10 написал:
Просканировав для пробы (никогда не делала этого раньше) одну страницу русского текста, пришла в ужас. Весь текст состоял из сплошных закорючек и букв латинского алфавита, отдаленно напоминающих русские. Пытаться вычитать ТАКОЕ - это то же самое, что перепечатать всю книгу руками.
Может, кто-нибудь даст совет - какой программой для сканирования пользоваться? Как настроить распознавание русского языка? Ну и все прочие соображения по теме принимаются с благодарностью.

Просмотрите настройки своей программы в поисках пункта "язык оригинала" (или что-то аналогичное) и если там есть - то выставьте русский. Судя по описанию, прога пытается распознать текст, как аглицкий и ищет похожие символы в латинском алфавите.

Стандартом распознавание русского де факто стал ФайнРидер. Он легко ищется гуглом, при выборе всяко лучше предпочесть портэйбл версию, дабы не париться с ключами и кряками... ;)

Если религия не позволяет юзать варез или ещё по какой причине - есть бесплатный русский же Cuneiform, но он в работе заметно уступает ФайнРидеру (процентов эдак на 20, ежели на глазок...), т.е. будет больше ошибок и мусора после распознавания и придётся усерднее вычитывать.

Также немаловажен технический навык сканирования. Вот мой любимый мануал, который мне сильно облегчил жизнь, когда я на него наткнулся. Думаю и вам будет нелишним, хоть и немного устарел. Ну и вот на эти темы обратите внимание:
http://lib.rus.ec/node/135656
http://lib.rus.ec/node/128436
http://lib.rus.ec/node/131200

Спасибо, так и сделала, действительно, помогло. Использовала OmniPage. Я также скачала Fine reader, но еще не пробовала.

Ссылка на ru-board не совсем кашерна.
Там пересылают на dc.ru-board - требуется регистрация с приглашением.
Кто пригласит?

sem14 написал:
Ссылка на ru-board не совсем кашерна.

Все кошерно, читать нужно внимательнее... Там есть ссылка на рабочий файлообменник (на счет "кошерности" - не знаю, насколько кошерно сюда, открытым текстом, выкладывать). Ну да ладно:
http://www.mediafire.com/?i0byl9jz3zz
http://www.mediafire.com/?lczjbeum4n5

Большое спасибо!
Поясню - portable версии весьма кошерны в смысле хования нелицензионного софта от всяческих проверок. В некоторых местах и случаях - начинает иметь смысл.

SENS

Спасибо, сгрузил. распаковал, бросил на диск-он-ки.

Теперь бы еще Portable FBE.

X