Вопрос-консультация у распознающих (ВАЖНО)
Опубликовано ср, 23/05/2012 - 13:56 пользователем soshial
Forums: Уважаемые сканирующие и распознающие. У нас есть крупная ценная научная монография, которая не была опубликована. Однако мы не знаем с какими параметрами нужно сканировать, чтобы распознавание прошло как можно удачнее и исправлять вручную нужно было как можно меньше. Могу ли я попросить вас дать своё экспертное мнение (как людей, искушенных именно в распознавании текстов), какой из испробованных режимов наиболее подходит для возможного последующего распознавания, и если все они плохи, то что следует поменять в настройках сканирования, чтобы вытянуть максимально возможное? Речь идет в данный момент не о восприятии при чтении, а исключительно о наилучшем возможном распознавании. Я уделяю выбору оптимального режима столько внимания, поскольку на сканирование трех томов уйдет просто уйма времени, и переделывать это из-за неоптимального режима уже будет невозможно. Вот параметры, которые менялись при сканировании: Что вы могли бы посоветовать улучшить?
|
Вход на сайтПоиск по блогам и форумамUser menuПоследние комментарии
Леди Стервa RE:Подайте бедному копеечку на книжку с литреса... 5 часов
Саша из Киева RE:Как бы с этим побороться и побороть? 10 часов medved RE:Список современных французских писателей? 1 день etorus2008 RE:Отв: Помогите найти книгу по описанию 5 дней lemma7 RE:Чёрный нимб и другие истории, исполненные неизъяснимого ужаса 6 дней Wedmak RE:Помогите найти!.. #2 1 неделя sem14 RE:Координация сканирования и вычитки 1 неделя babajga RE:Кто сможет раздобыть и оцифровать нужные мне книги? 2 недели Isais RE:Мои открытия 2 недели kopak RE:О группе Дятлова. О той самой, того самого... 2 недели A5. RE:Не присылает пароль на почту 3 недели babajga RE:Плюмаж 1 месяц babajga RE:Блошкинс и Фрю. Опасное путешествие 1 месяц alexk RE:Багрепорт - 2 1 месяц babajga RE:Удивленная сова 1 месяц Larisa_F RE:Серия «Квадрат» издательства «Текст» 1 месяц Aleks_Sim RE:Беженцы с Флибусты 1 месяц edvud RE:Прошу переформатировать, распознать, etc... 1 месяц Впечатления о книгах
tvv про Fārlejs: Melnis [lv] (Детские приключения)
06 05 Автор книги Уолтер Фарли https://en.wikipedia.org/wiki/Walter_Farley
tvv про Kordons: Musons jeb Baltais tlģeris [lv] (Детская литература: прочее)
06 05 Автор этой книги https://de.wikipedia.org/wiki/Klaus_Kordon
Лысенко Владимир Андреевич про Москаленко: Юный бастард. Книга третья [СИ] (Боевая фантастика, Городское фэнтези, Самиздат, сетевая литература)
06 05 Книга понравилась, читается легко, жду продолжения. Оценка: отлично!
tvv про Atis: Mans dzīves rīts [lv] (Детская проза)
06 05 Автор этой книги https://ru.wikipedia.org/wiki/Доку,_Атис
tvv про Мартели: Apaļā galda bruņinieki [lv] (Детская проза)
06 05 Автор книги Стелио Мартелли, он же Мино Милани https://ru.wikipedia.org/wiki/Милани,_Мино
tvv про Fītinghofa: Aizmežu bārenīši [lv] (Детская проза)
06 05 Автор этой книги Лаура Фитингхофф https://ru.wikipedia.org/wiki/Фитингхофф,_Лаура
tvv про Lūisa: Baltais Delfīns [lv] (Детская проза)
06 05 Автор книги Джилл Льюис (Jill Lewis), точнее Jill Walkinton и Alison Lewis https://jilllewisbooks.com/
tvv про Blanšets: Misis Ročestere [lv] (Историческая проза)
06 05 Имя автора этой книги - Warwick Blanchett
tvv про Šveikerts: Viņš pasūtīja sarkanvīnu [lv] (Историческая проза)
06 05 Этот автор https://de.wikipedia.org/wiki/Walter_Karl_Schweickert
tvv про Kosovica: Nakts Jeruzalemē [lv] (Современная проза)
06 05 Автор этой книги Биргите Косович (Birgithe Kosovic) https://pl.spb.ru/lib/projects/pages/readers-2012/Authors/Danmark/kosovic.html https://en.wikipedia.org/wiki/Birgithe_Kosovic
tvv про Zūdermanis: Reiz bija. Rūpju māte [lv] (Историческая проза)
05 05 Автор этой книги Герман Зудерман http://az.lib.ru/z/zuderman_g/ https://en.wikipedia.org/wiki/Hermann_Sudermann |
Отв: Вопрос-консультация у распознающих (ВАЖНО)
Чисто визуально, чуть темнее, чем вариант 4 и чуть светлее, чем вариант 5 было бы оптимально. Но текст настолько плох, что хрен редьки не слаще. Текст ужасен. Если он весь такой, то лучше ручной набор. Потому что количество ошибок зашкаливает разумные пределы. Текст с такими ручными правками сканить под распознавание практически не имеет смысла.
Определить параметры сканирования проще всего самостоятельно, распознав несколько вариантов, и сравнив количество выявленных Файнридером ошибок в разных случаях.
А бояться отсканировать с неидеальными параметрами - не надо. Если только это не крайние параметры - очень-очень светлый, или очень-очень темный - то после сканирования их можно будет подправить пакетной обработкой. Например, в фотошопе.
Отв: Вопрос-консультация у распознающих (ВАЖНО)
Очень хорошо бывает прогнать сканы через Букресторер. Для таких сканов он мне очень пригождается.
Отв: Вопрос-консультация у распознающих (ВАЖНО)
а что это за программа и для чего она нужна?
Отв: Вопрос-консультация у распознающих (ВАЖНО)
Посмотрите здесь:
http://lib.rus.ec/node/394079
Отв: Вопрос-консультация у распознающих (ВАЖНО)
либо делать из него книгу в пдф или дежавю. руками такое набрать это ж каторжный труд - каждую букву сверять с бумагой
Отв: Вопрос-консультация у распознающих (ВАЖНО)