О создании OCR-слоя в дежавю. Вопрос знатокам
Опубликовано вс, 14/04/2013 - 00:19 пользователем sad369
Forums: Есть одна проблема с работой DjvuOCR, может кто-то знает решение?
|
Вход на сайтПоиск по блогам и форумамUser menuПоследние комментарии
tvv RE:DNS 2 дня
DGOBLEK RE:Подайте бедному копеечку на книжку с литреса... 6 часов sem14 RE:«Не забыть бы тогда, не простить бы и не потерять!»-2 ... 3 дня sem14 RE:Серия "Очень прикольная книга", издательство Азбука-классика 4 дня sem14 RE:Серия "Я познаю мир" издательства "АСТ, Астрель, Олимп",... 4 дня larin RE:Заблокирован 1 неделя alexk RE:Прошу переформатировать, распознать, etc... 2 недели konst1 RE:Серия «Интеллектуальный детектив» изд-ва АСТ 3 недели Larisa_F RE:Серия книг «Судьбы книг» издательства «Книга» 3 недели fixel RE:Пропал абонемент 4 недели sem14 RE:Книжная серия "Жизнь в искусстве" издательство "Искусство"... 1 месяц sibkron RE:"100 славянских романов", серия изд.-ва "Центр книги... 1 месяц Larisa_F RE:Серия "Новые сказочные повести" издательство "Самовар" ... 2 месяца sem14 RE:Серия "Символы времени" издательства "Аграф" 2 месяца tvv RE:faq brainstorm =) 2 месяца Larisa_F RE:Серия "Что есть что" издательства "Слово"(чего не хватает) 2 месяца larin RE:абонемент не обновлен 2 месяца sem14 RE:За иллюминатором (серия) - чего не хватает? 3 месяца Впечатления о книгах
ejik.v про Гилмор: Книжный магазин «Булочка с корицей» (Современные любовные романы)
14 04 Незатейливый сюжет. Особых восторгов не вызывает, но неплохо читается, чтобы отвлечься от проблем и пасмурной погоды. Оценка 4
Олег Макаров. про Таксист
13 04 К сожалению, бросил на 33% второй книги. Чем дальше, тем более нудно, с постоянными повторами, периодической потерей логики. Идея отличная. Но реализацию её автор не вытянул.
francuzik про Москаленко: Маг. Книга 1 [СИ] (Фэнтези, Боевик, Самиздат, сетевая литература)
12 04 Не советую. Полный отстой. До этого автор писал более менее на троечку. Тут же не знаю что и думать. Может случилось что? Оценка: нечитаемо
Дей про Мастер Трав
12 04 На данный момент есть 5 книг. Я так-то предпочитаю подобные произведения для расслабления: атмосфера PW, WOW, вот это копание травок, рост в навыках. И совершенно не хочется, блин, превозмогания. А здесь ГГ буквально утыкан ………
mysevra про Толстой: Семейное счастие (Русская классическая проза)
12 04 Уф. Столько слышала восторгов об этой повести: ах, мол, история удивительной трансформации любви. Как по мне, неравный брак: мужчина лет на 20 старше жены, со своими сложившимися взглядами на жизнь, лепит из ничего не видевшей ……… Оценка: хорошо
mysevra про Твардовский: Василий Тёркин (О войне, Поэма, эпическая поэзия)
12 04 Интересный слог, легко читается и западает в память. Смесь нарочитой простоты и оптимизма – убойное сочетание! Правда, со временем эта простота и однообразнось приедаются, но уважение к автору остаётся. Оценка: отлично!
mysevra про Баркер: Каньон Холодных Сердец [litres] (Ужасы, Мистика)
12 04 Если бы немного ускорить процесс… Первая часть, совсем крошечная, как бы вступительная, была интригующей, а дальше хотелось пролистывать. Вроде бы и ладно написано, и подробности в тему, просто особенности склок и страданий ……… Оценка: неплохо
Skyns71 про Поселягин: На просторах неизвестной планеты [litres] (Боевая фантастика, Попаданцы)
11 04 Какой-то жутко беспомощный, коряво написанный текст - словно сочинение не самого умелого школьника... Ну как такое ухитрились издать? Вероятно, сработала немотивированая злоба автора в адрес американцев, лезущая аж на третьей странице. Оценка: нечитаемо
Евгений11112 про Иторр: Повелитель Теней [= Книга Теней] (Фэнтези)
11 04 Прочитал очень давно, до сих пор помню, а значит неплохо. Такое впечатление, что написано было под приходом. Оценка: отлично!
Oleg68 про Иванов: Тобол. Много званых [litres] (Современная проза, Исторические приключения)
10 04 Хорошая книга, но "Сердце Пармы" и "Золото бунта, или Вниз по реке теснин" мне понравились больше. Оценка: хорошо
Дей про Сластин: Кодекс Практика: Страница 1 (Героическая фантастика, Фэнтези, Попаданцы, ЛитРПГ, Самиздат, сетевая литература)
10 04 Мало кто любит читать о героях, которым всё само падает в руки. Но когда ГГ такой нытик, растяпа и дурак, как этот, читать не хочется ещё больше. Реально, всю книгу от только ноет и косячит, косячит и ноет. Оценка: плохо
Oleg68 про Эндрюс: Икар [Icarus ru] (Триллер)
07 04 Отличный триллер. В напряжении держит до последних страниц. Очень неожиданный главный злодей и непредсказуемый финал. Оценка: отлично! |
Отв: О создании OCR-слоя в дежавю. Вопрос знатокам
На этом сайте: http://djvu-soft.narod.ru/index.htm пробовали пошарится, вопросы позадавать?
На нём спецов по работе с форматом DjVu гораздо больше, чем здесь.
Отв: О создании OCR-слоя в дежавю. Вопрос знатокам
Судя по числу дежавю книг, появившихся здесь за последний год, здесь тоже книгоделов хватает. Но, разумеется я задал тот же вопрос на специализированном форуме у Ершова.
Отв: О создании OCR-слоя в дежавю. Вопрос знатокам
занимаюсь дежавюками, но с таким не сталкивался и не заморачивался, поскольку встроенная в djvu express editor оцр от iris коряво понимает русский язык, а ежли через файнридер распознавать - нафига тогда джвю? :D сразу уж тогда в фб2
Отв: О создании OCR-слоя в дежавю. Вопрос знатокам
Отв: О создании OCR-слоя в дежавю. Вопрос знатокам
Что-то у меня туго с объединением. Я использую сильно облегченную версию DEE, кажется, там нет этой функции. Если я правильно понял, то полная версия может объединить графику одного файла с текстовым слоем другого?
OCR от DEE использовать смысла нет. Проще заново весь файл через файнридер прогнать. Но проблема в том, что в файле №1 уже был спеллчек сделан перед сохранением в дежавю. Терять такую работу это не выход.
Отв: О создании OCR-слоя в дежавю. Вопрос знатокам
Отв: О создании OCR-слоя в дежавю. Вопрос знатокам
Может поможет эта тема?
Отв: О создании OCR-слоя в дежавю. Вопрос знатокам
Совет господина Zadd
успешно сработал! Премного благодарен! Хотя немного муторно по одной странице косяки вычищать, но другого способа видимо нет. Правда распознавал "чистовую" версию с черно-белым текстом, а как повел бы себя DjvuOCR на этот раз не скажу. Обошелся файнридеровскими дежавюшками (несколько файлов по одной странице), которые прикрепил к итоговому файлу.
Небольшая поправка: раньше делали. Сейчас это уже моветон.
Upd. По здравому размышлению хочу добавить, что проблема разрешена лишь частично. Все же примерно 60 страниц (из 560) окажутся с новым, не таким качественно исправленным текстовыи слоем, каким он был после спеллчека Голмы1. Так что жалоба на работу djvuOCR остается в силе.