Вы здесьКак создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
Опубликовано вс, 14/12/2008 - 04:53 пользователем Psychedelic
Цитата:
Если нужно, я могу детально составить пошаговый шаблон, как конвертировать pdf и djvu с распознаванием в fb2. Как конверитировать картинки оттуда, сжатыми по максимуму в png без визуальной потери качества, причем конвертировать в пакетной обработке. точнее как это сделать относительно быстро и качественно. Описал. Довольно много получилось. Жду комментариев.
|
Вход на сайтПоиск по блогам и форумамUser menuПоследние комментарии
PipboyD RE:Подайте бедному копеечку на книжку с литреса... 4 дня
sem14 RE:Михаил Юрьевич Берг - Андеграунд. Итоги. Ревизия_5 1 неделя TaKir RE:Валерия Сергеевна Черепенчук А. Н. Николаева - Мифы... 1 неделя Oleg V.Cat RE:B343695 Александр. Книга 1 1 неделя Isais RE:Калибрятина/Самиздатина 1 неделя md2k15 RE:Относительно Вархаммер 40 000 1 неделя Oleg V.Cat RE:Беженцы с Флибусты 2 недели tvnic RE:"Коллектив авторов" 2 недели SergL197 RE:Регистрация 2 недели ejik.v RE:Viva Stiver! 2 недели RedRoses3 RE:Флибуста конец? 2 недели Ldrozd RE:Сандра Ньюмен - Джулия [1984] 4 недели konst1 RE: Банда Рафаэля 4 недели Isais RE:Лоренс Даррелл - Горькие лимоны 4 недели Isais RE:B157704 Черепаха Киргала 1 месяц sem14 RE:Литературная премия «Ясная Поляна» 1 месяц blahblahblah2024 RE:Сборник - Советская морская новелла. Том 1 1 месяц Isais RE:Обновление FictionBook Editor 1 месяц Впечатления о книгах
Skyns71 про Рясной: Бандиты и психи (Крутой детектив, Биографии и Мемуары, Спецслужбы)
10 11 Вот оно как... Если верить своим глазам - эти ребята лупят безоружных демонстрантов, не различая мужчин и женщин. А открываешь книгу - оп-ля, оказывается - преступников ловят!
tvv про Михайлов: Без пощады. Книга 3 [СИ] (Боевая фантастика, Космическая фантастика, Самиздат, сетевая литература)
10 11 2 vudy: книга полностью, проверьте на АТ.
vudy про Михайлов: Без пощады. Книга 3 [СИ] (Боевая фантастика, Космическая фантастика, Самиздат, сетевая литература)
10 11 По: "Глава 9"" - и кому надо это счастье ?
badbag про Тимофеев: Честерфилд (Боевая фантастика, Самиздат, сетевая литература)
10 11 Автор пишет читабельно, но не шибко умный и своими попытками сумничать, только смешит, в логику не умеет абсолютно, поэтому у него не фантастика получается, а сказки для подростков. Оценка: плохо
дядя_Андрей про Агония
10 11 Что ж, автор злобно ненавидит Андропова и КГБ, вообще, обвиняя их в подготовке к развалу СССР и, одновременно, страстно мастурбирует на МВД и лично "Великого Министра" (так в тексте, кроме шуток) Николая Анисимовича Щёлокова. ………
gruin про Видум: Не ДРД единой (Альтернативная история, Фэнтези, Самиздат, сетевая литература)
08 11 Сения не сказать отличная, но читать можно. Многовато рассуждений описаний. Оценка: неплохо
gruin про Прядеев: Позывной «Курсант» (Альтернативная история, Попаданцы)
08 11 По идее последняя в серии, а не первая. В остальных о предшестаующих событиях в детдоме, они хуже. А эта вполне читабельна. Но только та, которая "Курсант. На Берлин", на флибусте Оценка: неплохо
obivatel про Назипов: Ингвар. Книга 1 [СИ] (Боевая фантастика, Космическая фантастика, Самиздат, сетевая литература)
08 11 ГГ классический лох (человек, не умеющий «устроиться» и приспособиться к изменениям жизни и в результате обычно небогатый), а лох это судьба. Какие бы плюшки ему вселенная ни накидала, он про профукает, пролопухает, про"№%т. ……… Оценка: нечитаемо
Oleg68 про Кобен: Нарушитель сделки [Deal Breaker ru] (Крутой детектив)
08 11 Хороший триллер- детектив. Автор, как всегда на высоте. Буду продолжать читать серию. Оценка: отлично!
Isais про Берд: Тошнит от колец [Bored of The Rings ru] (Юмористическое фэнтези)
07 11 Поверьте, после этого реально тошнит от колец — после той работы, что пришлось проделать для минимальной удобопонятности этого нестареющего образчика студенческого юмора. Оценка: нечитаемо
Isais про Капельгородская: Зарубежный детектив [энциклопедия] (Энциклопедии, Литературоведение)
07 11 Когда-то покупал эту книгу (печатную) для работы и пользовался ее информацией без претензий и с полным доверием, но только лет через 10, когда появился Тырнет, узнал, что в ней есть довольно много ошибочных сведений, в основном ……… Оценка: хорошо
Barbud про Савинков: Николай I Освободитель. Книга 8 [СИ] (Альтернативная история, Попаданцы, Самиздат, сетевая литература)
07 11 Кое-как, без интереса и по диагонали листая через десяток страниц, домучил восьмую часть. Девятую, наверное, и начинать читать не буду - опус все скучней и скучней. Кстати, судя по последним строкам, автор смылся из Киева ……… Оценка: нечитаемо |
Комментарии
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
Большая работа. Респект!
Для работы с картинками из уже готового fb2-файла не обязательно переносить его в BD.
В FBE есть опция "Экспорт в HTML". Результат тот же: собственно файл и папка с картинками.
Очень полезной оказалась для меня информация по массовой обработке картинок в IrfanView.
Немного смутила "галочка" в пункте "Convert to greyscale". Если картинки цветные, то получается, что они становятся черно-белыми, или я что-то не так поняла?
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
Да, я ж там написал что если картинки чернобелые. Для цветных нужно убрать эту галку, и поставить не 8 цветов, а 256 и более. Там это тоже написано.
С greyScale картинки получаются более качественные, и меньше размером чем если сохранить чб в цветном.
Хех. А ведь потом все равно придется в BD вставлять (а там он наверняка опять переформатирует). А так сразу, меняем и сохраняем в fb2, с сохранением исходного форматирования.
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
спасибо
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
Прочитал рекомендации.
Всё, в общем-то, правильно, но мне не нравится упор на использование Book Designer'a. Эта программа хороша своей всеядностью и годится для преобразования почти из всех форматов в почти все, но вот FB2 она делает довольно своеобразные, которые требуют слишком большой доводки. К тоже BD не поддерживает стиль 'cite', который бывает очень нужен.
Мой опыт показывает, что более удобно делать всю послеOCRную работу в Word'е, также сделать стилевую разметку, а затем конвертировать в FB2 посредством преобразования 'wml2fb.xsl', который входит в комплект doc2fb (В Word делаем 'Сохранить как XML…', 'Применить преобразование…', выбираем wml2fb.xsl и всё. Остается только переименовать .XML в .FB2).
Картинки сохраняются в том виде как были, сноски (Word'овские!) делаются сносками FB2, заголовки до 4-го уровня расставляются корректно. Стили типа 'cite' остаются на местах. (Стиль 'epigraph' почему-то заменяется на 'stanza'). А вот раздел 'Description' пуст. Нужно полностью заполнить ручками. Ну и другая обработка тоже не помешает.
Если же нужно оптимизировать картинки, BookDesigner тоже не очень нужен, так как в FictionBook Editor v2.0 (как и в FB Writer) есть скрипты для работы с иллюстрациями, например просто сохранить все картинки из FB2 в текущую папочку. Потом можно делать с ними, всё что нужно, и вернуть на родину.
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
Вы акцентировали внимание на слишком да еще и большой доводки
Какие например? У меня особых проблем с ним не было. Иногда файл получается невалидный, но это редко, да и fb2 подправить не сложно.
А как же с этим скриптом сделать главы, подглавы и вложенные секции? Как скрипт разберет что куда вложено и что есть title, а что есть subtitle?
В fbe их делать не реально.
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
В FBE это делается элементарно и без всяких скриптов :)
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
Я уже писал, что заголовки до 4-го уровня wml2fb.xsl расставляет корректно. Он все будут title с правильным уровнем вложенности. А subtitle можно и в FBE расставить. Кроме того в FBE (версии 2.0) есть чудный инструмент, расположенный под структурой документа. C помощью этих стрелочек легко корректируется вложенность секций.
Но я не и настаиваю. Различных инструментов много, так что каждый может использовать то, что ему нравится больше. Лишь бы был хороший результат!
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
+101
Пару раз встречал идеальные документы сделанные в Any2fb2!
Действительно - есть... а я его и не заметил (черт знает, кем помрешь)
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
Поддерживает. Выделить нужное, + правый клик--->cite.
А в верхнем меню cite нет, факт...
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
Да, но дело в том, что в исходном файле этот стиль УЖЕ есть, а при переносе в BD исчезает, а еще раз проделывать разметку не хочется.
Когда таких фрагментов мало - не страшно, а если их пол книги?
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
Вопрос по BD & FBD
Задавал в параллельной ветке, но тут уместней.
Перейдя на Висту, обнаружил, что ни та ни другая программа не хочет работать в этой ОС. Ошибка какого-то файла .ocx
Если эта задача решаема, то что нужно сделать.
Попытки установки ее в корень и в другой раздел диска ни к чему не привели. Файл нашел в сети, скачал, пихал в разные папки (и в виндовз и в папку с программой) - безрезультатно.
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
Файл поместить в system32, затем его зарегистрировать - Пуск - Выполнить - regsvr32 имя_файла.ocx. Во всяком случае так в ХР. В Висте, кажется, тоже самое.
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
Попробовал. Бесполезно. система при попытке регистрации не может найти файл ни в виндовз ни в систем32 папке.
Ошибка же выглядит так: этот компонент DHTMLED.OCX (и еще один .осх файл) больше не входит в состав виндовз.
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
Да выкиньте нафиг эту висту. Это тормоз всей системы. В начале следущего года (да 2009) выйдет Windows 7, говорят она будет в разы быстрее этого тормоза.
Поставьте лучше XP x64 Pro - в данное время это наилучший вариант.
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
Я не спрашивал, что мне делать с вистой. Мне интересно - есть ли у существующего конкретного софта возможность работать в этой среде.
Если есть - то как этого добиться.
Если нет - не нужно сваливать с больной головы ФБД и БД на относительно здоровую голову висты.
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
Относительно здоровую - это сильно натянуто. Сами Microsoft признала что данная версия неудачная по производительности и оптимизации компонент. А также масса пользователей. Мало кто хотел брать Висту, пока ее не стали навязывать принудительно с ноутбуками например и не сделали агрессивную рекламу. Я просто советую. Игры на ней идут также с микрорывками, по сравнению с XP на одной и той же конфигурации.
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
Спасибо за советы, я поначалу тоже хотел ее снести, ибо раздражала, как, видимо, все новое и непривычное раздражает. а потом то ли я к ней привык, то ли она под меня приспособилась, и как бы желание уйти на ХР у меня пропало.
В игры я не играю, бук мой от нее не тормозит несмотря на аэро фейс и все анимации (поотключал кучу ненужных сервисов). Удобно в ней все сделано. Одни только Избранные папки слева в окне чего стоят.
Проги по фб2 запустились шаманскими способами. Видео показывает. Все прекрасно.
Но это офф. в этой теме. Я его сегодня уже в других местах начитался.
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
Если развивать офтоп, то на Longhorn тоже возлагалось много надежд - гораздо больше, чем оправдала Vista (если вообще что-то оправдала)... Хотя по поводу XP согласен.
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
Есть еще DHTML Editing Control for Applications Redistributable Package.
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
Нифига! :(
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
Вспомнил я, наконец, где видел тему: http://the-ebook.org/forum/viewtopic.php?t=6177
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
Ура! программа наконец-то открылась! Не спрашивайте - как, ибо я сам не знаю, делал все по последней ссылке от agrey (спасибо ему)
Пока не проверял как будет работать и сохранять. но и это уже что-то.
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
-- у меня Window SP
-- я в system32 поместила свой файл 1.pdf
-- пуск
-- выполнить
-- regsvr32 набираю
-- нахожу свой файл 1.pdf и даю ему уже другое расширение (правильно ???) 1.ocx
-- ok
-- и этот файл не находится
Подскажите, пожалуйста, что я делаю не правильно ...
я плохо разбираюсь в этих тонкостях, но хочется научиться правильно заливать книги
спасибо
с уважением ...
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
А что вы, собственно, делаете?
пдф можно грузить без ухищрений. Если такой книги нет на сайте, конечно.
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
А как? Т.е. можно выделить слово, и сделать его title? Как? Я бы очень хотел чтобы такая возможность была. Подскажите пожалуйста где она. Я искал не нашел.
Вы не поняли. Как он определит что это title а здесь subtitle? Разве в ворде это можно указать?
Т.е. есть книга, в которой идет Глава 1. Далее в ней идут подзаголовки, через абзац, два. Вот их нужно вручную выделять как Subtitle. Как скрипт поймет это?
Или он просто сделает их как title? Но делать их именно заголовками нельзя, т.к. замучаешся читать на устройстве ebook, там заголовок начинается с новой страницы - т.е. в данной ситуации ,каждый абзац будет с новой страницы..
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
А как? Т.е. можно выделить слово, и сделать его title? Как? Я бы очень хотел чтобы такая возможность была. Подскажите пожалуйста где она. Я искал не нашел.
Очень просто!
Выделяете абзац, нажимаете Shift+Enter и всё!!! titlе готов.
Выделяете абзац, нажимаете Alt+S и всё!!! subtitle готов.
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
Спасибо. Я не знал этого про title. Почему то об этом нигде не написано в программе.
Тогда BD остается только для конвертирования из html.
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
Это главная фича FBE - отсутствие справки. "Попробуй угодай" - бесплатная игра от Грибова юзерам.
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
Из HTML я конвертирую обычно через Word. Попался как-то документ с множеством перекрестных ссылок. BD такой FB2 наворотил, что просто офигеть, а через Word получилось нормально.
А из Word'a еще можно с помощью ExportXML.dot конвертировать.
Что же касается title, то это я методом тыка нашел. А потом уже увидел в книге Михаила Кондратовича "Создание электронных книг в формате FictionBook 2.1: практическое руководство" http://lib.rus.ec/b/123638. Там много чего полезного есть. Жаль, она мне поздно попалась.
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
О нет, только не Word. Может быть наворотил с ссылками, но это еденичный случай. Word перегоняет все картинки в jpg, тем самым ухудшая (размазывание) качество их увеличивая их размер.
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
Не заметил. На днях делал книгу, как раз из PDF. Картинки, как были смесью PNG и JPG, так и остались. Использовал только Acrobat, Word и FBE.
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
Очень просто. Нужно выровнять нужный абзац в Ворде по центру :) После преобразования doc2fb эти выровненные по центру абзацы станут субтитлами.
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
Все таки мой вариант лучше. 20 сек на перегонку в fb2 в BD, а после уже редактировать в fbe, - сразу видишь что делаешь. тем более после скрипта все равно нужно будет забрасывать его в fbe для шифовки.
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
Дык никто ж не спорит, вопрос был, "разве возможно это в ворде?" - я ответил как это сделать.
??? какой шифровки?
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
там л пропущена.
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
Возвращаясь к началу.
Многие PDF содержат текст в виде собственно текста, так что их можно и не распознавать. Достаточно самим Adobe Acrobat'ом сделать 'Save as HTML | RTF | DOC'. Если же так просто не получится, можно использовать ABBYY PDF Transformer. Он конвертирует PDF в разные форматы более корректно.
Читал где-то, что есть и DJVU с текстовым слоем, но мне такие не встречались.
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
Есть. Дневники Чехова из ППС на publ.lib.ru, например. Но этот слой в формате txt, где каждая строчка – абзац, т.е. с этим файлом еще работать и работать. Естественно, ни болд, ни италик в нем не отображаются.
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
Нашел в сетке у себя. Кому надо могу залить на рапиду. 220 мб.
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
Нестоит. Кому надо, тот найдет, например тут.
Или к примеру в теме fb2-софт, ссылка на которую есть в заглавном посте soshial.
ИМХО конечно, но FineReader все таки лучше...
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
В отделе Сноски утверждение:
излишне жесткое.
Я, например, использую квадратные скобки. Все получается без осечек.
Еще вопрос. Я чего-то не смог в FR9 избавиться от знаков абзаца в конце строки. Никак. "Помню" в каких-то ранних версиях с этим проблем не было - отметил галочку и все насильственные переносы строки исчезли. Здесь же все галочки "Сохранять деление на строки" убраны, а оно все равно их сохраняет. Это все обычный OCR, конечно, не из pdf, ну да все равно. Не подскажете, что за хрень?
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
В квадратных скобках могут содержаться ссылки на статьи, главы итп. к примеру [1] или [2]. Я уже так попал, потом пришлось нудно искать где же они лежат.
При сохраниении в html я ничего подобного не заметил, в FR9 (OCR был с djvu).
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
Если судить по набору скриптов FBE, то можно использовать для обозначения сносок различные виды скобок: фигурные {...}, квадратные [...], [!...!], [~...~] и свои собственные, лишь бы не смешивались с теми, которые сносками не являются.
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
Так рассказываю минуса.
Да текст переводиться качественно НО, одно большое но:
Включаються колонтитулы и номера страниц. Это очень сильно усложняет обработку конечного файла.
Так что даже в этом случае я выбираю Fine Reader - ведь весь текст разпознается без ошибок (если pdf текстовый), но можно выбрать области сразу и применить на все страницы.
Но если текст без колонтитолов и номеров страниц (что редко бывает), тогда конечно Transformer.
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
Не такое оно и большое... Можно тем же Acrobat'ом сделать Crop страниц, с целью обрезки колон(титулов)цифр.
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
Дык в том то и дело, что то же самое можно сделать и в Fine Reader, без мудрежа. Я к примеру не знаю как это делается, + надо устанавливать Adobe Acrobat а не Reader. В итоге юзать две программы, и тратить больше времени. - вот поэтому оно и большое "НО", по сравнению с FR - где все конверирование занимает минуты. Повторюсь - текст который не отсканирован, FR разпознает с без ошибок. А юзать подобный способ только для того, чтобы использовать програму pdf transformer имхо неправильно, ведь нужно смотреть на тот как быстро можно получить качественный результат.
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
Это если картинки не с OCR. С OCR такого не сделаешь. Плюс прозрачность увеличивает размер. + она в большистве и не нужна. Ведь все равно на белом фоне что на ebook что на компе.
Здрастье приехали. Наоборот. Попробуйте сначала уменьшить без ресепла - удивитесь. это раз.
во вторых в скобках написано возле ресепла написано - (better quality)
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
За советы также всем спасибо. На выходных обновлю мануал (сейчас в поездке), с обозначением автора, который предложил вариант.
Думаю многим пригодиться.
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
Иногда png имеет даже ме́ньший размер, чем jpg
http://i4.imageban.ru/out/2010/12/05/581abfa36a0cbb56b297358a200a4c81.jpg
http://i1.imageban.ru/out/2010/12/05/3c15deacb34dfc99e136e91a1501afd0.png
Можете скачать и убедиться
Фотки сделаны из дежавюшки из программы WinDjVu экспортом страницы.
Если кто не знает, как сохранить рисунок, вот подсказка:
ПКМ на рисунке и