Вы здесьeBookDownloader и валидация книжек. ВАЖНО!!!!
Опубликовано сб, 05/04/2008 - 15:44 пользователем Bullfear
Вобщем перед тем как заливать книжку(скачанную ebookDownloader-ом у конкурентов) в библиотеку ее надо проверить на валидность. Надеюсь все знают как это делать? Иначе получаються оччень неприятные вещи. Вот пример текста книжки(Скобочки <> заменены на () ): Тоесть невалидные абзацы тупо пропадают! Есть идеи как можно автоматизировать чистку книг? По сути надо автоматизировать закрывание абзацев, если абзац не закрыт. Или хотя бы какая читалка(для кпк естественно) показывает нормальный текст?
|
Вход на сайтПоиск по блогам и форумамUser menuПоследние комментарии
aldan RE:Подайте бедному копеечку на книжку с литреса... 3 часа
Tramell RE:Серия "Что есть что" издательства "Слово"(чего не хватает) 14 часов larin RE:абонемент не обновлен 1 день sem14 RE:За иллюминатором (серия) - чего не хватает? 4 дня sem14 RE:Собираем серию: "Мастер серия", издательство "Лимбус". 4 дня sem14 RE:Серия книг «Судьбы книг» издательства «Книга» 4 дня Larisa_F RE:Книжная серия «Сlio» издательства "Евразия" 6 дней larin RE:Пропал абонемент 1 неделя tvv RE:DNS 2 недели MrMansur RE:<НРЗБ> 2 недели Stager RE:Беженцы с Флибусты 2 недели Tramell RE:Серия "Библиотека французской литературы" (Макбел) 2 недели sem14 RE:Книжная серия "Жизнь в искусстве" издательство "Искусство"... 3 недели sem14 RE:Современная корейская литература. Книжная серия... 3 недели sem14 RE:Серия "Символы времени" издательства "Аграф" 4 недели sem14 RE:Собираем серию: "Азбука-триллер", издательство "Азбука-Терра" 4 недели sem14 RE:«Юмористическая серия» 4 недели larin RE:Оплатил. Абонемент не отображается 1 месяц Впечатления о книгах
Sello про Санд: Том 1. Индиана. Валентина (Классическая проза, О любви)
17 01 В пятнадцать лет, читая Санд, испытывал другие чувств: все казалось внове и интересным. Ныне замечаешь то, на что в прошлом и внимания не обратил бы: что же главных героев, по-родственному между собой связанных, писатель старается ………
Дей про Чернованова: Повелитель тлена [СИ] (Детективная фантастика, Любовная фантастика, Попаданцы, Самиздат, сетевая литература)
16 01 Неоднозначное впечатление. Сначала мрачновато и страшновато, но в итоге нормальная целостная картина получилась. И наконец-то хоть одна ГГ дамского романа среди алчущих её внимания выбрала нормального, что большой плюс автору. Оценка: отлично!
udrees про Шиленко: Искатель - 3 [СИ] (Фэнтези, Эротика, ЛитРПГ, Самиздат, сетевая литература)
16 01 В целом написано просто, но увлекательно про приключения в мире литРПГ – Валинор. В гарем героя добавляется кошко-девочка. Для этого в книге выделена одна иллюстрация, описывающая еще одну пассию. Книга обильно сдобрена ……… Оценка: плохо
udrees про Морале: Проклятье, с*ка! Книга 5 (Городское фэнтези, Самиздат, сетевая литература)
16 01 Хмм, заключительная книга про приключения парня с проклятиями. Правда расхождение по способностям первой книги и последней колоссальное. В пятой книги проклятиями он наверное совсем не пользуется, да и противники у него сплошь ……… Оценка: плохо
udrees про Володин: Газлайтер. Том 3 [СИ] (Альтернативная история, Боевая фантастика, Фэнтези, Попаданцы, Самиздат, сетевая литература)
16 01 Могу сказать, что неплохое продолжение истории. Написано конечно просто, описания скудные, очень много времени уделено гаремнику, но в целом читается достаточно легко и интересно. Сюжет тоже не дает пока заскучать. У автора ……… Оценка: хорошо
udrees про Атаманов: Стратег из ниоткуда (Боевая фантастика, Фэнтези, Попаданцы, Самиздат, сетевая литература)
16 01 Автор пиши еще. Книга очень захватывающая, в жанре попаданца. Введение как водится, короткое, я даже сначала думал, начало будет как у Эдмонда Гамильтона про город, который провалился в будущее. Но тут мир фэнтезийный, и хоть ……… Оценка: отлично!
udrees про Мантикор: Покоривший СТЕНУ 20: Истинный враг (Боевая фантастика, Технофэнтези, ЛитРПГ, Самиздат, сетевая литература)
16 01 Хорошее повествование, главный герой-друид все продолжает движение вниз по Стене. На сей раз большую часть книги занимает выход из ловушки Оазиса, кажущийся логически невозможным. Персонаж собственно переигрывает систему, ……… Оценка: отлично!
Oleg68 про Карризи: Дом голосов [La casa delle voci ru] (Триллер, Детективы: прочее)
15 01 Это, точно, не детектив. Скорее всего,- это психологическая драма. Сюжет интересный, но затянутый. Оценка: неплохо
Stager про Курилкин: Звезданутые [СИ] (Космическая фантастика, Попаданцы, Юмористическое фэнтези, Самиздат, сетевая литература)
12 01 Детский сад - штаны на лямках. Жаль, что хорошая идея бездарно изложена. Жаль, что у современных авторов главный герой - лжец и торгаш. Ну а грамматические ошибки и уверенность автора, что муравьи плюются - так кого ныне удивишь дремучестью? Оценка: неплохо
mysevra про Китаева: Вдова колдуна (Фэнтези)
12 01 Какая милая история! Вывод: открой пошире глаза – десять лет могла быть счастлива, а она превозмогала. Оценка: хорошо
mysevra про Гравицкий: В зоне тумана (Боевая фантастика)
12 01 Я не для того читаю про Зону, чтобы окунуться в «тонкий» психологизм и душевную драму, этого в жизни хватает. Мне действие подавай и загадки, побольше загадок. Так что книга не зашла. Оценка: неплохо
mysevra про Сорокин: Смерть со школьной скамьи (Полицейский детектив)
12 01 Хотелось бы чего-то кроме описания личной жизни главного героя и особенностей социалистического строя. Где собственно заявленный «детектив»? Мало, мало. Оценка: неплохо |
Комментарии
Re: eBookDownloader и валидация книжек. ВАЖНО!!!!
Это разработчику надо писать:
http://www.liveinternet.ru/users/dimzon541/
Re: eBookDownloader и валидация книжек. ВАЖНО!!!!
Встречал обращения людей с подобными багами на форуме the-ebook.org. Там, насколько я припоминаю, дело было в альдовских файлах fb2. Возможно, тэги были не закрыты и в исходном тексте - тогда eBookDownloader ни при чем, он ведь хмл на валидность не проверяет.
Re: eBookDownloader и валидация книжек. ВАЖНО!!!!
Вполне возможно. Браузеру то по барабану - он автоматом закрывает. А вот в HaaliReader абзацы пропадают :(
Re: eBookDownloader и валидация книжек. ВАЖНО!!!!
Не знаю... Читаю с Haali на КПК, и не замечал пропуска абзацев как будто, в том числе и в книгах, полученых с помощью ЕБД. Теперь буду присматриваться повнимательнее.
Кстати, Haali на КПК - единственная читалка, которая может автоматом сделать оглавление при определенном формате абзацев файла txt, и я это широко использую на работе, поэтому перейти на другую читалку никак не могу.
Re: eBookDownloader и валидация книжек. ВАЖНО!!!!
Сам недавно заметил :( Попробуй скачать Княжеский пир 2 Никитина. Цитата вверху оттуда.
Re: eBookDownloader и валидация книжек. ВАЖНО!!!!
я fb2 читаю ICE Book Reader`ом. У меня у всех файлов с абзацами все впорядке.
Re: eBookDownloader и валидация книжек. ВАЖНО!!!!
Проблема решилась. Надо было просто выкинуть ";№%% Haalireader и поставить нормальный AIReader.
Re: eBookDownloader и валидация книжек. ВАЖНО!!!!
Haali не трож)) лучшая (и быстрая) читалка имхо.
Re: eBookDownloader и валидация книжек. ВАЖНО!!!!
Тоже так думал. Пока не поставил AIReader :) Листает Haali лучше, но проблема в том, что не отображает абзацы в "кривых" книжках (выше пример). Хотя может быть появиться новая версия и тогда... :)
Re: eBookDownloader и валидация книжек. ВАЖНО!!!!
Сомневаюсь, что в Хаали эта проблема решится.
Там принципиально парсинг тегов параграфов сделан с расчетом на их парность.
Re: eBookDownloader и валидация книжек. ВАЖНО!!!!
Вообще проверить XML на соответствие схеме (в данном случае FB2) - задача тривиальная. По-хорошему, это должно делаться сайтом при каждом приеме fb2 от пользователя.
Re: eBookDownloader и валидация книжек. ВАЖНО!!!!
И сразу лишимся doc и pdf.
Re: eBookDownloader и валидация книжек. ВАЖНО!!!!
Bullfear, откуда такой вывод ? При заливке fb2 проверяется валидность, а при заливке других форматов не проверяется, т.е. идёт в обход проверки.
Re: eBookDownloader и валидация книжек. ВАЖНО!!!!
В хаали гемор с абзацами.
Я так понимаю там не отсутствие замыкающего тега а вложенный параграф типа (p)bla bla(p)bla(/p)(/p).
Но на всякий пожарный пришли образец на pisem.net@teolog. Сделаю очередную попытку фикса.
Re: eBookDownloader и валидация книжек. ВАЖНО!!!!
ebookDownloader пока не умеет делать валидный fb2
Ни одна книга, сохраненная им в fb2 валидации не прошла. Ошибок при этом много: стихи форматируются как эпиграфы, не все теги нормально закрываются и т.д. Собрать книгу руками в результате получается быстрее, чем выправить то, что сделал ebookDownloader. :0(
Re: eBookDownloader и валидация книжек. ВАЖНО!!!!
Поправить не так долго. В среднем нужно 5-10 минут, если сносок не очень много.
Добавить аннотацию и информацию о книге, убрать section у названия и автора, объединить пустые секции, исправить структуру, если она разветвленная , у эпиграфов исправить вложенный тэг epigraph на author-name, исправить стихи, добавить сноски. В FBE это занимает, как уже написал 5-10 минут.
Re: eBookDownloader и валидация книжек. ВАЖНО!!!!
Это время очень сильно зависит от сложности оформления книги. В книгах, кроме перечисленного вами, ещё и иллюстрации бывают, которые данлоадер только и умеет, что сохранять на диск - и за это автору спасибо. Дерните данлоадером ту же "Ртуть" Нила Стивенсона (http://lib.aldebaran.ru/author/stivenson_nil/stivenson_nil_rtut/) и проверьте, сколько времени у вас уйдет, чтобы вернуть оформление книги хотя бы к альдебарановскому - про печатное я уже и не говорю. Скажете, что 5-10 минут - соврёте.
Re: eBookDownloader и валидация книжек. ВАЖНО!!!!
Последние версии dowloadera вполне нормально сохраняют иллюстрации в fb2 документе.
На Ртуть немного больше времени, минут 20, из-за 56 сносок.
Хотя я хотел не меряться, кто быстрей, а просто пожелать выкладывающим неправленый fb2 утянутый даунлоадером потратить немного времени, и привести документ в нормальный вид.
Re: eBookDownloader и валидация книжек. ВАЖНО!!!!
Пришлите список того что не так, я попытаюсь поправить. Только поконкретней. Насчет сносок не совсем понятно что делать, не всегда понятно что это сноска поэтому я их вообще не обрабатывал.
Re: eBookDownloader и валидация книжек. ВАЖНО!!!!
Создаются лишние секции по подзаголовкам (самый самый частый пример - подзаголовок "* * *") и по началу каждой страницы, на которые книга разбита для онлайн-чтения.
Re: eBookDownloader и валидация книжек. ВАЖНО!!!!
Это не баг, это фича. В некоторых книгах заголовков просто нет, есть только подзаголовки. В результате получается одна здоровая секция и при чтении на некоторых читалках появляются дикие тормоза. Кроме того оказалось что создать несколько заголовков в одной секции значит нажить себе кучу неприятностей. Читалки именно заголовки почему то ненавидят.
Поэтому при встрече с заголовком создается новая секция, так же новая секция создается когда софтина оконечательно отчаивается разобратся с форматированием. Чаще всего на альдебаране.
Так что если не возникает артефактов при отображении, лучше не трогать.
Re: eBookDownloader и валидация книжек. ВАЖНО!!!!
Н-да.
Вот именно поэтому, чем бороться с подобными "фичами", куда проще и быстрее делать fb2 руками, с нуля.
Re: eBookDownloader и валидация книжек. ВАЖНО!!!!
Подскажите лучший софт для конветации в fb2 или сами чем пользуетесь.
Re: eBookDownloader и валидация книжек. ВАЖНО!!!!
В данный момент я пользуюсь исключительно FB Writer-ом и копипастом. Для конвертации из doc в принципе можно пользоваться утилитами doc2fb или грибовской any2fb, но там контроль и ручная правка всё равно нужны. Any2fb, кстати, понимает не только doc, но и txt, rtf, html и др.