Вы здесьВалидация fb2
Опубликовано ср, 15/04/2009 - 19:50 пользователем larin
Forums: 1. Добавил валидацию загружаемых книг.
|
Вход на сайтПоиск по блогам и форумамUser menuПоследние комментарии
Океана RE:Подайте бедному копеечку на книжку с литреса... 23 мин.
edvud RE:Прошу переформатировать, распознать, etc... 32 мин. babajga RE:Отчаянная осень 22 часа babajga RE:Сказки Сени Малины 22 часа babajga RE:Сказки 22 часа babajga RE:Мои четвероногие друзья 23 часа Саша из Киева RE:Кто сможет раздобыть и оцифровать нужные мне книги? 1 день Isais RE:Древний Рим. Подборка книг 3 дня Isais RE:Семейственность в литературе 5 дней kopak RE:Таинственная личность админа Флибусты 1 неделя kopak RE:О группе Дятлова. О той самой, того самого... 1 неделя babajga RE:Ласси возвращается домой 1 неделя sem14 RE:Подборка о Первой Мировой 1 неделя Isais RE:удаление "двойников" 1 неделя Isais RE:Кармен Мола - Пурпурная сеть [litres] 3 недели Isais RE:Детство, опаленное войной (Вторая мировая 1939-1945 и ВОВ) 3 недели Isais RE:Катя Водянова - Дом и два жениха в придачу 4 недели Isais RE:Дмитрий Анатольевич Горчев - ЖЖ Дмитрия Горчева (2009–2010) 1 месяц Впечатления о книгах
Stager про Валин: Штурмуя Лапуту (Боевая фантастика, Героическая фантастика, Самиздат, сетевая литература)
26 02 Повествование окончательно стало бессвязным и немотивированным. Даже рояли кончились. Но забавно, местами увлекательно. Оценка: неплохо
Lan2292 про Nooby: Торговец (Городское фэнтези, Попаданцы, Самиздат, сетевая литература)
26 02 чЕЛОВЕК ПИСАЛ, ТРАТИЛ ВРЕМЯ, НО К СОЖАЛЕНИЮ НА ВЫХОДЕ ПОЛУЧИЛАСЬ ХРЕНЬ, А Я ЧЕСТНО ПЫТАЛАСЬ ПРОРВАТЬСЯ ЧЕРЕЗ СТРОЧКИ, НО УВЫ И АХ. Оценка: плохо
iggy71 про Маканин: Валечка Чекина (Современная проза)
25 02 Писатель намеревался, видимо, создать загадочный образ провинциалки, "в которой что-то есть", и типа все хотят с ней познакомиться поближе, и она такая себе любвеобильная, духовная и проч. Автор ей симпатизирует, но вот образ ……… Оценка: плохо
konst1 про Рубина: Окна [Авторский сборник] (Современная проза)
25 02 Вдруг Борис заметил: – Между прочим, знаешь ли ты, что еще совсем недавно, в XVIII веке, жители Корнуолла промышляли таким вот способом: в особо сильный шторм выносили на берег большие фонари и расставляли рядами там, ……… Оценка: отлично!
Дей про Господин следователь
25 02 Очень интересно. Детективная и, скажем так, бытовая линии отличные, любовная же не понравилась. Влюбился с первого взгляда, лучше её нет (это ещё даже не разговаривал с ней ни разу), вот эти китайские церемонии с ухаживаниями ………
Олег Макаров. про Капба: Как приручить дракона - 4 [СИ] (Альтернативная история, Киберпанк, Фэнтези, Попаданцы, Самиздат, сетевая литература)
24 02 Капба прекрасен как всегда. Четвёртый том не хуже (лучше!) предыдущих, хотя казалось бы куда ещё. Очень отличная книга. Оценка: отлично!
obivatel про Калинин: Вторая Отечественная [litres] (Альтернативная история, Боевая фантастика, Попаданцы)
24 02 Автор датэл: "если именно благодаря революционерам Россия потеряла шанс выйти из нее в качестве главного победителя". . Если пишешь что-то о периоде, не поленись узнать как оно было. Царя опрокинули крупнейшие промышленники ……… Оценка: плохо
mysevra про Себастьянович: Новая книга о сыроедении, или Почему коровы хищники (Здоровье)
24 02 Подход для таких ленивых как я - нет обязательных самостоятельных чисток. «Мягким тканям потребуется не менее 2 лет, а скелету - около 7.» Непонятно, есть ли это время. Оценка: отлично!
mysevra про Артюшкина: Голем [litres] (Детективная фантастика, Социальная фантастика, Научная фантастика)
24 02 Такой замечательный мир, отличный язык, но невыносимо неспешное развитие событий – кажется вот-вот случится что-то значимое, а нет, очередной проходной момент. Оценка: неплохо
Isais про Абдуллаев: Заговор в начале эры (Исторический детектив, Политический детектив)
24 02 Скучно, нудно, нехудожественно. Вместо живых картин -- картонные декорации, никто из персонажей не вызывает эмоций -- ни любви, ни ненависти, каждый абзац сопровождается таким же по размеру морализаторским поучением, высказанным ……… Оценка: плохо
Nevskaya про Сушков: «Ленинградское дело»: генеральная чистка колыбели революции (Документальная литература)
22 02 Бралась за книгу с трепетом, родная тема, Блокада, Ленинград и все такое... Прочла со стыдом, дочитывала только потому, что не умею бросать начатое. Вранье сплошное, откровенное, бесстыжее, запредельное. Уже много где на форумах ……… Оценка: нечитаемо
Belomor.canal про Акунин: На санях (Современная проза)
22 02 Лучшая, самая лучшая книга Семейной Саги Оценка: отлично! |
Отв: Валидация fb2
Вы сюда потроллить пришли? Ну, продолжайте без меня.
Отв: Валидация fb2
Я сюда пришел предложить Вам получше продумывать Ваши предложения. Однако корм, как видно, не в коня.
Отв: Валидация fb2
Дело в том, что «расширенное» название для некоторых публикаций — всего-навсего вынужденная мера, — в связи с тем, что в здешней базе данных не может равноправно храниться две единицы с одинаковым названием, одна из них должна стать «дублем». А если, например, у романа два разных перевода, то в здешней библиотеке нет другого выхода, кроме как «расширять» название с учётом переводчика. Вот и всё.
Отв: Валидация fb2
Значит, надо исправлять библиотеку. Бардак очень легко устроить и потом очень сложно разобрать. Я с буквально такой же проблемой сталкивался — люди забивали в одно поле разную по сути информацию, и когда настало время обновлять систему, пришлось долго и упорно весь этот мусор вычищать. Далее, fb2-файл — это образ конкретной книги, а не обобщённый образ литературного произведения, как на фантлабе. Разные издания одной книги должны одновременно сосуществовать в рамках одной библиотеки, пусть даже для него не будет загруженного файла книги. Библиотеку делает библиотекой не куча книг, а структурированный каталог. Если часть этой структуры не поддерживается форматом файла, нужно это унести на уровень библиотеки (например, альтернативные названия, альтернативные издания (журнальный вариант, к примеру) и так далее). На фантлабе построена очень хорошая система каталогизации книг и к ней очень хорошо прикручивается непосредственно файл книги, но из-за политики фантлаба это невозможно. Вот нам нужно что-то типа фантлаба, но с файлами книг, открытой базой и открытым кодом, чтобы коллективный труд нельзя было одним махом прикрыть.
Отв: Валидация fb2
Ну я бы не стал брать ФантЛаб за образец каталогизации книг — именно потому что ФантЛаб не библиотека, а только картотека, каталог. То есть у ФантЛаба сугубо информационная функция — сообщить данные об авторе и всех неэлектронных изданиях его произведений. А Либрусеку нужно в первую очередь снабжать читателей текстами и делать это так, чтобы читатель не путался в многочисленных дубликатах или вариантах одного и того же текста.
И я не могу радикально не возразить такому твоему предложению: «Разные издания одной книги должны одновременно сосуществовать в рамках одной библиотеки, пусть даже для него не будет загруженного файла книги». Нет! нет! и ещё раз нет! В каталоге библиотеки должно быть только то, что в ней есть — только уже загруженные единицы хранения. Сведения же о всех фактических изданиях должны помещаться в раздел «описание автора».
Отв: Валидация fb2
Это никакое не возражение. Я за то, чтобы информация структурированно хранилась в библиотеке, а уж в каком месте она будет показываться — это дело десятое. Если данные структурированные, то их представление можно менять как угодно, в этом и прелесть подхода. У фантлаба данные структурированы, поэтому там можно легко сделать что угодно. На бардаке легко сделать не получится. У фантлаба есть один большой недостаток — там информация может изменяться лишь очень небольшим кругом людей, и некоторых авторов они не хотят принимать по причинам типа «отсутствие публикаций» и так далее. Вот если взять за основу схему данных фантлаба, да сделать на ней открытый движок, да ещё детально описать все правила работы — получится просто фантастическая неубиваемая штука.
Отв: Валидация fb2
Ещё раз — на ФантЛабе структурированы странички с инфой по книгам, имеющим неэлектронное издание. Но не файлы с самими книгами. Разница существенная — у них заведомо нет проблемы с дубликатами текста, ведь текстов нет вообще!
Кроме того, заметь, как на ФантЛабе «прекрасно» структурованы данные о романе «Оружие скальда» Дворецкой, если посмотреть на странички work90693 и work18313. Ну просто сразу всё понятно, где первая редакция, а где вторая, значительно переработанная… — инфа об этом внесена только на страничку цикла, на страничках изданий об этом ни гу-гу. А вообще разобраться с этим циклом, где там именно первые издания романов, а где переделки — без поллитры не разберёшь. Но нужна именно поллитра, помимо ФантЛаба приобретаемая, потому что ФантЛаб нужную инфу не представил.
Отв: Валидация fb2
А электронные книги откуда берутся? Правильно — из неэлектронных. Прикрутить поддержку файлов в книг в схеме фантлаба очень легко. А вот прикрутить поддержку разнообразных метаданных о книгах в либрусеке сложно. И даже если книга изначально электронная, в фантлабе проблем не возникаетю
Блин, это проблема предстваления. Информация-то об этом явно представлена в метаданных книги. Поэтому её можно вывести и на страницу книги. А если не сделано…, ну, мало ли багов в фантлабе. Но заметьте — это баги представления, которые легко фиксятся. Баги в ядре фиксятся сложно.
Отв: Валидация fb2
Очень легко только рассуждать здесь о том, что очень легко прикрутить там. Потому что представление о механизме фиксации данных предельно абстрактное. :-/
В третий раз повторяю. На ФантЛабе для книг создаются страницы — для одного и то же текста этих страниц можно насоздавать чёртову тучу. И, конечно, разобраться в этой чёртовой туче не составит труда, если это один и тот же текст. А вот если один и тот же роман оказывается в нескольких переводах или в нескольких редакциях с разными названиями, то и на ФанЛабе появляются «расширенные» названия с пояснениями в скобках. Чем эта ситуация в положительную сторону отличается от ситуации на Либрусеке, а? Ничем. Всё те же «неправомерные» перелицовки названий.
Дальше. На ФантЛабе строчка в авторской библиографии ссылается на что? — правильно, на страницу с инфой по книге. А эта страница ссылается на страницы с инфой по каждому отдельному изданию. (И читателю ФантЛаба должен ковыряться в этих многочисленных страничках, прежде он поймёт какое издание чем именно отличается от другого, что, например, роман «Железная голова» не входит в роман «Корни гор» 2004 года издания, но представляет собой половину романа «Корни гор» 2007 года издания (роман входит в… роман оригинальное представление инфы, однако)). На Либрусеке строка авторской библиографии должна содержать ссылку на текст. Но никак не на страницу с несколькими ссылками на несколько текстов.
Наконец, есть ли на ФантЛабе рубрика, которая бы объединяла идентичные тексты произведения и обосабливала другие (другой редакции, другого перевода)? Нету. Потому что ФантЛабовцам пофик эти проблемы — их посетители должны отправляться в магазин, а не получать текст на месте.
Отв: Валидация fb2
Вообще-то валидатор ничего в файле не меняет, он только проверяет на вшивость. Или вы про что?
Отв: Валидация fb2
Я про валидатор ничего не знаю. Я лишь предлагаю добавлять в файл информацию о характере изменений, если меняется книга из библиотеки. То есть берётся файл, исправляются ошибки валидации и снова заливается в систему (заменяется битый на новый). При этом увеличивается версия и добавляется блок history. Улучшать в битых файлах можно много чего. Часто там, например, нет разбивки на главы и весь текст идёт одной секцией. Или сноски оформлены угловыми скобками. В идеале это всё надо фиксить, но это долго.
Отв: Валидация fb2
А почему Вы решили, что это не делается? Кто Вам это сказал? Это "предлагается" примерно около года. И если файл правится, а не верстается заново - так и положено делать.
Да, долго. Но надо.
P.S. Если сноски оформлены угловыми скобками - файл так и останется битым. Однозначно.
--------------------
Постепенно дошло и до меня - Вы, похоже, предлагаете добавлять информацию в history автоматом при заливке новой версии? Едва ли это правильно. Оно получится "малоинформативным".
Отв: Валидация fb2
Ну вот неплохо было бы на какое-нибудь видное место положить такие правила, я пока не нашёл.
Да, долго. Но надо.
P.S. Если сноски оформлены угловыми скобками - файл так и останется битым. Однозначно.
--------------------
Нет, нет, нет. Я не предлагают править автоматически fb2-файл. Я предлагал просто как-то стандартизировать процесс изменений, см. начало сообщения.
У меня была другая идея, но я её пока не озвучивал: хочется иметь историю изменения книги в библиотеке. Это совершенно не то же, что document-info/history из файла, это именно лог причин обновлений книги. Например, автор обновляет книгу в библиотеке и пишет на вебформе обновления комментарий типа «фикс ошибок валидации: убраны ошибки распознавания, тег middle-name помещён на правильное место» или «заменено на новую, более качественную версию из другого источника». Но эта идея скорее к функциональности библиотеки относится
Отв: Валидация fb2
Не относится, но определенный смысл в ней есть - если например добавить такое поле да еще и обязательное в "Нашел дубля. Кликните разрешить конфликт" то есть если человек меняет одну книгу на другую ее версию - пусть напишет почему втбрал именно этот вариант" , польза от этого в том что хоть некотторых заставит задуматься прежде чем автоматом кликать на тот что залил сам , да и библиотекарям если разбирать такой "конфликт" то будет легче.
Впрочем вся эта дискуссия к валидации вообще не имеет никакого отношения.
Отв: Валидация fb2
добавте пожалуйста валидацию без загрузки на сайт
Отв: Валидация fb2
http://code.google.com/p/fb2utils/downloads/list
Скачайте себе последнюю версию и тогда Вы сможете валидировать файл до загрузки на сайт.
Отв: Валидация fb2
Как в валидаторе отключить проверку даты?
Отв: Валидация fb2
А как валидатор совместить с новыми жанрами FBE?
Отв: Валидация fb2
Это легко. Достаточно заменить файл FictionBookGenres.xsd (из папки валидатора) на новый.
Отв: Валидация fb2
Спасибо! Успешно.
Отв: Валидация fb2
А вот мне всегда сомнительно, надо ли это делать. Для других библиотек ведь эти файлы тогда могут оказаться невалидными. Или это пофигу и нафигу, и все равно надо чтобы прямо в файле новые жанры?
Отв: Валидация fb2
Уважаемые, столкнулся с такой проблемой валидации данных.
Данный прием использования секций некорректен, выдается ошибка нарушения схемы DTD (expecting image, p...):
<body>
<title><p>Author</p><p>Book name</p></title>
<section>
<title><p>Title of section 1 level</p></title>
<p>Text 1.</p>
<section>
<title><p>Title of section 2 level</p></title>
<p>Text 2.</p>
</section>
</section>
</body>
После валидации курсор ставится в проблемное место - в конце тэга вложенной секции (после второго < section >). Что это значит?
Но если текст 1 заключить в секцию - валидация проходит.
<body>
<title><p>Author</p><p>Book name</p></title>
<section>
<title><p>Title of section 1 level</p></title>
<section>
<p>Text 1.</p>
</section>
<section>
<title><p>Title of section 2 level</p></title>
<p>Text 2.</p>
</section>
</section>
</body>
С чем это связано? Нарушение структуры, правил использования схемы? По логике-то все верно..
Отв: Валидация fb2
При чем тут логика?
В Вашем первом варианте слишком большая нагрузка на интерпретатор читалки получается. Второй вариант проще.
Но все уже давно привыкли к тому, что текст должен быть заключен в теги "section" и теги "p" и "section" не могут быть на одном уровне.
Отв: Валидация fb2
Не может секция начинаться посередине текста. Перед началом секции обязательно должна быть либо (а) закрыта предыдущая секция либо (б) закрыт её title. Иными словами недопустимым является вот это
.
....</p>
<section>.....
Отв: Валидация fb2
Но на практике такое часто случается, даже в моей текущей книге. И как, тогда такие исключения обходить? Согласно описанному второму варианту?
И еще.. валидатор FBUtils на такие случаи размещения секций смотрит спокойно. Либо баг программы, либо это допустимо.
Отв: Валидация fb2
Исправлять.
Отв: Валидация fb2
Путем использования второго варианта? Очевидно..
Отв: Валидация fb2
<body>
<title>
<p>Титл</p>
</title>
<section>
<title>
<p>Уровень 1</p>
</title>
<section>
<p>****************</p>
</section>
<section>
<title>
<p>Уровень 2</p>
</title>
<p>◦******************</p>
</section>
<section>
<title>
<p>Уровень 2</p>
</title>
<section>
<p>◦********************</p>
</section>
<section>
<title>
<p>◦Уровень 3</p>
</title>
<p>**************************</p>
</section>
</section>
</section>
</body>
Отв: Валидация fb2
Да, таким же образом я и поступаю сейчас. Но в этом случае на лицо пустые подзаголовки (< section >) в оглавлении.
Отв: Валидация fb2
Ну и? Почему это Вам мешает?
Ситуация довольно распространённая.
Отв: Валидация fb2
Если так Должно быть, то вопрос по этой теме снимается. Я в создании fb2 еще новичок и потому каждое несоответствие, подозрительное действие воспринимаю критично. :)
Кстати, выше означенная проблема уже описана в http://lib.rus.ec/node/111115
Но мне не дает покоя - почему валидатор FB2Utils такие несоответствия проглатывает? Он не безгрешен? FB2Utils vs FBE - 0:1 :)
Отв: Валидация fb2
Так может быть.
Насчёт валидатора: хотелось бы увидеть конкретный файл.
Отв: Валидация fb2
Отправил в личку файл.
Отв: Валидация fb2
Я Вам ответила. Файл невалидный:
Так что валидатор работает штатно. ;)
Отв: Валидация fb2
Да, спасибо :) без посторонней помощи я бы погряз в самодурстве и лжекритике))
Высказывание про косячность FB2Utils было скороспелым. Выяснилось, что ошибки с секциями он не пропускает.. пока что. Так что, FB2Utils vs FBE - дружественная НИЧЬЯ! :)
Отв: Валидация fb2
Если сделать согласно второму варианту, то в оглавлении появляется пустой раздел (без title, соответствует абзацу с текстом 1):
< Title of section 1 level >
< section >
< Title of section 2 level >
Но это терпимо.
Отв: Валидация fb2
Не все программы для чтения этим грешат. Например, в CR2 в оглавлении никаких пустых разделов не наблюдается. Так что не заморачивайтесь на этот счет, пусть разработчики программ об этом думают.
Отв: Валидация fb2
Согласен. Достаточно лишь не отображать подобные пустышки, а редактор FBE по идее как раз и должен отображать все секции независимо, имеют ли они заголовки (title) или нет.
Зато они в CR3 наблюдаются :)
Отв: Валидация fb2
А вот HaaliReader, AlReader и CoolReader2 это дело в оглавлениях игнорируют.
Отв: Валидация fb2
Вопрос к технической службе.
А можно ли сделать так, чтобы заливаемый fb2 файл в случае выявления on-line валидатором ошибок (речь идёт об ошибках, не носящих критического характера) выдавал бы предупреждение (список выявленных ошибок) и предлагал выбор из двух вариантов:
[а] Ой, простите. Не надо такое заливать, я сейчас поправлю; (XOR)
[б] Всё-таки залить несмотря на ошибки!
При этом по умолчанию работает вариант [а].
Отв: Валидация fb2
сам задавался этим вопросом, пока не увидел тут http://lib.rus.ec/soft в самом низу оффлайн прожку выполняющую проверку) прежде чем заливать просто ей проверяйте :)
Отв: Валидация fb2
Полностью поддерживаю предложение VolgoDon-а. Причиной ляпа может быть обычная запарка или рассеянность, но пути назад уже нет - файл на сайте.
Отв: Валидация fb2
+1
Отв: Валидация fb2
Меньше некачественных файлов будет.
Отв: Валидация fb2
+1000!
Отв: Валидация fb2
Не уверен, сюда ли обращаюсь..
Мне интересно знать, какие стили распознает doc2fb, кроме основного текста и подразделов? Как форматировать цитаты, стихи и т.п.?
Отв: Валидация fb2
Все что выходит из под doc2fb необходимо допиливать руками на FictionBook Editor. Формат doc и pdf вообще лучше сразу перегонять в этот редактор с помощью Any2FB2. И там опять же допиливать вручную.
Отв: Валидация fb2
Лучше воспользуйтесь OOoFBTools, в нем можно все стили расставить, какие нужны для FB2 и даже не требует допиливания в FBE, сразу создает валидный документ, не требует наличия Ворда, как doc2fb, но работает на OpenOffice и требует либо OpenOPffice либо LibreOffice. И все же, хотя допил в FBE после OOoFBTools не требуется, всё же лучше пройтись FBE и посмотреть, что получилось, может что нужно подправить.
Отв: Валидация fb2
Вопрос молодого-начинающего.
Честно все прочитал с самого начала
и не понял - как валидатор установить
и как им пользваться?
Отв: Валидация fb2
http://ge.tt/7W0d0Jt/v/0
Скачать, распаковать, кликнуть на validator-gui перейти к проверяемому фб2 файлу и постараться расшифровать на что валидатор возмущается
Страницы