Вы здесьПроверка валидности fb2-файла при загрузке ???
Опубликовано ср, 27/08/2008 - 05:42 пользователем Ghost mail
Forums: Сложно ли добавить автоматическую проверку валидности книг перед их загрузкой на сайт и "не пропускать" невалидные файлы ???
|
Вход на сайтПоиск по блогам и форумамUser menuПоследние комментарии
aldan RE:Подайте бедному копеечку на книжку с литреса... 1 день
Larisa_F RE:Серия книг «Судьбы книг» издательства «Книга» 1 день Larisa_F RE:Серия "Символы времени" издательства "Аграф" 4 дня tvv RE:faq brainstorm =) 4 дня Larisa_F RE:Серия "Что есть что" издательства "Слово"(чего не хватает) 6 дней Larisa_F RE:Серия "Очень прикольная книга", издательство Азбука-классика 1 неделя larin RE:абонемент не обновлен 1 неделя sem14 RE:За иллюминатором (серия) - чего не хватает? 1 неделя sem14 RE:Собираем серию: "Мастер серия", издательство "Лимбус". 1 неделя Larisa_F RE:Книжная серия «Сlio» издательства "Евразия" 2 недели larin RE:Пропал абонемент 2 недели tvv RE:DNS 3 недели MrMansur RE:<НРЗБ> 3 недели Stager RE:Беженцы с Флибусты 4 недели Tramell RE:Серия "Библиотека французской литературы" (Макбел) 4 недели sem14 RE:Книжная серия "Жизнь в искусстве" издательство "Искусство"... 1 месяц sem14 RE:Современная корейская литература. Книжная серия... 1 месяц sem14 RE:Собираем серию: "Азбука-триллер", издательство "Азбука-Терра" 1 месяц Впечатления о книгах
alexk про Грин: Метод Грина. Твоя жизнь — твой сценарий (Экономика)
25 01 серийный предприниматель"? Чикатилла от бизнеса?
polyn про Вендиг: Книга несчастных случаев [litres] (Ужасы, Триллер, Мистика)
25 01 Эта книга стала не открытием, а разочарованием. Слишком затянуто, слишком сумбурно, слишком заумно. Оценка: неплохо
polyn про Валентайн: Принц из книжного [litres] (Современные любовные романы)
25 01 Поклонникам молодёжной романтики, думаю, книга понравится. Оценка: хорошо
vudy про Март: Темный континент (Боевая фантастика, Самиздат, сетевая литература)
24 01 ... мебель разбросана в беспорядке, который держится уже много лет" И тому подобное убожество. Оценка: нечитаемо
udrees про Верхотуров: «Джамаат Таблиги». Самая закрытая секта в мире (Публицистика, Документальная литература)
24 01 Книга для более-менее подготовленного читателя из-за обилия специфических исламских мусульманских терминов. Хоть бы сноску внизу делали, что означает то или иное слово. А так книга описывает историю возникновения и деятельность ……… Оценка: хорошо
udrees про Атаманов: Задача выжить (Боевая фантастика)
24 01 Написано просто про выживание обычного парня с толпой девушек из монастыря в мире постапокалипсиса в стиле «Дня независимости». Прилетели злобные пришельцы, которые сразу без разговоров стали утюжить всех землян. Правда вторжение ……… Оценка: хорошо
udrees про Атаманов: Тестировщик игровых сценариев [СИ] (ЛитРПГ, Самиздат, сетевая литература)
24 01 Хороший сюжет в жанре литРПГ, героя тоже выбрали небоевого класса, гоблина, да еще травника. Герой конечно хорошо отыгрывает своего персонажа, старается его развивать и сделать игру интересной. В общем приключения конечно ……… Оценка: хорошо
udrees про Володин: Газлайтер. Том 5 (СИ) (Альтернативная история, Боевая фантастика, Фэнтези, Попаданцы, Самиздат, сетевая литература)
24 01 Особо оригинального в 5-й книге нету в сравнении с 4-й. Все те же интриги, конфликты с дворянами, усиленный рост героя в характеристиках, постоянный успех у женского пола. В общем стиль все тот же. Написано достаточно просто, ……… Оценка: неплохо
udrees про Володин: Газлайтер. Том 4 [СИ] (Альтернативная история, Боевая фантастика, Фэнтези, Попаданцы, Самиздат, сетевая литература)
24 01 Читая очередную книгу, поймал себя на мысли, что начинаю сжимать руки в кулаки и все чаще думать «теперь понятно, почему в 1917 году произошла революция», да и вообще по миру снизился авторитет аристократов до приемлемого ……… Оценка: неплохо
fachman@yandex.ru про Голубева: Демонология и охота на ведьм. Средневековые гримуары, шабаши и бесовские жонки [Обложка и иллюстрации от другой книги (Казахские мифы)] (Искусство и Дизайн, Язычество)
23 01 В файле подписи под иллюстрациями не соответствуют изображениям. Ну, или наборот. Да и обложка прицеплена от другой книги. Странно...
vudy про Никита Красавин
21 01 В углу валялись гантели, на столе стояло небольшое радио и множество книг, которые стопками лежали на полу." "Кто на ком стоял ?
decim про Дорман: Подстрочник: Жизнь Лилианны Лунгиной, рассказанная ею в фильме Олега Дормана (Биографии и Мемуары)
20 01 Одна из историй. Кто мог и хотел рассказать - рассказывает. Парадокс: люди, без которых не было бы страны - кто-то должен делать бомбу, вести расчёты, учить письму и танцу, да мало ли что ещё - и которые выживали, негласно ……… |
Отв: Проверка валидности fb2-файла при загрузке.
Сложно ли вам, Ghost mail, указать в своем сообщении утилиту для "проверки валидности" fb2, которую вы предлагаете ???
Отв: Проверка валидности fb2-файла при загрузке.
Однако, эти редакторы-утилиты для работы с командной строки, а нужна проверка на php, которая бы работала на веб-сервере перед загрузкой файла книги.
В-действительности, прежде всего этот вопрос нужно решить "политически" - нужно или не нужно 8-)
Мое личное мнение,- нужно. Лучше пусть будет немного меньше книг, но они будут "качественнее" (будут соответствовать стандарту FB2)
Отв: Проверка валидности fb2-файла при загрузке.
Предлагаете "прикрутить" FBE? Или fb2fix? :)
Идеально "валидных" fb2-файлов на сегодня не существует, как и программы, которая бы это определяла - и все благодаря "стандарту FB2". За работой скриптов приходится убирать вручную, валидность книги - определять "на глазок".
От "политического" решения ничего не изменится - кроме громких фраз: программа не появится, вычитка файлов не улучшится. Кроме того, найдя незакрытый тег в fb2-книге - гораздо легче его закрыть, чем брезгливо отбросить этот файл и отсканировать книгу по-новой.
Отв: Проверка валидности fb2-файла при загрузке ???
И файл может быть невалидным, но содержать полный текст, и другого в библиотеке может не быть. Невалидность мы поправим.
Отв: Проверка валидности fb2-файла при загрузке ???
Не пропускать невалидные файлы - это вряд ли реально нужно, а вот некая пометка, позволяющая невалидников обнаружить - не помешала бы.
Отв: Проверка валидности fb2-файла при загрузке ???
А кто-нибудь более-менее формально описать процедуру валидации может?
Разобрать XML, проверить возможность тэгов и словарно-кодируемых полей?
Всё?
Если всё, я в свой скрипт могу это добавить (XML-разбор там уже есть)...
Он, правда, не на ПХП, а на Питоне, но не думаю, что это нынче проблема для большинства хостингов.
Отв: Проверка валидности fb2-файла при загрузке ???
Формализовать процедуру "исправления" невалидного файла, чтобы он стал валидным, почти невозможно. Можно только пытаться проверять и исправлять набор часто встречаемых ошибок (как-то : неправильный порядок тегов 'title' и 'epigraph'; тег 'title' в середине текста; оформление стихов в тексте тегом 'epigraph' и так далее).
Однако задавая вопрос в теме топика я имел в виду : проверять валидность перед загрузкой на сервер и в случае ошибок,- сообщать пользователю об этом и не загружать невалидный файл. Подразумевается, что после этого пользователь потратит еще 1-2 минуту на исправление своего файла, и загрузит этот файл исправленным 8-)
Отв: Проверка валидности fb2-файла при загрузке ???
>тег 'title' в середине текста
А это из чего следует что невалидно? это допускает схема, и, более того, явно присуствует в примерах на fictionbook.org.
Это какой-то тогда не XML уже получается, а некий формат издалека напоминающий XML :-)
Отв: Проверка валидности fb2-файла при загрузке ???
title должно быть в начале секции. Это переводится как заголовок, если вы не в курсе. В середине секции title быть не может.
Правильно:
<section>
<title></title>
<p></p>
<p></p>
</section>
Не правильно:
<section>
<p></p>
<title></title>
<p></p>
</section>
Отв: Проверка валидности fb2-файла при загрузке ???
Отв: Проверка валидности fb2-файла при загрузке ???
Проверка валидности очень не помешала бы.
В некоторых файлах, (в них сказано что сделаны они в "LibRusEc kit") пометки, сноски, перевод разных понятий заключены в знаки < >,хотя по спецификации XML они должны быть в виде
< >соответственно, также иногда попадается знак & (амперсанд) хотя и он должен быть написан не прямо, а специально вот так&Из-за таких нарушений формата разметки XML некоторые файлы не возможно читать программами которые четко следуют спецификации XML
Отв: Проверка валидности fb2-файла от автора "LibRusEc kit".
Проверка валидности при загрузке fb2-файлов от автора "LibRusEc kit" - хорошая шутка, спасибо :)
Если серьезно - дайте ссылки на книги, а еще лучше - давайте исправим их вместе.
Отв: Проверка валидности fb2-файла от автора "LibRusEc kit".
Я могу сгенерить список. Только, боюсь, в нем будет несколько десятков тысяч (не несколько тысяч, а несколько десятков тысяч) книг. И што мы будем с ими делать?
Отв: Проверка валидности fb2-файла от автора "LibRusEc kit".
Точнее, 47 642 : http://lib.rus.ec/stat/document-author .
Проверить на другие варианты файла - скачать - открыть - поиск символов с автозаменой - сохранить - залить на Либрусек.
repeat
Всего по 23 821 на рыло.
Отв: Проверка валидности fb2-файла от автора "LibRusEc kit".
:) Да, рыла могут треснуть.
На самом деле немножко меньше: у меня готовятся что-то в районе четырех тысяч книг с Алдебарана/Литреса, которые будут заменой Либрусек-Киту. Но пока никак не приспособлюсь чтобы залить их без ручных разборок с дублями... :((
С другой стороны - супротив 47-ми тысяч оно не то чтобы совсем уж мертвому припарки... но и ненамного больше.