Вы здесьНеправильные книги
Опубликовано пн, 30/03/2009 - 21:01 пользователем Marked
Решил вот заменить свою библиотеку, скачанную оттуда-отсюда, на fb2 файлы... Смотрю на Либрусеке (по алфавиту, как у меня книги в папках лежат): Айзек Азимов "Тупик". Здесь вместо него лежит рассказ Генри Каттнера "Порочный круг". Следующая папка - Кевин Андерсон, серия "Сага Семи Солнц". Первые две книги здесь на либрусеке поменяны местами. (названия правильные, текст неправильный). Эта ошибка распространенная, так как в астовском издании в серии "Золотая библиотека фантастики" они тоже поменяны местами. На фензине, кстати, лежит аналогично... Следующая книга Пол Андерсон "Орион взойдет". Скачал, открываю - там только "от автора" и полторы строчки текста... и все.
|
Вход на сайтПоиск по блогам и форумамUser menuПоследние комментарии
weis RE:Прошу переформатировать, распознать, etc... 3 дня
Океана RE:Подайте бедному копеечку на книжку с литреса... 1 день larin RE:Заплатила, а абонемента нет и скачать ничего не могу! 1 неделя sibkron RE:Серия "Библиотека французской литературы" (Макбел) 1 неделя akorish RE:Регистрация 1 месяц Tramell RE:Серия "Очень прикольная книга", издательство Азбука-классика 1 месяц Larisa_F RE:Серия "Я познаю мир" издательства "АСТ, Астрель, Олимп",... 1 месяц konst1 RE:Ух, как я не люблю спамеров! 1 месяц tvv RE:DNS 1 месяц sem14 RE:«Не забыть бы тогда, не простить бы и не потерять!»-2 ... 1 месяц larin RE:Заблокирован 2 месяца konst1 RE:Серия «Интеллектуальный детектив» изд-ва АСТ 2 месяца Larisa_F RE:Серия книг «Судьбы книг» издательства «Книга» 2 месяца fixel RE:Пропал абонемент 2 месяца sem14 RE:Книжная серия "Жизнь в искусстве" издательство "Искусство"... 3 месяца sibkron RE:"100 славянских романов", серия изд.-ва "Центр книги... 3 месяца Larisa_F RE:Серия "Новые сказочные повести" издательство "Самовар" ... 4 месяца sem14 RE:Серия "Символы времени" издательства "Аграф" 4 месяца Впечатления о книгах
Gilean про Алим Тыналин
09 06 Все книги читабельны )) Прочитал серию Биржевик, Фарцовщик и читаю Криминалиста. Мне нравится, неплохая подача материала, да и ошибок в тексте мало.
Sello про Пинчон: Выкрикивается лот 49 [The Crying of Lot 49 ru] (Современная проза)
09 06 Начальный Пинчон", - сыроват, с некоторыми неувязками (например, после связи с Метцгертом, Эдипа, размышляя, говорит о "своем единственном любовнике", забывая почему-то об "основном", Пирсе), немного затянут в поисках ответа ……… Оценка: хорошо
Chernovol про Созонтов: История России в датах. 100 главных событий (История)
08 06 Пропущенные вехи истории: голодомор, ввод советских войск в Чехословакию. А советские войска не вошли, а напали на Польшу в 1939 г. Оценка: неплохо
Никос Костакис про Шиляев: Телохранитель Генсека. Том 7 [СИ] (Альтернативная история, Попаданцы, Самиздат, сетевая литература)
08 06 о присвоении его к званию Героя Советского Союза" ____ Йа! Рузский йазыка есть очень трудное!
Barbud про Воронцов: Петербургский врач. Часть 1 [СИ] (Альтернативная история, Самиздат, сетевая литература)
08 06 Да что же такое, еще один попадун пенициллин на коленке варить собрался!) Впрочем, это же ИИшное творчество - нейросеть, наверное, просто выдернула из других, гораздо более одиозных опусов идею создания антибиотиков из подручных средств. Оценка: плохо
mysevra про Березин: Пентаграмма Осоавиахима [litres] (Альтернативная история, Современная проза, Городское фэнтези)
08 06 Как той собачке, ничего не светит, акцент выборочно-минорный. Но язык хорош, улыбнуло. Оценка: хорошо
mysevra про Мороз: Мгла [СИ] (Фэнтези, Самиздат, сетевая литература)
08 06 Сейчас много таких книг: золотая идея, оригинальная и интересная, а изложить человек не в состоянии – ни словарного запаса, ни фантазии, ни таланта плести словесные кружева или же просто изъясняться чётко и внятно. Таким надо ……… Оценка: неплохо
mysevra про Реньжина: Бабушка сказала сидеть тихо (Современная проза)
08 06 Эта книжка упоминалась в каком-то списке самых жутких историй, поэтому я и ждала чего-то запредельного и щекочущего воображение. А это просто женская проза, милая и грустная. Не люблю такое. Оценка: неплохо
xZiminxx про Воронцов: Петербургский врач. Часть 4 [СИ] (Альтернативная история, Самиздат, сетевая литература)
07 06 чем дальше тем хуже . это альтернативка или техническая литература? Оценка: нечитаемо
Lan2292 про Антонов: Портальщик. Частная практика [СИ] (Фэнтези, Попаданцы, Самиздат, сетевая литература)
07 06 Хорошая идея, но вот исполнение.... Не знаю, не стала дочитывать Оценка: неплохо
xZiminxx про Дорин: В небе 1941-го (Альтернативная история, Боевая фантастика, Самиздат, сетевая литература)
07 06 Автор в начале книги бред несет . В Украине бои ведутся 10-20 км до линии соприкосновения так что сбить его могли только в начале войны . да и героя могли дать за драмтеатор в Мариуполе 300-600 погибших Оценка: неплохо |
Комментарии
Отв: Неправильные книги
НЕ СКАЧИВАЙТЕ КНИГИ-FB2 В ФОРМАТЕ TXT !!!
Отв: Неправильные книги
Интересно... А зачем тогда в выпадающем списке есть txt? Для красоты? Или "шоб было"?
...Не поверю, что из fb2 так трудно сделать текст автоматом.
Отв: Неправильные книги
Сделать нетрудно.
Текущий конвертор использует встроенный в пых парсер XML, который молча падает на любой ошибке.
Всё никак не соберусь переписать.
Отв: Неправильные книги
А-а. Так вот оно почему не стреляет - не заряжено...
Илья, я вскоре всё равно для одной затеи буду писать на Перле "извлекатель текста из fb2". Без парсера, конечно. Если тебя Перл устроит, можно будет сделать перловую тхт-конвертилку.
Отв: Неправильные книги
Лучше бы перловую xml-проверялку, а в идеале и чинилку.
Глянь parcer.inc, туда встроить внешнюю утилиту будет непросто.
Отв: Неправильные книги
Не, это я точно не потяну :(
Отв: Неправильные книги
Эээ... не замечал. Но в принципе - могу помочь. К тому же - в PHP больше одного xml-парсера.
Другой путь получения txt - выбросить всю разметку регулярным выражением.
Отв: Неправильные книги
Перловому можно сказать, что ошибки XML нужно игнорировать.
Есть ли такое решение для пыха? Если есть - это было бы идеально, мне проще поменять парсер, чем писать его самому.
Получение txt - побочный результат.
Основные задачи, решаемые парсером:
1. Вытаскивание оглавления и обложки
2. Онлайн-чтение
3. Генерация html для выкачки
4. Генерация txt.
Отв: Неправильные книги
Я скачивал в формате fb2 :) А также открывал онлайн. Одинаково - только одна строчка...
Отв: Неправильные книги
Файл книги "Орион взойдет" - 1082 K. Это при том, что он текстовый, без обложки, иллюстраций и прочих изображений. Подумайте, могут ли полторы строчки текста весить больше мегабайта? Откройте в любом текстовом редакторе, включая "блокнот" - и убедитесь в том, что кроме второй строчки текста есть и третья.
Невалидный, с точки зрения fb2, символ в 42-й строке файла - это, согласитесь, отличается от неполного текста книги.
Отв: Неправильные книги
Правильно, а также с точки зрения программ, fb2 читающих...
Отв: Неправильные книги
Насчет текста - скачивается зип размером 1.22 Кбайта. Почему - Ларин уже ответил, "недостаток конструкции", как говорили в известном фильме :)
Но зип с fb2 скачивается вполне "нормальный" - размером 460 Кбайт. Хотя... Его действительно не могут открыть FBReader и CoolReader, но AlReader все же открывает. Что-то не так...
Отв: Неправильные книги
В данном случае - да, файл полный. Однако нормально его прочитать проблематично. Тот кто делал файл, видимо, не осознал, что теги <> - зарезервированы в XML. В файле в галочки выделены комментарии переводчика. Отсюда и ошибки при открытии - программы думают, что это тег. В любом случае - это ошибка, просто другая. Так что все равно нужно проверять, что создается и заливается...
Отв: Неправильные книги
Файл сделан с помощью LibRusEc kit. Все претензии к злобному тупому компьютеру :)
Отв: Неправильные книги
Ну, тогда уж к программисту. Надо учесть знаки <> в исходном файле (если не html/xml) и заменять их при конвертации на другие скобки... Попробую заменить скобки вручную и перезалить...
Отв: Неправильные книги
Может, кто и Агатой Кристи займется? У нее в половине книг используются знаки <>...
Отв: Неправильные книги
Точно не я, у меня к детективам весьма негативное отношение(кроме Маклина). Вот фантастика и фэнтези - это пожалуйста...
Отв: Неправильные книги
Потихоньку делаю, но никак не соберусь сделать всё и сразу...
Отв: Неправильные книги
Сделал больше половины файла "ориона", а тут уже выложили нормальную версию... Вот так вот, хочешь сделать, а все равно не дадут. В следующий раз промолчу :)
Отв: Неправильные книги
Конечно, это обидно. Но если бы Вы в названии файла, который взялись починять, добавили бы слово "правка" или "вычитка", то вероятность пересечения с кем-либо еще все таки сильно уменьшилась бы.
Отв: Неправильные книги
Гм, не знал, не знал...
Отв: Неправильные книги
Можно попробывать прогнать тексты через FB2Fix. Большая часть невалидных файлов исправляется, правда я не уверен, что он что либо важное в структуре документа не гробит.
Отв: Неправильные книги
Не гробит. У rusec-файлов нет структуры. У других файлов правда тоже не гробит ;) Оччень полезная программка.
Отв: Неправильные книги
Попробовал на старой версии "Ориона" - действительно помогло. Правда, программка консольная (по крайней мере та версия, что я скачал). Кстати, в той версии файла, что там появился, нет этих самых примечаний переводчика. Хотя в плане разметки она лучше. Думаю, стоит выложить рядом еще одну версию.