Вы здесьНеполные файлы в формате txt
Опубликовано ср, 23/07/2008 - 13:11 пользователем foxm
Я скачиваю книги в формате txt (мне так удобнее). Но вот сейчас скачал Карамзина "История государства Российского" и обнаружил, что первые два тома:
|
Вход на сайтПоиск по блогам и форумамUser menuПоследние комментарии
etorus2008 RE:Отв: Помогите найти книгу по описанию 22 часа
lemma7 RE:Чёрный нимб и другие истории, исполненные неизъяснимого ужаса 2 дня Wedmak RE:Помогите найти!.. #2 2 дня monochka RE:Подайте бедному копеечку на книжку с литреса... 4 часа sem14 RE:Координация сканирования и вычитки 1 неделя babajga RE:Кто сможет раздобыть и оцифровать нужные мне книги? 1 неделя Isais RE:Мои открытия 1 неделя kopak RE:О группе Дятлова. О той самой, того самого... 2 недели A5. RE:Не присылает пароль на почту 2 недели babajga RE:Плюмаж 1 месяц babajga RE:Блошкинс и Фрю. Опасное путешествие 1 месяц alexk RE:Багрепорт - 2 1 месяц babajga RE:Удивленная сова 1 месяц Larisa_F RE:Серия «Квадрат» издательства «Текст» 1 месяц Aleks_Sim RE:Беженцы с Флибусты 1 месяц edvud RE:Прошу переформатировать, распознать, etc... 1 месяц monochka RE:С 8 Марта! 1 месяц babajga RE:Книга чуДОМищ 1 месяц Впечатления о книгах
RedRoses3 про Шанина: Эвтаназия (Дамский детективный роман)
02 05 По видимому литнегры писали каждый свой кусок, а потом кое-как слепили в целое...
tvv про Viljams Troters
30 04 William R. Trotter настоящее имя. Объединять можно только с русской страничкой, которой пока нет.
Лысенко Владимир Андреевич про Усманов: Свет в конце тоннеля (Боевая фантастика, Героическая фантастика, Космическая фантастика)
30 04 Как всегда много воды, но раз прочитать можно. Оценка: отлично!
jefomit.olga@yandex.ru про Лев Брусилов
30 04 Это не детектив, а резина, тянется бесконечно, совершенно не соответствует времени, месту, нечитаемо
дядя_Андрей про Пантелей: Война и миръ (Альтернативная история, Самиздат, сетевая литература)
30 04 До чего же была хороша первая часть, и какого гуано автор наложил во второй. Ставлю тройку только и лишь Оценка: неплохо
irukan про Коткин: Сталин. Том 1. Парадоксы власти, 1878–1928 [Stalin: Paradoxes of Power, 1878–1928 ru] (История, Политика, Биографии и Мемуары)
29 04 Спасибо выложившему! Давно искал
Belomor.canal про Коткин: Сталин. Том 1. Парадоксы власти, 1878–1928 [Stalin: Paradoxes of Power, 1878–1928 ru] (История, Политика, Биографии и Мемуары)
29 04 Огромное спасибо сделавшему книгу! Этот труд надо всем читать! Оценка: отлично!
A5. про Тендряков: Находка (Советская классическая проза)
29 04 После фильмы захотелось припасть к первоисточнику. Припал. Первоисточник понравился больше. Странно, что я вообще не знал Тендрякова. То есть я знал, что вроде есть такой писатель, но у меня он ассоциировался с детгизом. А ……… Оценка: отлично!
gruin про Видум: Настроение – Песец [СИ] (Альтернативная история, Фэнтези, Самиздат, сетевая литература)
28 04 Читать можно, но хуже предыдущих Оценка: неплохо
Belomor.canal про Иванов: Петербургские зимы (Русская классическая проза, Поэзия: прочее, Биографии и Мемуары, Классическая русская поэзия)
28 04 Масса забытых мелочей "«Принц фиалок и сирени» встретил меня, прикрывая ладонью шею: он был без воротничка." Шея была частью "голого тела" и ее посторонним не прилично показывать. Рубашка, в те времена, была нижним бельём! ……… Оценка: отлично!
udrees про Михайлов: ПереКРЕСТок одиночества 4. Часть 2 [СИ] (Детективная фантастика, Социальная фантастика, Фантастика: прочее, Самиздат, сетевая литература)
28 04 Отлично, грамотно написанное окончание серии. Автор правильно завершил серию, додумывать можно всякое, но в целом нареканий нет. Книга написана хорошо, в том же спокойном, неторопливом стиле, который к концу ускоряется до ……… Оценка: отлично! |
Комментарии
Отв: Неполные файлы в формате txt
Если я правильно понимаю, то книги в Либрусеке не хранятся в разных форматах. Скачать книги в txt можно в двух случаях:
1). Книга на Либрусеке лежит изначально в txt. Тогда возле неё будет линк "(скачать txt)" и не будет линка "(читать)".
2). Книга на Либрусеке лежит в fb2, возле неё линк "(читать)" и "(скачать)" , и только при скачивании выбирается формат txt из пулл-даун меню. Если не ошибаюсь, при этом txt генерируется из fb2 на лету неким скриптом-конвертером.
У Вас, как я понимаю, второй случай. Тогда подозрение падает не только на на простой "недокач", что нередко бывает, но и на скрипт-конвертер из fb2 в txt.
Для того чтобы убедиться, что проблема не в недокаче (оборванном посередине сенасе скачивания), а в конвертере, я бы на Вашем месте сделал так:
1. Скачал в txt одну и ту же (хранящуюся в fb2) книгу раз пять-шесть.
2. Если во всех случаях текст обрывается строго на одном и том же месте - на подозрении конвертер, надо писать Ларину.
3. Если текст обрывается на разных местах, то это, скорее всего, недокач. Ничем помочь не смогу...
Отв: Неполные файлы в формате txt
Думаю, что недокач тут ни при чем, потому что я скачивал все 12 томов СРАЗУ, выделив их галочкой и нажав кнопку "Выкачать все выбранное". Я так понимаю, что прим этом вся обработка идет на сервере, а мне отправляется архив из уже сформированных книг, который скачался нормально.
Если я понимаю это неправильно, готов попробовать, как Вы сказали...
Отв: Неполные файлы в формате txt
Оп-па... тогда да, Вы все правильно написали, всё происходит на сервере, значит это не недокач... значит, fb2-to-txt конвертер глючит. Я бы на Вашем месте завел тему в форуме "Функциональность", детально описал происходящее (обязательно указать какие именно книги и точную последовательность Ваших действий - для отлова бага Ларину непременно нужна воспроизводимость), а потом написал Ларину в личку с просьбой обратить внимание на этот багрепорт.
(подумав) Но, честно говоря, на мгновенную реакцию я бы не очень рассчитывал. Все-таки основной формат - это fb2... и он таки несравнимо удобнее, чем txt. В общем, я бы на Вашем месте подумал - а не перейти ли на fb2.
Отв: Неполные файлы в формате txt
Ещё может быть невалидный fb2. В некоторых случаях, когда непорядок с тегами <р>, книгу невозможно дочитать до конца (в онлайн-читалке).
Отв: Неполные файлы в формате txt
Возможно... хотя упомянутые А.А.Васильев История Византийской империи. Т.1 и Т.2
http://lib.rus.ec/b/74044
http://lib.rus.ec/b/74045
fb2 - валидны... по крайней мере по мнению FBE. Я как-то заметил, что файл на который FBI ругался, прошел валидацию в FBE. Бог его знает кто из них прав.
Отв: Неполные файлы в формате txt
IMHO, больше достоин доверия FBI.
Отв: Неполные файлы в формате txt
Проверил FBI-ем - тоже валидны, са-б-баки...
Отв: Причина найдена??
Если просмотреть фб2 файл в текстовом редакторе, то можно заметить, что текстовый файл заканчивается аккурат в том месте, где начинается кусок текста на греческом.
То есть, скрипт обламывается при поптытке вставить в txt юникодные символы.
Отв: Причина найдена??
О. Это уже очень хороший задел Ларину для поиска бага.
Отв: Причина найдена??
Точно, каждый из закаченных файлов обрывался на юникодовском символе.
А вот здесь 10501 закачалось полностью. Нет юникода - нет проблем.
Отв: Неполные файлы в формате txt
Вот сейчас обнаружил, что у А.А.Васильева История Византийской империи. Т.1 и Т.2
http://lib.rus.ec/b/74044
http://lib.rus.ec/b/74045
в формате txt тоже только кусок текста.
Отв: Неполные файлы в формате txt
О_о
У меня вообще не получается скачать txt, только fb2. Это глюк браузера?
Опера 9.24 (джаваскрипт - вкл)
Отв: Неполные файлы в формате txt
А у меня Опера 9.51. И в целом скачивается.
Отв: Неполные файлы в формате txt
Обновил версию.
Все - ок.
Текстовые файлики действительно какие-то мелкие.
26кб против 562кб у Византийской Империи.
=/
Отв: Неполные файлы в формате txt
почему можно помочь,
скачать книгу в fb2, а затем из неё сделать тхт
Отв: Неполные файлы в формате txt
Ну в данном конкретном случае я так и сделал, но хотелось бы обойтись без лишних телодвижений...
Отв: Неполные файлы в формате txt
Проверил на нескольких файлах разного размера и "валидности". Похоже, что редко закачивают в форматах отличных от фб, иначе бы давно заметили, что не один баг, а два.
Первый: текстовой файл обрезается во время подготовки файла. Остается 1/5 - 1/3 часть.
Второй: html генерируется полностью, только с тем же недостатком, что был раньше у читалки: открытый тег H3 остается незакрытым, поэтому весь текст идет как один большой заголовок.
Последнее проверил только на двух файлах, может на других все тип-топ.