Новая книга

Очень давно, в далёком уже 1992 году мне попалась одна книга. Помню, прочитав её, я был под большим впечатлением. С тех пор ни эту книгу, ни другие книги того же автора, я больше не встречал на прилавках. И вот, о чудо! совсем недавно я случайно наткнулся на неё в сети. К моему удивлению, когда я её перечитал, то остававшееся у меня впечатление только усилиось. И теперь я очень хочу познакомить с ней читателей библиотеки. По жанру книга, скорее всего, относится к фэнтези, только несколько не обычному. Наверное, это городское фэнтези, хотя сам этот термин, я не очень понимаю. В книге увлекательный сюжет, нормальный главный герой, который несколько раз попадает в сложные ситуации и, поначалу, ничего не понимает. Но, потом всё же выпутывается. Есть небольшая любовная линия, но она не главная. Есть несколько очень хороших, по крайней мере, на мой взгляд, стихов или баллад. И увлекательный сюжет. А теперь, когда я вас немного заинтересовал сообщу название. Речь идёт о книге Виктора Обухова "Тайна болотных демонов"
К сожалению она у меня только в pdf, а как превратить её в fb2 я не знаю, и даже не пытался. Весит книга довольно прилично - 7,93 МБ, загружать её, поэтому, следует через FTP, но у меня не получилось, наверное что-то не так делаю. Прошу не судить меня строго, всё же по всем своим образованиям. я гуманитарий.
В общем я выложил её вот здесь: http://www.filehoster.ru/files/bp4470. Будет висеть там 30 дней, считая с сегодняшнего. Может быть кто-нибудь из более продвинутых посетителей библиотеки сумеет за это время залить её сюда? И даже переформатировать в fb2? Я буду только рад. Да и вы, право слово, не пожалеете. Книга на самом деле увлекательная.

Комментарии

Залил. http://lib.rus.ec/b/123780
Качество PDF-а, правда, отвратное - OCR вряд ли возможен, но раз другого нет...

Большое спасибо. Может теперь кто-нибудь отважится перевести в другой формат.

Пробую в txt - предупреждаю, форматирование и графические включения будут потеряны....

Уже кто-то эту книгу в fb2 перегоняет (из того же кошмарного pdf):

http://www.biblus.ru/Default.aspx?book=1b289j28i4

Mathias 9/28/2008 Сейчас перегоняю книгу в FB2, работы много - очень уж PDF некачественный. Скоро выложу в Либрусеке.

TaKir написал:
Уже кто-то эту книгу в fb2 перегоняет (из того же кошмарного pdf):

http://www.biblus.ru/Default.aspx?book=1b289j28i4

Mathias 9/28/2008 Сейчас перегоняю книгу в FB2, работы много - очень уж PDF некачественный. Скоро выложу в Либрусеке.

Я и перегоняю. Подтверждаю все сказанное - работы много (и по перегонке PDF, и вообще... много), времени мало. Сейчас готова половина. Одни развороты ограничиваются небольшой правкой, другие приходится почти полностью набивать заново.

Mathias написал:
Одни развороты ограничиваются небольшой правкой, другие приходится почти полностью набивать заново.

Я видел... Если некоторые страницы ещё как-то поддаются распознаванию, то на второй половине книги полный мусор...

Ну, PDFTransformer на 2й машине у меня уже пыхтит и отплёвывается, где-то через пару часов можно будет посмотреть на получившийся результат (TXT). Кстати, не нашел у нас (на Либрусеке) темы, посвященной OCR- и форматирующему PDF|DJVU софту. Я плохо искал, или ?

Ulenspiegel написал:
Кстати, не нашел у нас (на Либрусеке) темы, посвященной OCR- и форматирующему PDF|DJVU софту. Я плохо искал, или ?

Ну..наверное, не очень хорошо:)
http://lib.rus.ec/soft
и немного здесь:
http://lib.rus.ec/node/103490

Если выйдет txt, возьмусь за иллюстрации и форматирование.

Мдя-я-я... Похоже, что для получения хотя бы плохонького OCRа нужно постранично обрабатывать изображение в каком-либо графич.редакторе, увеличивать разрешение, а затем окрить (у меня иначе не вышло ничего приличного).
Ой-ой-ой!

У-ёёё.... Цитирую:
- Ну. и тоже мало маю.—ободряющим голосом (словно бы утешай меня) сил»ал Володя.
— Чего?
— Преданий. Ну вот, к примеру, те же самые жн-бм — Скялнно. что вывел их в давние иремена Иг II пур Птгнаниик. предпоследний Царь Наур-ога. Коротая мрсма и тюрьме. — Правда, я забыл, что вз «того
ПМИ1ЛО. . .

И это - пресловутый 9й FR.... Это уже не вычитка будет, а набор по новой.....
Пини и панове, это вообще как-нибудь лечится ? Технологии там какие-нибудь, святой водой процессор сбрызнуть, или мухомор на клавиатуру положить ? А то сканы книг 40х годов вряд-ли на автомате лучше распознаются... :(

Да, пани Таня, спасибо за ссылки, пропустил в своё время пару интересных программ. :)

Ulenspiegel написал:

И это - пресловутый 9й FR.... Это уже не вычитка будет, а набор по новой.....
Пини и панове, это вообще как-нибудь лечится ? Технологии там какие-нибудь, святой водой процессор сбрызнуть, или мухомор на клавиатуру положить ?

В данном случае, возможно, кроме разборки pdf на страницы-тифы и прогона экшеном в фотошопе для увеличения контраста и резкости (методом подбора), ничего не поможет...

Ulenspiegel написал:

А то сканы книг 40х годов вряд-ли на автомате лучше распознаются... :(

Если отсканировано нормально, то хоть 40-ые прошлого века, хоть 19 век - пофиг.

Попробую вечером десяток страниц разными способами поулучшать... Но качество скана там, конечно, кошмар.

TaKir написал:

В данном случае, возможно, кроме разборки pdf на страницы-тифы и прогона экшеном в фотошопе для увеличения контраста и резкости (методом подбора), ничего не поможет...

Согласна. Попробовала одну страничку сделать разными способами. Лучше результат правда получился не с тиффом, а с япегом. Резкости и контраста мало, после я добавляла еще shadow\highlight + увеличение разрешения + отсекание оттенков. И то - получилось всего лишь сносно.

Tanja45 написал:

Попробовала одну страничку сделать разными способами. Лучше результат правда получился не с тиффом, а с япегом. Резкости и контраста мало, после я добавляла еще shadow\highlight + увеличение разрешения + отсекание оттенков. И то - получилось всего лишь сносно.

Можно попробовать белую точку выставить по серому фону... Через levels. Только предварительно задрать контраст, наверное, надо.
Но чуда не получится с таким исходником, это понятно...

TaKir написал:

Можно попробовать белую точку выставить по серому фону... Через levels. Только предварительно задрать контраст, наверное, надо.
Но чуда не получится с таким исходником, это понятно...

Сильно контраст задирать не надо - плохо выходит; у меня лучше получилось, если после осветления, контраста и прочего серый фон зачернить. С некоторыми страницами помогает (после обработки) сохранение с уменьшением кол-ва цветов для web. Но каждая страница - это должна быть ручная работа. Ужас!!!

Tanja45 написал:
Но каждая страница - это должна быть ручная работа. Ужас!!!

Есть еще предложение попробовать ABBY Screenshot Reader-ом, благо, страниц немного...
У кого ФР есть, обычно по умолчанию с ним ставится и ABBY Screenshot Reader. Как раз для фиговых текстов с экранным разрешением.

http://www.cwer.ru/portable_abbyy_screenshot_reader

TaKir написал:

Есть еще предложение попробовать ABBY Screenshot Reader-ом, благо, страниц немного...

Попробовала. И распознать, как текст, и сохранить, как рисунок, а затем распознать.
Получается... э-э-э... текст на тарабарском языке:))
Но при таком качестве PDF и это здорово. С извращениями с фотошопом текст лучше. Намного. Но о-о-чень долго!:)

А программка отличная. Большое спасибо за ликбес - она мне очень пригодится!

Ну, стандартный совет для пакетной обработки картинок - имэджмэджик, благо и под Виндовс он есть. http://www.imagemagick.org/script/binary-releases.php
Там надо будет немного поэксперементировать с опциями, чтобы качество менялось в нужную сторону:)
А зато потом можно хоть 100 картинок, хоть 10000 обработать, не приходя в сознание.

Цитата:
Если отсканировано нормально, то хоть 40-ые прошлого века, хоть 19 век - пофиг.

Фактура и неоднородности бумаги, имхо, влияние оказывают. Сейчас проверяю, на "Спутнике партизана" :)

Ulenspiegel написал:

Фактура и неоднородности бумаги, имхо, влияние оказывают. Сейчас проверяю, на "Спутнике партизана" :)

Оказывают, но если сразу при сканежке подобрать уровнями нормальное соотношение, то будет практически как скан с любой современной книги ))

fylhtq написал:
загружать её, поэтому, следует через FTP, но у меня не получилось, наверное что-то не так делаю.

На всякий случай - инструкция.
1. Заливаем на фтп.
2. Идём на страничку автора. (Если автора ещё нет - создаём.) Жмём "(добавить книгу)".
3. В поле "уже загружен на фтп либрусека" пишем путь к файлу относительно корня. Если файл был загружен в корень фтп - просто имя (например, "book.pdf"), если в подкаталог ocr - "ocr/book.pdf". Регистр букв имеет значение.
4. Заполняем поля "тип", "название", "жанры". Жмякаем "Загрузить".

А как попасть на фтп либрусека? Я не догоняю. Искал искал в карте сайта - не нашёл. А так книг ещё много, хочу научиться сам закачивать.

fylhtq написал:
А как попасть на фтп либрусека? Я не догоняю. Искал искал в карте сайта - не нашёл. А так книг ещё много, хочу научиться сам закачивать.

Хост: lib.rus.ec
Логин: ocr
Пароль: newbook

пытался так войти, вводя этот логин и пароль, мне ответили, что они неверны и у самого чуть регистрация не накрылась. ещё какие-нибудь способы есть?

fylhtq написал:
пытался так войти, вводя этот логин и пароль,

Войти где ? На главной страничке Либрусека, там, где обычно почитать-поругаться заходим ?
Если да, то это неправильное решение, надо либо входито на ftp://lib.rus.ec/, и потом вводить указанные (а не свои, библиотечные) логин и пароль, либо сразу заходить на ftp://ocr:newbook@lib.rus.ec/ (то же самое, но с указанием логина/пароля в адресной строке).

нажимал на указанные ссылки - выдаёт "список папок - имя, каталог, дата" никаких адресных строк куда бы это самое ocr или пароль вводить. Я наверное окончательно отупел.

fylhtq написал:
нажимал на указанные ссылки - выдаёт "список папок - имя, каталог, дата" никаких адресных строк куда бы это самое ocr или пароль вводить. Я наверное окончательно отупел.

Не-а.... :) Просто по умолчанию, если не задавать логин/пароль, он (броузер) заходит на ftp как анонимный пользователь, абсолютно бесправный. Точнее, не имеющий права что-нибудь записать на ftp-сервер.
Кстати, как указывал герр Малолетний, ффокс действительно не умеет сам по себе закачивать что-либо на ftp, придется либо использовать плагин к нему, либо отдельно стоящего клиента. У Вас кто стоит в качестве броузера ?

ничего, встроенный оперовский

Уупс.... С Оперой - ни разу в жизни..... :( Ну, надеюсь, кто-нибудь сейчас откликнется....

Или в адресной строке ффокса (думаю, что и для прочих оперов верно) : ftp://ocr:newbook@lib.rus.ec/
Да, ахтунг - при некоторых настройках прокси, практикуемых некоторыми несознательными сисадминами, залить на ftp через броузер ничего не получится, придется ставить отдельного клиента.

Ulenspiegel написал:
Или в адресной строке ффокса

А не нужно ли, чтобы фф мог таки заливать, ставить специальное расширение?

Малолетний Д. написал:
Ulenspiegel написал:
Или в адресной строке ффокса

А не нужно ли, чтобы фф мог таки заливать, ставить специальное расширение?

Да, кстати, скорее всего - надо. Я ставил FireFTP, вполне пристойный plugin'чик.

После 8 ФР получил следующее: Шопом в обоих случаях пока ничего не правил.

Самое начало книги:

История яте началась в городе М. (просьба не разгадывать его как «Москву»: небольшой областной городок, от столицы нашей весьма н весьма неблизко). — Началась там, в продолжилась Бог анвет где,—да н вообще все, что произошло с человеком, рассказывавшим мне ее, выглядит настолько странно, что в не решаюсь высказывать какие-либо суждения о правдоподобии — неправдоподобии нижеизложенного.— То есть, говоря попросту, умываю руки и пересказываю то, что услышал. И как запомнил. Надеюсь, понятно, почему я —в какой уж раз на недолгий срок — взялся за перо. В мою коллекцию жертв нечистых сил добавилось ешс одно приобретение. Оно называется Володей п. наверное, является самым (кзотичесюш из чвела всех моих приобретений. — Впрочем, я, конечно, сочувствую всем, внесшим вклад в мою коллекцию... Но Володе — особенно. Происшествия, о которык поведали мне другие, были тоже невероятны. но в меру. В наше время, как все мы понимаем, многое можно допустить: и реального, и потустороннего, н даже такого, что раньше приходило человеку на ум только прп белой горячке. Но даже прн такт допусках. Воли-ля (пусть он в приукрасил свой рассказ) претерпел от демонов чересчур уж с избытком. — Слушая его. я (человек ко многому привычный и подготовленный), все же частенько испытывал сомнения: а так ли уж нормален мой собеседник?..

После ABBY Screenshot Reader-а:

История эта началась в городе М. (просьба не разгадывать его как «Москву»: небольшой областной городок, от столицы нашей весьма н весьма неблизко). — Началась там» а продолжилась Бог знает где,— да н вообще все, что произошло с человеком, рассказывавшим мне ее, выглядит НАСТОЛЬКО странно, что я не решаюсь высказывать какие-либо суждения о правдоподобии — неправдоподобии нижеизложенного.— То есть, говоря попросту, умываю руки г! пересказываю то, что услышал. И как запомнил. Надеюсь, понятно, почему я —в какой уж раз на недолгий срок — мялся за перо. В мою коллекцию жертв нечистых сил добавилось еше одио приобретение. Оно называется Володей и, наверное, является самый •кзотическнм на числа всех моих приобретений. — Впрочем, я, конечно, сочувствую всем, внесшим вклад в мою коллекцию... Но Володе — особенно. Происшествия, о которых поведали мне другие, были тоже невероятны, но в меру. В наше время, как все мы понимаем, многое можно допустить: и реального, и потустороннего, н даже такого, ЧТО раньше приходило человеку на ум только при белой горячке. Но даже при таки* допусках. Воли-лв (пусть он и приукрасил свой рассказ) претерпел от демонов чересчур уж с избытком. — Слушая его, я (человек ко многому привычный н подготовленный), все же частенько испытывал сомнения: а ток ли уж нормален мой собеседник?..

а вот я пытаюсь залить книгу 'Чихольд Я. - Облик книги'
захожу на фтп (через фтп клиент), делайу папку со своим ником, пытаюсь закинуть файл (пдф зараренный, размер 20 мб) - не закидывается...
что я делаю неправильно?

kpot написал:
что я делаю неправильно?

не нужно создавать папку. Лейте в корень :)

P.S. На будущее: сервер вам чистым английским языком сообщает код ошибки, если приведете его - будет легче разобраться.

спасибо за быстрый ответ!
ну я уже залил в папку ocr (oblik.rar), пытаюсь теперь через форму (http://lib.rus.ec/upload/ftp/) закончить процесс - а мне выдает 'файл не находит... беда'
хотя файл явно лежит в папке оцр

Такая книга у нас уже есть: http://lib.rus.ec/b/107275

странно, я предварительно специально искал и не нашел
ну а вот хочу добавить еще юрия гордона - книга про буквы от а до я (у темы лебедева ета книга пиариться тоже)

и все таки хотелось бы разобраться - почему я не могу закончить процесс добавления книги выше?
то-есть, повторяю - файл уже залил и он находится в папке ocr, а когда пытаюсь завершить процесс через форму - файл не находит?
попробуйте сами например мой етот файл завершить

Пример заполнения формы:

Файл ocr/oblik.rar
Тип файла (обязательно) pdf
Название (обязательно, если не указано внутри fb2) Облик книги
Жанры, через запятую (если не указан внутри fb2) design
Год издания 1980
Язык (двухбуквенный код) ru

именно!
но не находит!

upd:
уже удалили
однако не находило и когда она там лежала

Н-да... Глючит :( Выдало "Автор не найден" и снесло файл с ftp.
Для "Книга про буквы от Аа до Яя" воспользуйтесь этой формой: http://lib.rus.ec/a/26547/addbook/

и через http://lib.rus.ec/a/26547/addbook/ тоже ненаходитбеда...

ок попробую залить гордона - его пока тут нету...

ну вот опять... залил юрия гордона (проверял, небыло его) - файл называется gordon.rar и лежит в папке \ocr
книга называется 'книга про буквы от а до я'
захожу на http://lib.rus.ec/upload/ftp/ заполняю - файл не найден... беда

попробуйте сами!
и скажите мне что я делаю неправильно??

или как вообще люди обычно добавляют книги размером больше чем пару мб? может я вообще зря через ету форму добавляю? или все так и делают?

kpot написал:
ну вот опять... залил юрия гордона (проверял, небыло его) - файл называется gordon.rar и лежит в папке \ocr
книга называется 'книга про буквы от а до я'
захожу на http://lib.rus.ec/upload/ftp/ заполняю - файл не найден... беда
попробуйте сами!
и скажите мне что я делаю неправильно??

Напишите *точно*, что именно Вы заполняли в форме на http://lib.rus.ec/upload/ftp/

Файл: gordon.rar

Тип файла (обязательно): pdf

Название (обязательно, если не указано внутри fb2): Юрий Гордон - Про буквы от А до Я

Жанры, через запятую (если не указан внутри fb2): design, reference

Год издания: 2004

Язык (двухбуквенный код): ru

kpot написал:
Файл: gordon.rar

Вот тут - ошибка. Файл лежит в поддиректории "ocr", а Вы написали как будто он лежит в корневом директории ftp-сервера. Попробуйте написать "Файл: ocr/gordon.rar"

пробовал и ocr/gordon.rar
результат тот же
да вы сами попробуйте

agrey написал:
Книга добавлена

(голосом английского джентльмена) Но как?!

pkn написал:
agrey написал:
Книга добавлена

(голосом английского джентльмена) Но как?!

OK, let me guess... Не через http://lib.rus.ec/upload/ftp/ а через http://lib.rus.ec/a/26547/addbook/ , правильно?

Страницы

X