Вы здесьХотим много книг, или сканировщики всех стран объединяйтесь!
Опубликовано пт, 04/12/2009 - 06:25 пользователем Lord KiRon
Последнее время озадачился вопросом попадания новых (да и старых) книг в сеть. Что мы имеем на данный момент? - Литресятину и разброд во всем остальном. Плюс еще последние события (вполне логично, однако все так же негативно) дробят наше сообщество сканировщиков и вычитывателей. В результате некоторые книги появляются и покупаются на разных сайтах по два-три раза некоторых совсем нет, люди делают лишнюю работу, за одно создавая потом лишние проблемы "библиотекарям". При всем уважении к Либрусеку, Флибусте, Песочнице , Huge-Library и многим другим я считаю что книги на первичную вычитку нужно брать в одном месте, и на данный момент таким наиболее подходящим местом явл;яется (в силу разных исторических причин) Библиотека Старого Чародея. Собственно речь о том что у них очень много книг, на "обработку" , даже больше чем людей и если вы можете помочь то загляните пожалуйста на главную http://oldmaglib.com/ справа или на форум http://bomanuar.com/forum/index.php?topic=231.0 и присмотрите себе книжку "в работу". За одно, если вы собираетесь купить какую то книжку, вначале проверьте на форуме http://bomanuar.com/forum/index.php?topic=231.0 - может она уже куплена , если вы купили какую то книгу то опять же пожалуйста отметьтесь там же чтобы не производить лишнюю ненужную работу. Да, и кстати , на Чародее применено очень удобное разделение труда - если вы например вычитываете но не имеете сканера и/или книг сканировать - то вы можете получить скан и вычитывать , если у вас есть сканер и книги а вы не имеете понятия как делать FB2 то вы можете отправить скан админу Старого Чародея и его сконвертирует и вычитает кто то другой. Короче, за работу товарищи ! :) Да, еще одна просьба, если вы не уверены что сможете сделать книгу в течении разумного периода времени (ну что то вроде месяца) то пожалуйста не беритесь за работу - этих книг ждут люди. Updated:
|
Вход на сайтПоиск по блогам и форумамUser menuПоследние комментарии
monochka RE:Подайте бедному копеечку на книжку с литреса... 11 часов
Larisa_F RE:Серия "Новые сказочные повести" издательство "Самовар" ... 1 неделя sem14 RE:Серия "Символы времени" издательства "Аграф" 1 неделя Larisa_F RE:Серия книг «Судьбы книг» издательства «Книга» 2 недели tvv RE:faq brainstorm =) 2 недели Larisa_F RE:Серия "Что есть что" издательства "Слово"(чего не хватает) 2 недели Larisa_F RE:Серия "Очень прикольная книга", издательство Азбука-классика 2 недели larin RE:абонемент не обновлен 3 недели sem14 RE:За иллюминатором (серия) - чего не хватает? 3 недели sem14 RE:Собираем серию: "Мастер серия", издательство "Лимбус". 3 недели Larisa_F RE:Книжная серия «Сlio» издательства "Евразия" 3 недели larin RE:Пропал абонемент 1 месяц tvv RE:DNS 1 месяц MrMansur RE:<НРЗБ> 1 месяц Stager RE:Беженцы с Флибусты 1 месяц Tramell RE:Серия "Библиотека французской литературы" (Макбел) 1 месяц sem14 RE:Книжная серия "Жизнь в искусстве" издательство "Искусство"... 1 месяц sem14 RE:Современная корейская литература. Книжная серия... 1 месяц Впечатления о книгах
MrMansur про Дубнов: Книга жизни [воспоминания и размышления] (Биографии и Мемуары)
07 02 Так есть же в формате fb2 http://209.42.197.18/b/786038
MrMansur про Прилепин: Тума (Современная проза)
07 02 Первая мысль - как же много крови проливали. Но потом осознание: почему проливали? Так было, ьак есть и так будет пока существует эта раковая опухоль - человек... Владея русским и татарским, было интересно читать многоязычные ……… Оценка: отлично!
polyn про Корсакова: Лисье золото [СИ litres] (Ужасы, Триллер, Самиздат, сетевая литература)
07 02 Очень интересное начало серии Оценка: отлично!
udrees про Каменистый: Запрещённый юг (Боевая фантастика, Фэнтези, Попаданцы, ЛитРПГ)
07 02 Смешно написано, продолжение хорошее. Понравится любителям серии. Герой снова попадает в переделки, снова сражается с сильными противниками, и снова получает кучу прогресса. Описания статов и достижений иногда могут раздражать, ……… Оценка: отлично!
udrees про Атаманов: Новые Боги (Боевая фантастика, ЛитРПГ, Самиздат, сетевая литература)
07 02 Смешное окончание приключений. Все было бы хорошо, если бы не вмешательство богов в дела земные. Хотя конечно изначально все предупреждены, что они игроки в большой Игре. Но в 4-й книге приключения в своем стиле, интересные ……… Оценка: хорошо
udrees про Атаманов: Верховья Стикса [СИ] (ЛитРПГ, Самиздат, сетевая литература)
07 02 Я полагаю не вторая, а третья книга может быть окончанием всей серии. Концовку чуть поменять и все, логический венец приключений гоблина. Собственно, в таком же стиле грамотное описание приключений гоблина, победы над сильными ……… Оценка: хорошо
udrees про Атаманов: Сохранить крылья [СИ] (ЛитРПГ, Самиздат, сетевая литература)
07 02 Совершенно сумасшедшее продолжение истории про приключения гоблина-травника в игровом мире, заодно перемежающееся с событиями в реальном мире. Автор часто использует такой прием в своих книгах. Не знаю, в «Забаненном» меня ……… Оценка: хорошо
alexk про Цзи Юнь: Заметки из хижины «Великое в малом» [сборник litres] (Древневосточная литература)
07 02 Издание повторяет старый советский вариант, только предисловие выкинули. И издание, и сам файл хуже предшественника.
decim про Смурыгина: Дефицит. Как в СССР доставали то, что невозможно было достать (История, Публицистика)
05 02 Даже забег по мос. лавкам в понедельник приносил урожай, а уж в посёлках чего только не было. Среди тамошнего населения считалось предосудительным носить не то, что принято - т.е. спецовку на каждый день и старый шерстяной ………
Barbud про Трофимов: Толмач [litres] (Боевая фантастика, Попаданцы)
05 02 Автор успел накропать уже целую охапку писева про данный исторический период, но так и не озаботился получше узнать о реалиях того времени, хотя бы учебник истории почитать - ну да, чукча не читатель, чукча писатель. Тут у ……… Оценка: плохо
irukan про Ланцов: Шанс (Альтернативная история, Социальная фантастика, Самиздат, сетевая литература)
04 02 Хорошо зашла книга! На одном дыхании прочёл. Давно у Ланцова такого не было. Наш совеременник попадает в Константинополь за несколько лет до его падения. То есть, понимаешь, что всё у него получится, но всё равно до конца держит в напряжении Оценка: отлично!
blahblah про Смурыгина: Дефицит. Как в СССР доставали то, что невозможно было достать (История, Публицистика)
04 02 Ужасная книга! Автор интервьюировала знаменитых людей, которые в тоже время в большинстве своём были детьми и внуками других знаменитых людей, ездили за границу, жили в привилегированных домах, получали спецпайки, джинсы во ……… Оценка: плохо |
Комментарии
Отв: Хотим много книг, или сканировщики всех стран ...
господа, если кто ещё не понял - я блондинка. вообще. от слова совсем.
1) расширение у отсканированного файла *tif
2) там есть такая кнопочка как "распознать текст".
3) после чего банально выделить мышкой и вставить в ворд. можно контрл с :)
компьютер собирала не я, софт кем только не устанавливался. если для этого самого копипэйста у меня что-то установлено - скажите где искать (пошагово).
если я не поняла тонкого юмора - простите, если я ввела невольно всех в заблуждение - тоже простите)
Отв: Хотим много книг, или сканировщики всех стран ...
Ясно.
Кнопочка "распознать текст" - только у программы OCR.
Главное работает, хоть и у блондинки.
Отв: Хотим много книг, или сканировщики всех стран ...
Если я спрошу что такое ORC это уже будет злоупотреблением святой невинностью и измывательством над профессионалами? честное слово - чувствую себя идиоткой, которая ещё и делает 20 движений, вместо одного.
Отв: Хотим много книг, или сканировщики всех стран ...
OCR переводится с буржуйского как "распознавание букв на картинках".
Отв: Хотим много книг, или сканировщики всех стран ...
OCR - это оптическое распознавание текста по аглицки )
Сканируете всю книгу в тифы например, потом все их открывате специальной программой для OCR - FineReader называется.
И в ней сразу все распознаете.
Если отсканировано более-менее хорошо (300 точек на дюйм) то ничего вручную набирать не придется. Тем более 30%, как Вы пишите.
Сканировать можно и сразу через файнридер, там остается только страницы листать, сканер сам сканирует все страницы подряд.
Отв: Хотим много книг, или сканировщики всех стран ...
Где в слове OCR вы увидели распознавание текста?
Отв: Хотим много книг, или сканировщики всех стран ...
*рассмеявшись* простите, все вопросы сняты. проще будет самой разобраться. если уж в основах единства мнений нет... и кто говорил что компьютерщики не гуманитарии?:))
Отв: Хотим много книг, или сканировщики всех стран ...
Optical Character Recognition
Отв: Хотим много книг, или сканировщики всех стран ...
Видимо, у блондинки установлен OCR-компонент MS Office (я серьезно, он там входит в полный комплект, но распознает, правда, хуже файнридера). Такой вариант, как достаточно экзотический, упоминался здесь на форуме в разделе soft.
Отв: Хотим много книг, или сканировщики всех стран ...
судя по всему - именно так. а может быть вы файнридером поделитесь? пыталась его найти пару месяцев назад - не вышло :(
Отв: Хотим много книг, или сканировщики всех стран ...
http://rapidlinks.ru/link/?lnk=29614
Отв: Хотим много книг, или сканировщики всех стран ...
А не подскажете, какие должны быть кавычки в книге? А то 3 разных вида получилось.
Отв: Хотим много книг, или сканировщики всех стран ...
Интересно также по поводу вложенных кавычек второй степени. Какие есть мнения?
Борис
Отв: Хотим много книг, или сканировщики всех стран ...
«» - кавычки первого уровня (Сочетание клавиш: Alt+0171 и Alt+00187 соответственно),
„“ - кавычки второго уровня (Сочетание клавиш: Alt+0132 и Alt+0147 соответственно).
Отв: Хотим много книг, или сканировщики всех стран ...
А вот если "третий вид" - это кавычки третьего уровня вложенности, то тоже ничего хорошего: поскольку в природе кавычки тройной вложенности практически не встречаются, то можно заподозрить парную потерю кавычек (например, в начале крупного фрагмента потерялась закрывающая кавычка или даже две, а в конце - открывающая).
Типовая причина - принятые в типографии правила расстановки сдвоенных кавычек, если используются кавычки только одного вида (ёлочки). Пример:
Операция "Золото" == «Операция „Золото“» == «Операция «Золото»» (неправильно) == «Операция «Золото» (правильно - одна закрывающая ёлочка вместо двух подряд).
Текст с такой расстановкой ёлочек нуждается в дообработке перед прогоном скрипта "кавычки на ёлочки" - надо найти все места, где под одиночной ёлочкой подразумевается двойная, и добавить недостающую кавычку. Признаком наличия таких мест может быть ненормально большое количество кавычек второго уровня (лапок) и/или наличие кавычек третьего уровня. Найти "урезанную" закрывающую ёлочку несложно - от открывающей лапки искать назад до закрывающей ёлочки. С урезанной открывающей ёлочкой чуть сложнее, но тоже можно, я просто навскидку не помню.
Отв: Хотим много книг, или сканировщики всех стран ...
Вообще-то, по-правильному нужно отличать кавычку (какой она направленности) по пробелу и прилепленности ее к слову, а потом уже считать пары. Но возможно компьютерный интеллект еще не готов.
Отв: Хотим много книг, или сканировщики всех стран ...
Скрипт в FBE отлично справляется с этим. "Ручная работа" нужна в считанных случаях.
Отв: Хотим много книг, или сканировщики всех стран ...
ах, спасибо!!! счастье есть и имя ему файнридер!!!! вычитала 20 страниц так, между делом! ох, чудо какое! спасибо огромное!
Отв: Хотим много книг, или сканировщики всех стран ...
И не думайте, что это счастье.
Теперь вы порабощены навеки...
:) :) :)
Отв: Хотим много книг, или сканировщики всех стран ...
спасибо за ссылку, полезностей много:) попытаюсь в свободное время разобраться...
Отв: Хотим много книг, или сканировщики всех стран ...
Посмотрите и здесь: http://publ.lib.ru/publib.html
Отв: Хотим много книг, или сканировщики всех стран ...
Уже писал свое мнение, повторюсь - на сегодняшний день считаю более пригодным для получения предварительного материала не сканер, а цифровой фотоаппарат (не менее 5 МПикс). Гораздо быстрее, а результат ничуть не хуже + книги не надо портить (особенно актуально для толстых и ветхих книг).
Отв: Хотим много книг, или сканировщики всех стран ...
Ребята, о чем спор? Просто сотрясание воздуха, а не разговор о сканировании. По моему надо просто сканировать. При использовании планшетного сканера, FR и некоторых специализированных программ выдача 600-страничной книги в формате Word занимает от 3 до 5 суток на русском или украинском языках. Надо СКАНИРОВАТЬ и ВЫЧИТЫВАТЬ, а не спорить о ни о чем.
Отв: Хотим много книг, или сканировщики всех стран ...
НАДО:) только, как было сказано выше, из-за того, что я не понимаю как оптимизировать процесс у меня несколько месяцев уходит на скан и вычитку 300 страниц. месяц - потому что комментарии вбитые мелким шрифтом только вручную и вбивать - не распознаются. а их много. но если есть возможность основной текст книги распознать по-человечески - поделитесь программой. тем же файнридером, о котором все говорят. но никто не дает. а классическую литературу вряд ли набежит толпа желающих вычитывать. потому и занимаюсь собственноручно.
Отв: Хотим много книг, или сканировщики всех стран ...
Киньте-ка мне пару страниц с комментариями на пробу, посмотрю, как файнридер справится с распознаванием. Залейте на ифолдер. А там, может, объединим усилия.
Отв: Хотим много книг, или сканировщики всех стран ...
большое спасибо за предложение, но файнридер их распознал (о, да! счастье есть!) так что скорость работы серьезно возросла (за 2 дня сделан тот объем работ, на который раньше уходила пару месяцев!!) :) так что спасибо, но лучше если вы потом это в fb2 переведете, этого я пока не умею:)
Отв: Хотим много книг, или сканировщики всех стран ...
Хорошо, сделайте rtf/doc и пришлите на почту библиотекарей.
Отв: Хотим много книг, или сканировщики всех стран ...
Проблема ,имхо, не в классичности литературы, а в том, что мы не умеем вычитывать. Мы - остальные блондинки и я вместе с ними. Как это "вычитывать"? Как вычитывать если нет бумажного экземпляра книги? Или я глупость какую спросила?
Отв: Хотим много книг, или сканировщики всех стран ...
Не совсем глупость :) мне без бумаги тоже гораздо тяжелей, но все же не смертельно , просто не люблю когда читаю перед компом сидеть а тут приходится. Хоть экран и 24" а все равно раздражает.
Отв: Хотим много книг, или сканировщики всех стран ...
А никак. Нет способа сделать качественную вычитку без оригинала. Правда, оригиналом вполне может служить дежавю вычитываемой книги. Не так удобно, но приемлимо.
Вот ведь какие загадочные существа блондинки. Кажется, глупость спросят, а подумаешь - совсем наоборот выходит...
Отв: Хотим много книг, или сканировщики всех стран ...
Тьфу-тьфу-тьфу! Пусть продукт жизнедеятельности выходит обычным путем. Совсем наоборот тоже не в радость получится ;)
У меня есть предложение к опытным товарищам: возьмите шефство над чайниками! Сканировщик вырастит сканировщика, спец по вычитке научит блондинку читать. Число участвующих и делающих работу на приемлемом уровне увеличится вдвое - спасем залежи неоцифрованых книг. Как там? Убил бобра - спас дерево. Хм, убил блондинку - спас вычитку...? Возьмите меня в подшефные! Я бестолковая совершенно, но очень терпеливая. Раз уж медведей учат ездить на велосипеде, то я могу научиться вычитывать. Может даже найдется кто из Украины, чтоб можно было запросто связаться по мобильному...
Отв: Хотим много книг, или сканировщики всех стран ...
Клевета на блондинок. Сегодня конвертила два любовных романа в fb2 из доков - идеальная вычитка OCR-а. Никакая чистка не нужна. Такую бы вычитку, да книгам других жанров... :)))
Отв: Хотим много книг, или сканировщики всех стран ...
А может это брюнетки, или, свят-свят, рыжие вычитывали? )))
Отв: Хотим много книг, или сканировщики всех стран ...
Не может этого быть!!! Скан, окр и вычитка - один и то же человек. )))
Отв: Хотим много книг, или сканировщики всех стран ...
Т.е. дама, умеющая "Скан, окр и вычитка" по определению не может быть брюнеткой или рыжей? )))
Ларисе респект в любом случае )
Отв: Хотим много книг, или сканировщики всех стран ...
Ларисе респект безусловно - очень качественная работа.
Отв: Хотим много книг, или сканировщики всех стран ...
И в бумажном издании бывают опечатки (а с 90х годов - очень даже часто). Такое тоже стоит поправлять, но осторожно.
Djvu, как и pdf, сделанный из djvu, иногда содержат глюки, особенно если закодировали книгу разрешением при 300dpi и менее. И не всегда эти глюки можно распознать. Некоторые буквы просто заменяются в нем другими, - похожими. Мне попадались даже попадались подмены-многозначности, когда по смыслу подходило и так, и эдак (смысл менялся, но логика повествования оставалась).
Отв: Хотим много книг, или сканировщики всех стран ...
Я предпочитаю FR7, хотя уже есть 9-й. А делится? Уж слишком он емкий.
Отв: Хотим много книг, или сканировщики всех стран ...
Все сканеры сейчас комплектуются программой распознавания IRIS. Это похуже FineReader, но тоже неплохо.
Очень быстрые сканеры без искажения у сгиба книги - Plustek (3 секунды на страницу). Книга раскрывается на 90 градусов (сканирование до сгиба, который приходится на край сканера). Такие сканеры немного дороже. Я, будучи админом в библиотеке, купил вот такой: http://www.plustek.com/product/book4600.asp для сканирования книг, а сейчас закупаю еще 4 штуки. Единственно что драйвер в комплекте был недоделанный, пришлось выкачивать свежий с сайта фирмы. Да, рекомендуется именно Plustek OpticBook 4600, то же самое модели 3600 по сети имеет плохие отзывы.
Отв: Хотим много книг, или сканировщики всех стран ...
У 4600 тоже хватает недостатков, особенно в софте и цветопередаче, но в принципе книжки сканировать - само то.
Да , кстати, он у вас тоже с последним драйвером стал после возврата (по окончании сканирования листа) "позиционироваться" (дергаться вперед-назад на сантиметра два)?
Отв: Хотим много книг, или сканировщики всех стран ...
я очень извеняюсь но всем спосибо узнал много адресов библиотек
сербезно СПОСИБО
Отв: Хотим много книг, или сканировщики всех стран ...
Скачайте словарь для начала.
Отв: Хотим много книг, или сканировщики всех стран ...
А Вы - FAQ по сетевой этике.
Отв: Хотим много книг, или сканировщики всех стран ...
Дайте ссылку. Пока что у меня есть только толстый-толстый FAQ по троллингу.
Отв: Хотим много книг, или сканировщики всех стран ...
Прямо научно-практическая конференция дояров.
Отв: Хотим много книг, или сканировщики всех стран ...
Не уж-то читали?
Всё под контролем, слава богу :)
Отв: Хотим много книг, или сканировщики всех стран ...
Да. прочитал. И тоже думаю что всё в порядке.
Искатели журналы сейчас сканирую. Никогда в таких масштабах этим не занимался, что-то тяжеловато с непривычки:(
Отв: Хотим много книг, или сканировщики всех стран ...
Распределяйте нагрузку. Не надрывайтесь. Вы нам нужны здоровый и веселый.
Отв: Хотим много книг, или сканировщики всех стран ...
Спасибо. Постараюсь:)
Отв: Хотим много книг, или сканировщики всех стран ...
Igorek67 : Выложите их (Искатели) в виде PDF(jpeg)/JPG/DjVu(лучшеphoto) или хоть обычном DjVu, пожалуйста!
Страницы