К 2020 году будут оцифрованы ценные книги, выпущенные до 1831 года

Forums: 

Министерство культуры приняло решение оцифровать наиболее ценные книги, изданные до 1831 года, передает РИА Новости. Работы планируется завершить к 2020 году.

"Минкультуры России в рамках программы по сохранению книжных фондов для будущих поколений разработало специальное программное обеспечение для регистрации книжных памятников, которое позволяет составить максимально полный реестр наиболее ценных и редких книг в стране, - уточнили в пресс-службе министерства. - На сегодняшний день один из эффективных способов хранения и предоставления возможности познакомиться со старинными книгами - оцифровка. Министерство культуры к 2020 году планирует оцифровать наиболее ценные книги, изданные до 1831 года".

Ознакомиться с цифровыми версиями книг можно будет в Национальной электронной библиотеке.

Link

Аватар пользователя Isais

А пока функцию Национальной электронной библиотеки русской классической литературы исполняет библиотека Мошкова.
Откуда мы берем книгоделы берут их для конвертации в формат fb2.

только вряд ли большинству нужны и интересны эти старые книги...

Цитата:
Ознакомиться с цифровыми версиями книг можно будет в Национальной электронной библиотеке.

ага, при личном присутствии, с паспортом, заплатив мзду...

И хто ж етим будет занимацца, библиотекарь Марьиванна за сваю сторублевую зарплату...министерству спиздеть как два пальца обоссать. Разве что передерут хреновые слайды еще савецково времени, как это делает гугл книга.
Работает над сканом тока Библиотека Конгресса ибо у них немерянные дотации и отчисления за регистрацию копирайта.

Аватар пользователя Isais

Ser9ey написал:
... Разве что передерут хреновые слайды еще савецково времени, как это делает гугл книга.
Работает над сканом тока Библиотека Конгресса ибо у них немерянные дотации и отчисления за регистрацию копирайта.

Ну не скажите... Рос. детская сканирует старые советские книги и отдает в сеть, Рос. гос. - тоже, но вот у них качество сканов ниже всякой критики, да при сетевой публикации еще и преднамеренно ухудшается, областные сканят свои краеведческие и краевые (т.е. изданные на их территории) книги, и даже неплохо выходит. Так что если пошукать да сложить в одну кучку...
Но Мединскому это вряд ли неинтересно.
Аватар пользователя V_E

Isais написал:

Ну не скажите... Рос. детская сканирует старые советские книги и отдает в сеть, Рос. гос. - тоже, но вот у них качество сканов ниже всякой критики,

А где они лежат? Поглядеть и оценить качество.
А насчет того, что большинству они не интересны... Это с какой стороны смотреть... Ведь из современных изданий большинству не интересно еще больше.
Тут вопрос: в каком формате будут оцифровывать?
Аватар пользователя Isais

V_E написал:
Isais написал:

Ну не скажите... Рос. детская сканирует старые советские книги и отдает в сеть, Рос. гос. - тоже, но вот у них качество сканов ниже всякой критики,

А где они лежат? Поглядеть и оценить качество.

Детские книги Вы можете ежедневно наблюдать их в ленте новинок Либрусека (в формате ПДФ). Плоды трудов РГБ зарыты где-то здесь http://leb.nlr.ru/. Напр.: http://edoc.nlr.ru/ws/docserver/getpdf/0cdf1e9baa4c2fe32478bde48fd9adcf

V_E написал:
Isais написал:

Ну не скажите... Рос. детская сканирует старые советские книги и отдает в сеть, Рос. гос. - тоже, но вот у них качество сканов ниже всякой критики,

А где они лежат? Поглядеть и оценить качество.

Здесь
----------------------
Исправил

V_E написал:
Isais написал:

Ну не скажите... Рос. детская сканирует старые советские книги и отдает в сеть, Рос. гос. - тоже, но вот у них качество сканов ниже всякой критики,

А где они лежат? Поглядеть и оценить качество.
А насчет того, что большинству они не интересны... Это с какой стороны смотреть... Ведь из современных изданий большинству не интересно еще больше.
Тут вопрос: в каком формате будут оцифровывать?

Вот тут по истории, но качество именно какбе спижено со старых слайдов.
http://gbooks.archeologia.ru/
С одной такой дорев. книгой провозилса год шоп распознать и вычитать.
Аватар пользователя V_E

Ser9ey написал:

С одной такой дорев. книгой провозилса год шоп распознать и вычитать.

Ну, вы титан! Я по молодости как-то попытался дореволюционный текст через фанридер пропустить и потом вычитать. Но понял, что номер дохлый.

V_E написал:
Ser9ey написал:

С одной такой дорев. книгой провозилса год шоп распознать и вычитать.

Ну, вы титан! Я по молодости как-то попытался дореволюционный текст через фанридер пропустить и потом вычитать. Но понял, что номер дохлый.

Просто книга историка Дмитрия Багалея
Очерки из истории колонизации степной окраины Московского государства
есмь эпохальная для моей Слобожанщины *ныне Харьковской обл.* Переселение украинских казаков из западных районов сюда в17 веке сравнимо по масштабам с освоением штатосвкого Дикого Запада.При советах Багалея не перепечатывали бо буржуазный историк при незалежной он оказалса слишком "непатриот". Ибо писал как Московское государство прекрасно уживалось и помогало переселенцам, а это вааще щас скрамола. Вот и пришлось самотужки этим заняцца, тысячи историков и интересующихся земляков кстати скачало эту книгу, которая раньше была тока в спецхранах.

Цитата:
уезды Курской и роронежсцой; мадо того -

Цитата:
дворянь было И6, а детей боярских 21 и чел., т.е. немного более 1,50шиеся 0 7°шиеся в=8,5вшиеся 0.

Похоже либо не вычитана, либо вычитывал тот грамотей, что пишет на пиджин-рашен на форуме.
Всё же лучше, чем ничего.
Аватар пользователя V_E

Ничего себе, "лучше, чем ничего". Это - хуже, чем ничего. Как такую цифирь использовать???? Только раздразнили, возможностью вставить такую цитату, а на деле... Убивать, т.е. я хочу сказать,
морально осуждать таких распознавателей надо!

V_E написал:
Ничего себе, "лучше, чем ничего". Это - хуже, чем ничего. Как такую цифирь использовать???? Только раздразнили, возможностью вставить такую цитату, а на деле... Убивать, т.е. я хочу сказать,
морально осуждать таких распознавателей надо!

Ты бы сам лучче пасмарел, а не етому придурку верил.
Аватар пользователя V_E

Ser9ey написал:

Ты бы сам лучче пасмарел, а не етому придурку верил.

Я правильно понял, что приведенный ляп создан автором сообщения, а в тексте его нет?
Проверил по тексту первую ошибку. Действительно, есть "роронежсцой". Не знаю у кого как, а у меня, когда наталкиваюсь на такие ошибки в отсканированных книгах, сразу начинаются мучительные раздумья: а можно ли доверять другим цифрам, именам, фамилиям приведенным в книге? (это безотносительно данного издания). Может там тоже допущена ошибка при сканировании? Хотя понятно, что книгу без ошибок издать невозможно. Но при электронной книге вторичного порядка (т.е. отсканированной и распознанной) их число многократно возрастает.

V_E написал:
Ser9ey написал:

Ты бы сам лучче пасмарел, а не етому придурку верил.

Я правильно понял, что приведенный ляп создан автором сообщения, а в тексте его нет?
Проверил по тексту первую ошибку. Действительно, есть "роронежсцой". Не знаю у кого как, а у меня, когда наталкиваюсь на такие ошибки в отсканированных книгах, сразу начинаются мучительные раздумья: а можно ли доверять другим цифрам, именам, фамилиям приведенным в книге? (это безотносительно данного издания). Может там тоже допущена ошибка при сканировании? Хотя понятно, что книгу без ошибок издать невозможно. Но при электронной книге вторичного порядка (т.е. отсканированной и распознанной) их число многократно возрастает.

Ошибки еще есть, до сих по с ней вожусь, там не только вычитывать но и додумывать приходицца, исходник вааще не читаемый а в спецхран публички я не вхож, оригинала нет. Когда выкладывал думал кто из профессионалов обратит внимание. Ан наша украинская ист. прахвессура положила болт на Багалея.
Хотя для бесплатного распространения эта библиотека уже закрыта, смысл сюда заливать минимальный.
Аватар пользователя V_E

Ser9ey написал:

Ошибки еще есть, до сих по с ней вожусь, там не только вычитывать но и додумывать приходицца, исходник вааще не читаемый а в спецхран публички я не вхож, оригинала нет. Когда выкладывал думал кто из профессионалов обратит внимание. Ан наша украинская ист. прахвессура положила болт на Багалея.
Хотя для бесплатного распространения эта библиотека уже закрыта, смысл сюда заливать минимальный.

М-да, грустно. Особенно, если додумывать приходится. Но, насчет заливки - другие библиотеки отсюда качают, так что смысл есть.

V_E написал:
Ser9ey написал:

Ошибки еще есть, до сих по с ней вожусь, там не только вычитывать но и додумывать приходицца, исходник вааще не читаемый а в спецхран публички я не вхож, оригинала нет. Когда выкладывал думал кто из профессионалов обратит внимание. Ан наша украинская ист. прахвессура положила болт на Багалея.
Хотя для бесплатного распространения эта библиотека уже закрыта, смысл сюда заливать минимальный.

М-да, грустно. Особенно, если додумывать приходится. Но, насчет заливки - другие библиотеки отсюда качают, так что смысл есть.

Оба,на ..по совету доброжелателей, надыбал в РГБ качественный скан этой книги http://dlib.rsl.ru/01003913838 теперь есть с чего править...*правда весит полгига*
небо и земля
Стар источник

нов источник в РГБ

всетки они сами сканирят

sem14 написал:
Цитата:
уезды Курской и роронежсцой; мадо того -

Цитата:
дворянь было И6, а детей боярских 21 и чел., т.е. немного более 1,50шиеся 0 7°шиеся в=8,5вшиеся 0.

Похоже либо не вычитана, либо вычитывал тот грамотей, что пишет на пиджин-рашен на форуме.
Всё же лучше, чем ничего.

Пиздеть не мешки ворочать...

Ser9ey написал:
sem14 написал:
Цитата:
уезды Курской и роронежсцой; мадо того -

Цитата:
дворянь было И6, а детей боярских 21 и чел., т.е. немного более 1,50шиеся 0 7°шиеся в=8,5вшиеся 0.

Похоже либо не вычитана, либо вычитывал тот грамотей, что пишет на пиджин-рашен на форуме.
Всё же лучше, чем ничего.

Пиздеть не мешки ворочать...

Вот чем, оказывается, я тут занимаюсь. А мужики и не знали(с)
А Серёга. который в каждой бочке затычка, делом занят.

sem14 написал:
Ser9ey написал:
sem14 написал:
Цитата:
уезды Курской и роронежсцой; мадо того -

Цитата:
дворянь было И6, а детей боярских 21 и чел., т.е. немного более 1,50шиеся 0 7°шиеся в=8,5вшиеся 0.

Похоже либо не вычитана, либо вычитывал тот грамотей, что пишет на пиджин-рашен на форуме.
Всё же лучше, чем ничего.

Пиздеть не мешки ворочать...

Вот чем, оказывается, я тут занимаюсь. А мужики и не знали(с)
А Серёга. который в каждой бочке затычка, делом занят.

Да хоть онанизмом занимайса, библиотека закрыта, бесплатный доступ к свободным раньше книгам закрыт, слава боху другие библиотеки распространяют.

Мне стало интересно. Зашел на "gbooks", попробовал открыть файлы в ПДФ. Ни один из взятых навскидку десятка не открывается. File not found.

Riznieks написал:
Мне стало интересно. Зашел на "gbooks", попробовал открыть файлы в ПДФ. Ни один из взятых навскидку десятка не открывается. File not found.

Там все книги закрыты правообладателями. Лучче уж в генезисе искать.
http://gen.lib.rus.ec/
Аватар пользователя V_E

Isais написал:

Ну не скажите... Рос. детская сканирует старые советские книги и отдает в сеть, Рос. гос. - тоже, но вот у них качество сканов ниже всякой критики, да при сетевой публикации еще и преднамеренно ухудшается, областные сканят свои краеведческие и краевые (т.е. изданные на их территории) книги, и даже неплохо выходит. Так что если пошукать да сложить в одну кучку...
Но Мединскому это вряд ли неинтересно.

Посмотрел некоторые из выложенных книг. Насчет качества, вы по-моему, преувеличиваете. Может, конечно, там есть разные экземпляры... Сейчас попробую распознать что-нибудь из того, что там лежит. Если распознавалка потянет, то это может быть неплохой источник для работы окажется. Во всяком случае, зачастую приходится работать с материалами значительно худшего качества.
Аватар пользователя V_E

Попробовал распознать текст из выложенных книг в детской библиотеке. Распознается нормально даже если скрин экрана. Конечно проблемы есть (постранично надо скринить, но, тем не менее, работать можно. Посмотрим, как будет с другими экземплярами, но то, что я смотрел - качество для меня приемлемое.

Аватар пользователя Isais

Книги детской библиотеки распознаются на ура, я это и говорил. И брать их можно прямо из новинок Либрусека, они тут выложены.
А вот с РГБ - слезы и рыданья, в т.ч. файнридерные. Не помню, какую я оттуда приключенческую книгу утащил - то ли Буссенара, то ли Жаколио, но распознаванию она не поддавалась - и не потому, что дореволюционные яти с ерами (с этим-то я умею справиться)... Разрешение было крайне занижено - что-то менее 100 dpi.

Аватар пользователя V_E

Isais написал:
дореволюционные яти с ерами (с этим-то я умею справиться)...

Может, поделитесь, как вам это удается? Тренировкой файнридера? Или есть какие-то другие бубны для танцев? А то мне приходится довольно часто работать с дореволюционными изданиями и кое-что хотел бы выложить (в период, когда ликвидировали советские ведомственные библиотеки в ходе приватизации и т.д., извинияюсь, на помойку выкидывали довольно много литературы, в том числе и дореволюционной (стирать память - так до глубокого форматирования!) Кое-что удалось сохранить.
Да, а разрешение ниже 100 - это, конечно, незачем и пытаться. Как всегда в России - вроде делают для людей - на деле - лучше бы не делали.
Аватар пользователя Isais

11-я Фаня распознает дореволюционное и переносит в fb2. Далее - ручками и глазками.
Тотальная замена в FBE по условиям. Потом прохожу визуально и зачищаю остатки.
Получается примерно: https://lib.rus.ec/b/355504

Isais написал:
11-я Фаня распознает дореволюционное и переносит в fb2. Далее - ручками и глазками.
Тотальная замена в FBE по условиям. Потом прохожу визуально и зачищаю остатки.
Получается примерно: https://lib.rus.ec/b/355504

Вот именно ручками и глазками и оччень густо етими ручками и глазками.
А фаня тока обещанками распознавать толком дорев. кирилицу кормит.
Аватар пользователя V_E

Ser9ey написал:

Вот именно ручками и глазками и оччень густо етими ручками и глазками.
А фаня тока обещанками распознавать толком дорев. кирилицу кормит.

Мне так и пришлось делать. При работе с дореволюционным шрифтом набрать заново быстрее, чем сканировать и потом каждую букву править.

V_E написал:
Ser9ey написал:

Вот именно ручками и глазками и оччень густо етими ручками и глазками.
А фаня тока обещанками распознавать толком дорев. кирилицу кормит.

Мне так и пришлось делать. При работе с дореволюционным шрифтом набрать заново быстрее, чем сканировать и потом каждую букву править.

В сети набрел на вордовский макрос, переводящи дорев орфографию в современную, но это есессно в правильном тексте.
Аватар пользователя V_E

Ser9ey написал:

В сети набрел на вордовский макрос, переводящи дорев орфографию в современную, но это есессно в правильном тексте.

Да в том-то и дело, что после сканирования той (дореволюционной) бумаги получить правильный текст невозможно. Там и чего только не появляется.... Никакой макрос не потянет.
Аватар пользователя V_E

Я в 11 ФР не работал. Там есть специальная опция для распознавания дореволюционных текстов?
Кстати, роясь в детской библиотеке натолкнулся на интересную (точнее - на неинтересную) штуку. У некоторых книг после пролистывания нескольких (число варьируется) страниц вдруг начинаются чистые страницы с маленьким крестиком в верхнем углу. Это косяк распознавателей, или дополнительная защита авторских прав? А может, еще какие-нибудь проказы сети? Кто-нибудь сталкивался с таким явлением?

Никогда не хватало терпения пролистывать толстые книги (а там есть и за сотню страниц).
Возможно, что и браузер косячит. Дайте название книги и автора.
-------------------------
У меня сейчас такой же косяк с 64-страничной книгой обед в кармане.

Аватар пользователя V_E

Да вот, хотя бы тут: http://arch.rgdb.ru/xmlui/handle/123456789/27792#page/7/mode/2up
С ходу, зайдя в раздел книги, ткнул мышью в книжку "33 ступеньки в небо". Семь страниц пролисталось, а с восьмой начались чистые листы.

V_E написал:
Да вот, хотя бы тут: http://arch.rgdb.ru/xmlui/handle/123456789/27792#page/7/mode/2up
С ходу, зайдя в раздел книги, ткнул мышью в книжку "33 ступеньки в небо". Семь страниц пролисталось, а с восьмой начались чистые листы.

И у меня та же фигня.
Аватар пользователя V_E

sem14 написал:

И у меня та же фигня.

И как мы все это должны понимать? Я все же подозреваю, что это очередной происк "врагов народа" сиречь охранителей авторских прав. Хотя в разделе "помощь" в библиотеке однозначно прописано, что зарегистрированные пользователи могут пролистывать книги с авторскими правами... Хотя, чего я возмущаюсь? Пролистывать-то я действительного могу. Страницы листаются просто замечательно. А, вот, то, что на них текста нет - это уже другая проблема.
Аватар пользователя Isais

Скачать и убедиться оффлайн?
Или там не ПДФы, а ублюдочно-копирастические онлайн-читалки?

Аватар пользователя V_E

Isais написал:
Скачать и убедиться оффлайн?
Или там не ПДФы, а ублюдочно-копирастические онлайн-читалки?

Похоже я оказался прав. Выводится запись: доступ к этому файлу ограничен. У вас недостаточно прав. Хотя я зарегистрированный пользователь. Напишу в библиотеку чтобы свои правила переписали и не вводили в заблуждение наивных читателей, которые думают, что хоть кто-то, кроме преследуемых пиратов, о них позаботится и даст возможность читать то, что хочется.

V_E написал:
Я в 11 ФР не работал. Там есть специальная опция для распознавания дореволюционных текстов?

Там просто надо проставлять дорев язык. С каждой новой серией фаня хвалицца что все лучше распознант стар кириллицу а воз поныне там.

Ser9ey написал:
V_E написал:
Я в 11 ФР не работал. Там есть специальная опция для распознавания дореволюционных текстов?

Там просто надо проставлять дорев язык. С каждой новой серией фаня хвалицца что все лучше распознант стар кириллицу а воз поныне там.

Да нормально распознается, что в 11-й, что в 12-й. Не хуже других языков. Лишь бы скан хороший был. На говенном скане хоть по-русски, хоть по-английски ошибок будет не меньше.

J_Blood написал:
Ser9ey написал:
V_E написал:
Я в 11 ФР не работал. Там есть специальная опция для распознавания дореволюционных текстов?

Там просто надо проставлять дорев язык. С каждой новой серией фаня хвалицца что все лучше распознант стар кириллицу а воз поныне там.

Да нормально распознается, что в 11-й, что в 12-й. Не хуже других языков. Лишь бы скан хороший был. На говенном скане хоть по-русски, хоть по-английски ошибок будет не меньше.

Так в том то и дело, что большинство дорев книг *особенно по истории? философии* в говенном скане, и чо теперь делать. А гугла просто тырит все это фуфло вместо новых сканов.
Аватар пользователя alexej36

Цитата:
А фаня тока обещанками распознавать толком дорев. кирилицу кормит

12-й FR

alexej36 написал:
Цитата:
А фаня тока обещанками распознавать толком дорев. кирилицу кормит

12-й FR

А что вот с такими делать? Уникальные десять томов Владимира Соловьева
Аватар пользователя V_E

Ser9ey написал:

А что вот с такими делать? Уникальные десять томов Владимира Соловьева

А что тут делать... Тут все понятно. Взять и отсканировать по новой. Вариантов нет. С этим работать невозможно, хотя для прочтения, за неимением лучшего, сгодится. Хотя тоже мороки будет...

V_E написал:
Ser9ey написал:

А что вот с такими делать? Уникальные десять томов Владимира Соловьева

А что тут делать... Тут все понятно. Взять и отсканировать по новой. Вариантов нет. С этим работать невозможно, хотя для прочтения, за неимением лучшего, сгодится. Хотя тоже мороки будет...

РГБ вряд ли сподобицца, разве что Библиотека Конгресса свои фонды до 1926-го сканирует.
Аватар пользователя alexej36

А ничего не делать. 72 dpi Текст прочитать то сложно, FR здесь бесполезен.

Аватар пользователя V_E

Т.е. я правильно понял, что проще заново с листа набрать текст, чем с фаней возиться? Там ведь еще и бумага старая, с грубой фактурой и разного рода вкраплениями. А если еще распознавалка будет коряво работать...

Аватар пользователя alexej36

V_E написал:
Т.е. я правильно понял, что проще заново с листа набрать текст, чем с фаней возиться? Там ведь еще и бумага старая, с грубой фактурой и разного рода вкраплениями. А если еще распознавалка будет коряво работать...

Стоит проверить: в FR 12 десяток страниц с опт. настройками и руками.
Аватар пользователя V_E

alexej36 написал:

Стоит проверить: в FR 12 десяток страниц с опт. настройками и руками.

Настройки - это одно, а реальная их работа - другое. Но, вы правы, попробовать стоит. На досуге попытаюсь. Правда сейчас большое желание в пику электронной детской библиотеке сделать и выложить эти "33 ступеньки в небо", потому как хотя она и есть в здешней библиотеке но ссылка выводит не на книгу, а куда-то в другое место. А у меня где-то валялся печатный экземпляр.
Аватар пользователя Антонина82

V_E написал:
alexej36 написал:

Стоит проверить: в FR 12 десяток страниц с опт. настройками и руками.

Настройки - это одно, а реальная их работа - другое. Но, вы правы, попробовать стоит. На досуге попытаюсь. Правда сейчас большое желание в пику электронной детской библиотеке сделать и выложить эти "33 ступеньки в небо", потому как хотя она и есть в здешней библиотеке но ссылка выводит не на книгу, а куда-то в другое место. А у меня где-то валялся печатный экземпляр.

Если Вы имеете ввиду книжку А. Маркуши "33 ступеньки в небо" - то вот прямая ссылка на скачивание с Либгена. Я скачала. Книга pdf хорошо сделана.

Страницы

X