Вы здесьПроект по вычитке книг, подобный альдебарановскому и олдмаглибовскому.
Опубликовано пт, 04/04/2008 - 01:59 пользователем soshial
Форум пока очень неудобный для этого, так что пока будем обсуждать здесь...
Понятное дело, мы и сейчас вычитываем... некоторые люди. их мало. И это просто не очень организованно пока, кустарно что ли... ;)
я предлагаю "сплочиться" =D
просто собрать организованную кучку ocr-щиков и вычитывающих, которые будут друг другу помогать.)
Выглядеть все будет таким образом... кто-то заказывает (в смысле, предлагает ее для вычитывания) вычитку книги - кто-то эту вычитку выполняет.
СПИСКИ "НА ВЫЧИТКУ", "НА OCR" И СПИСОК УЧАСТНИКОВ - ЗДЕСЬ.
FAQ:
> Не сочтите за наглость но если работа предстоит с фантастикой/детективами/любовными романами то тогда извините но отказываюсь сразу.
Работа ведется во всех направлениях - любые жанры и стили литературы, даже не только художественной =)
что хотите то и выбираете)
> С каким форматом предстоит работать?
с fb2. наиболее распространенный в рунете и наиболее удобный формат для чтения и редактирования =)
общая информация здесь и тут
в нем нет ничего сложного, просто надо более-менее помнить теги. это просто. к тому же, вы будете эти теги коррекировать, а не создавать с нуля. ;)
1. общая информация о формате
2. описание тегов и простой пример книги.
3. как сделать книгу
4. Вычитка, редактура и создание fb2-файла с начала и до конца, с помощью FictionBook Designer 4.0 и не только
5. несколько статей и инструкций по fb2
6. Создание электронных книг в формате FictionBook 2.1: практическое руководство
> Условия, правила вычитки, форматирования?
правил форматирования почти нету за счет того, что инфа об абзацах, эпиграфах и т.д. хранится в тегах а не стилях (болд, италик и т.д.); правила вычитки только в процессе создания, пока прорабатывается. сейчас главное - вычитка.)
[quote]а теперь главное!
в этом посте: вносим свои предложения, предлагаем идеи, предлагаем книжки для вычитки, делимся планами, высказываем свои мысли и т.д.)) (не знаю, как выразиться лаконичнее)))[/quote]
|
Вход на сайтПоиск по блогам и форумамUser menuПоследние комментарии
Aliki RE:Подайте бедному копеечку на книжку с литреса... 3 часа
Isais RE:Детство, опаленное войной (Вторая мировая 1939-1945 и ВОВ) 3 дня sem14 RE:Современная корейская литература. Книжная серия... 6 дней sem14 RE:Книжная серия "Жизнь в искусстве" издательство "Искусство"... 6 дней kopak RE:На 78-м году жизни скончался советский и российский... 2 недели Саша из Киева RE:Кто сможет раздобыть и оцифровать нужные мне книги? 2 недели Саша из Киева RE:Подводное течение 2 недели lemma7 RE:Серия «Интеллектуальный детектив» изд-ва АСТ 2 недели konst1 RE:Переименовать ник (имя учетки) 3 недели Larisa_F RE:Таррин Фишер 1 месяц Aleks_Sim RE:Беженцы с Флибусты 1 месяц Саша из Киева RE:Как приобретать друзей и оказывать влияние на людей 1 месяц Isais RE:Семейственность в литературе 1 месяц miri.ness_ RE:Доступ 27 1 месяц bmusanov Оплатил, но абонемент не отображается 1 месяц holla RE:Багрепорт - 2 1 месяц konst1 RE:Файнридер для Win11 1 месяц larin RE:Оплатил, но абонемент не отображается 1 месяц Впечатления о книгах
obivatel про Номен: Олегархат им. тов. Сталина (Альтернативная история, Попаданцы, Самиздат, сетевая литература)
24 09 Немного более сильно напрягает использование автором оборотов со словом "более". Если таким образом перефразировать т.Сталина, получится нечто типа "Жить стало более хорошо, жить стало более радостно". Надо полагать, автор ……… Оценка: неплохо
Никос Костакис про Конторович: За Державу обидно! [litres] (Альтернативная история, Боевая фантастика)
22 09 – Куда б ему деваться-то? Стонал, что твой Плюшкин! Гость вопросительно приподнял бровь. – Есть у нас такой литературный персонаж – патологически жадный и неопрятный тип, ростовщик! ___________________________________ Плюшкин - ростовщик??? Я впечатлен!
Barbud про Горнов: Ульян едет в Крым (Социальная фантастика)
22 09 Ерунда какая-то несусветная, ни о чем вообще. Начал читать, одолел чуток, честно пытаясь вчитаться - вообще не понял, зачем и о чем оно написано. Проскроллил дальше - там не лучше. Ниасилил, в общем. Оценка: нечитаемо
mysevra про Ночкин: Череп мутанта (Боевая фантастика)
22 09 О, эта часть более динамична, чем первая. И обложка красивая. Оценка: хорошо
mysevra про Подшибякин: Голодный мир [litres] (Ужасы, Мистика)
22 09 Во-первых, надоел мат, просто утомил, это уже не оригинально. Во-вторых, если вдуматься и представить себе всё это, то да, жутко, но персонажи такие отвратные, что как бы ждешь, чтобы их поскорее перемололо. И впечатление ……… Оценка: неплохо
mysevra про Нин: Генри и Джун (Эротика)
22 09 Жить в праздности, не заботиться ни о чём, кроме как о «раскрепощении и освобождении чувственности» - это так мило и восхитительно, что злит неимоверно. Злит даже не то, чем забита голова главной героини в то время, как другие ……… Оценка: плохо
obivatel про Номен: Внучь олегарха (Альтернативная история, Попаданцы, Самиздат, сетевая литература)
21 09 Мне очень понравилось. Почитал комментарии и лишний раз убедился, что на вкус и цвет фломастеры разные. . И я к пятой главе понял, что за телеграмма пошла вначале сюжета. Хороший дедулька у бабушки был; жаль, что в ……… Оценка: отлично!
obivatel про Гросов: Инженер Петра Великого – 2 (Альтернативная история, Исторические приключения, Попаданцы, Самиздат, сетевая литература)
20 09 В общем, устал я читать этот бред. Автор не понимает простейших вещей и у меня большие сомнения, что он инженер: слишком много пробелов в знаниях. Эх, а ведь там аж куча томов, читать-не-перечитать. Но не для меня эта ягодка... волчья. Оценка: нечитаемо
obivatel про Гросов: Инженер Петра Великого – 1 (Альтернативная история, Исторические приключения, Попаданцы, Самиздат, сетевая литература)
19 09 Пока автор писал про плавку, про станки и инструмент, всё было гут. Но зачем он начал писать про военку, если ВООБЩЕ ничего не понимает? Проблема стрельбы круглым объектом из гладкоствола в неконтролируемом вращении снаряда ……… Оценка: плохо
obivatel про Жизнь Лекаря с нуля
18 09 Написано хорошим слогом, читать приятно. . Много логических противоречий, которые цепляют и раздражают; -- некоторые противоречия необходимы для "логики мира", но она от этого сильно прихрамывает; -- некоторые, ………
alexk про Шпаковский: Читающее Средневековье [litres] (Исторические приключения, История)
17 09 С картинками какая-то беда. То не те, то не там, то дубли...
Думает про Крашенинников: Наследники или ренегаты. Государство и право «оттепели» 1953-1964 [litres] (Политика, Юриспруденция)
17 09 Все романтики сгорели в сталинских лагерях. А те, что смогли оттуда выйти после войны - уже не были романтиками. Показателен в этом смысле кейс человека и его семьи, который укрывал Ленина в Финляндии (знаменитый шалаш в ……… |
Комментарии
Re: Проект по вычитке книг, подобный альдебарановскому и олдмагл
По ходу данными скобками заменены знаки препинания (пока нашёл на месте запятых).
Как хотите, но сделаю читабельно.
Re: Проект по вычитке книг, подобный альдебарановскому и олдмагл
Запишем Вас в герои Либрусека!

Re: Проект по вычитке книг, подобный альдебарановскому и олдмагл
и все-таки они стремненькие))))))))))
Re: Проект по вычитке книг, подобный альдебарановскому и олдмагл
Причина ошибки - троеточия, и одно слово были заключены в треугольные скобки "<>" - документ получался невалидный, и при просмотре в fb2 читалке не открывался полностью.
Re: Проект по вычитке книг, подобный альдебарановскому и олдмагл
Я уже не первый раз встречаю эту ошибку - треугольные скобки. Исправить её получается только в Investigator'e: он и открывает, и указывает на ошибку.
Интересно, откуда она берётся?
Re: Проект по вычитке книг, подобный альдебарановскому и олдмагл
Диверсанты наверно :-)
Re: Проект по вычитке книг, подобный альдебарановскому и олдмагл
Похоже, где-то что-то не так с кодовыми страницами и некоторыми специальными символами. А угловые скобки -- это испорченные типографские кавычки, аналогично и с многоточием, которое при неправильном конвертировании может превратиться в двоеточие ":".
Re: Проект по вычитке книг, подобный альдебарановскому и олдмагл
Re: Проект по вычитке книг, подобный альдебарановскому и олдмагл
Дело в том, что речь, видимо, идет именно о треугольных (угловых) скобках, а не о квадратных.
Так вот, квадратные скобки действительно вылезают из недоделанных файлов, которые были в txt (например, ссылки, пропущенные места и т.п.), а угловые -- тоже криворукость перегонщика, только еще бОльшая. Например, (не надо так делать!) кто-то некорректно конвертировал *.doc в *.txt (пример: antiword -m cp866.txt file.doc > file.txt) или не совсем правильно сохранил текстовый файл (кстати, и fb2 тоже касается) в не совсем "правильном" редакторе, (пример -- редактор от FAR'а), и т.п., более подробно (с примерами) могу описАть...
Re: Проект по вычитке книг, подобный альдебарановскому и олдмагл
Re: Проект по вычитке книг
беру Яна Алексеева Практикум по алхимии http://lib.rus.ec/b/105377 Вычитать, расставить ссылки
запишите меня
Re: Проект по вычитке книг
Done.
Re: Проект по вычитке книг
эта книга оказалась книгой "ученье свет", с серией вместо названия, я ее удалил. можете вычеркнуть.
Re: Проект по вычитке книг
Нет. В удалённой книге - 5 частей, тогда как в "Ученье - свет" только три, они вошли в "Практикум по алхимии". Поэтому, думаю, её стоить восстановить. Может быть, указать, что это - более полный вариант, что в неё вошла книга "Ученье - свет".
Кстати, только что увидела, что "Ученье - свет" присутствует дважды. Не знаете случайно, дубли ли это?
edti: Разобралась. Однозначно дубль. Причём более ранняя версия была залита позже. :-( Я её удалила. Думаю, стоит восстановить "Практикум по алхимии" и написать "полная версия". В неё вошли и первая, и вторая книги цикла и добавлена ещё одна часть. Сделаете?
Re: Проект по вычитке книг
не нашел отличий в размере между версиями с фикшена и той, с либрусека. тогда, если там каким-то образом присутствует вторая книга, как она называется?
Re: Проект по вычитке книг
В удалённой книге - 5 частей:
1. Практикум по алхимии
2. Ученье - свет
3. Полевая практика
4. Светские хроники цвета Сиреневой Лилии
5. Раз, два, три, четыре, пять - вышли Стражи погулять.
Первые три - здесь.
Четвёртая - здесь.
Пятая часть, насколько я поняла, новая.
Re: Проект по вычитке книг, подобный альдебарановскому и олдмагл
У Юрия Никитина висит три книги "Как стать писателем". Две - первое издание (как я понял), третья книга является 2-м изданием. Из первых изданий, у этой http://lib.rus.ec/b/39649 в аннотации "заменить книгу, купив с Литреса", весит 132 кб, у этой http://lib.rus.ec/b/103815 вес 1,4 Мб.
Произвёл замену на 2-ю.
Re: Проект по вычитке книг, подобный альдебарановскому и олдмагл
Случайно наткнулся на сайт с детскими книжками: http://www.childhoodbooks.ru/files.htm - сплошь DJVU. Кому нужно, кто может - перелейте, плиз, сюда. А может, кто-то и переберёт в fb2?..
Re: Проект по вычитке книг
вы посотмрите какая здесь фигнотень!! http://lib.rus.ec/b/105629/edit
да кто вообще такое заливает???)
ощущение, что у нас специальные вредители))
Re: Проект по вычитке книг
А что Вас смущает? То, что книга не на русском? :)
Я ее вряд ли прочту, но при беглом просмотре - кому-то, наверное, интересно...
Re: Проект по вычитке книг
Я тоже бегло посмотрела и погуглила немного. ;-)
Автор не указан, текст не сначала. Вот здесь - оригинал: http://www.ukrcenter.com/library/read.asp?id=2020&page=1#text_top
Текст, который расположен на Либрусеке, начинается со второй страницы. Когда будет время, исправлю. А может, кто-нибудь успеет раньше меня. ;-)
Re: Проект по вычитке книг
и что ето?
Re: Проект по вычитке книг
Hagen, это ты мне? Я ничего не поняла. :-(
Re: Проект по вычитке книг, подобный альдебарановскому и олдмагл
Угу, резонное дополнение.
Юникод не подскажете для неразрывного пробела? 0160, или?
Re: Проект по вычитке книг, подобный альдебарановскому и олдмагл
Э... Помню, что амперсенд nbsp; а код - ща гляну...
Ага. В 1251 это 0xA0, а в юникоде - ага, кажется, U+00A0, т.е. опять же десятичный 160.
Нестеров готов
правда, вынужден признаться, что делал не я...
Точнее, почти закончив первую книжку, вспомнил что нужно проверить в своей библиотеке... И точно! Все уже было готовое :)
Так что готов взяться за следующего автора
Re: Нестеров готов
Бывает. ;-)
Ну, если Вы так рвётесь в бой, вот Вам списочек.
http://lib.rus.ec/b/102971
http://lib.rus.ec/b/88219
http://lib.rus.ec/b/92869
2 книги здесь - http://lib.rus.ec/a/10459
Хватит пока? ;-)
Re: Нестеров готов
Вполне! Спасибо :)
Андрэ Нортон в списке вычитки (+)
отметьте как обработанную, плз
http://lib.rus.ec/b/105218
Раткевич готова (+)
http://lib.rus.ec/b/106614
Re: Проект по вычитке книг, подобный альдебарановскому и олдмагл
Если просто ставить, то Ctrl+Shift+пробел (в некоторых редакциях предлагают просто Ctrl+пробел). Или нажать пробел на один раз больше, чем надо, а потом вернуть курсор при помощи BackSpace на нужное место (программа сама заменяет более двух пробелов на неразрывные).
А как сделать массовую замену в FBE, я сама интересуюсь. Пока не знаю.
Re: Проект по вычитке книг, подобный альдебарановскому и олдмагл
Да, меня именно массовая замена интересует. Править несколько тысяч пробелов вручную я не хочу :)
Re: Проект по вычитке книг, подобный альдебарановскому и олдмагл
Вы можете попробовать сделать так:
1. Вызвать меню "заменить".
2. В окне "найти" ввести [пробел-дефис-пробел].
3. В любом месте текста ввести [неразрывный пробел-тире-пробел] и вырезать эти три знака (Ctrl+X).
4. Вставить их в окно "заменить" (Ctrl+V).
5. Нажать "заменить все".
Аналогично с тире в диалогах:
[дефис-пробел] на [тире-неразрывный пробел]
Не очень изящное решение, но работает. Я предполагаю, что можно сделать красивее, но не знаю, как.
Подождём, что скажут специалисты. :-)
Re: Проект по вычитке книг, подобный альдебарановскому и олдмагл
Соболезную. :-((
Желаю как можно скорейшего решения проблем. Сама знаю, как это обидно...
Приглашаю всех желающих создавать fb2-книги.
У нас появился новый фронт работы. Спасибо пользователю ilsatyd , любезно предоставившему исходные материалы.
По мере выкладки буду добавлять ссылки. А пока:
Бабенко. Рассказы. Сканы и rtf-файл (распознавание сохранено, насколько я поняла, как "редактируемая копия"). Брать здесь.
Бабенко. Приблудяне. Невалидный fb2-файл и два txt-файла. Брать здесь.
Два рассказа из сборника "Фата Моргана". В каждом - rtf-файл и сканы. Оба лежат здесь.
Фармер "Конец времен" Сканы и rtf-файл (распознавание такое же, как у Бабенко). Брать здесь и здесь.
Головачев "Реквием машине времени" Сканы, rtf-файл и txt-файл.
Желающие принять участие, отзовитесь.
Re: Приглашаю всех желающих создавать fb2-книги.
Ну нифига ж себе объемчик.. Я бы взялся за Фармера, если б не 100+ Мб выкачивать.
Трафик такие объемы не позволяет :(
А просто rtf отдельно нету? В смысле, без сканов.
Re: Приглашаю всех желающих создавать fb2-книги.
Есть. Только, боюсь, что без оригинала будет очень сложно. :-( Если хотите, могу выслать Вам на мыло. Пишите в личку.
edit:
Только что просмотрела Фармера. Вполне доступно. Если хотите, возьмитесь за него. А если будут проблемы, я Вам помогу сравнить со сканами.
Головачев "Реквием машине времени" Сканы, rtf-файл и txt-файл. Брать здесь и здесь.
Книги на распознавание
Обновился список книг для распознавания.
Сканы пока никуда не выложены. Желающие поучаствовать обращайтесь, пожалуйста, в личку. Договоримся о способе передачи.
Бабенко Земля
Борис Хазанов
Компьютер по имени Джо (сборник)
Крапивин "Мушкетер и фея"
Крапивин "Возвращение клипера 'Кречет'"
Крапивин "Ковер-самолет"
Теодор Томас "Целитель"
Ночь, которая умирает (сборник)
Обратная связь (сборник)
Перпендикулярный мир (сборник)
Продается Япония (сборник)
Книги на распознавание
Фармер уже "пристроен". Кто следующий? :-)
Re: Книги на распознавание
Берусь заменить файлы Пушкина, сделанные rusec-ом, оригиналами, находящимися в свободном доступе.
С небольшой задержкой: хочу восстановить отступы сделанные автором, но уничтоженные при переводе в fb2 (особое отношение Грибого и К0 к отступам). Видны на большинстве читалок, кроме AlReader-а, сохраняются при конвертации в rtf и html.
Re: Книги на распознавание
Я уже заметила Вашу работу по исправлению пушкинских драм. Браво!

Фармер готов
Фармер Филип Хосе - Конец времен. Вычитан и выложен (заменен старый, где был фрагмент). Ссылка, кому интересно - http://lib.rus.ec/i/107126.
Далее займусь Белозеровым Антоном - у него почему то отсутствует пятый том из серии "Путь Бога" и нет романа "За дверью".
Фармер готов
Фармер Филип Хосе - Конец времен. Вычитан и выложен (заменен старый, где был фрагмент). Ссылка, кому интересно - http://lib.rus.ec/i/107126.
Далее займусь Белозеровым Антоном - у него почему то отсутствует пятый том из серии "Путь Бога" и нет романа "За дверью".
Фармер готов
Фармер Филип Хосе - Конец времен. Вычитан и выложен (заменен старый, где был фрагмент). Ссылка, кому интересно - http://lib.rus.ec/i/107126.
Далее займусь Белозеровым Антоном - у него почему то отсутствует пятый том из серии "Путь Бога" и нет романа "За дверью".
Фармер готов
Фармер Филип Хосе - Конец времен. Фрагмент заменен полной версией - http://lib.rus.ec/i/107126.
Далее займусь Белозеровым Антоном. У него отсутствует пятый том из серии "Путь Бога" и роман "За дверью".
Re: Проект по вычитке книг, подобный альдебарановскому и олдмагл
Ссылку надо бы поправить. ;-)
http://lib.rus.ec/b/107126
Спасибо за Фармера. Белозерова записываю за Вами.
Фармер готов
Фармер Филип Хосе - Конец времен. Фрагмент заменен полной версией - http://lib.rus.ec/i/107126.
Далее займусь Белозеровым Антоном. У него отсутствует пятый том из серии "Путь Бога" и роман "За дверью".
Фармер готов
Фармер Филип Хосе - Конец времен. Фрагмент заменен полной версией - http://lib.rus.ec/i/107126.
Далее займусь Белозеровым Антоном. У него отсутствует пятый том из серии "Путь Бога" и роман "За дверью".
Че за глюк?
Что-то у меня куча одинаговых постов ушла. А как лишние удалить?
Re: Че за глюк?
Сам пост удалить не получится, только текст. :-(
Страницы