Внимание! При экспорте из FineReader 11 в fb2 возможно потеря текста!!!!
Опубликовано ср, 23/05/2012 - 00:23 пользователем Belomor.canal
Forums: Привет всем! 3 апреля. СубботаФР -11 интерпретировал как СНОСКУ! При экспорте в fb2, все сноски, которые ФР-11 не знает куда отнести в итоговый текст не попадают! В данном случае текст этой записи пропал! Смена стиля ничего не дала!
|
Вход на сайтПоиск по блогам и форумамUser menuПоследние комментарии
Океана RE:Подайте бедному копеечку на книжку с литреса... 13 часов
larin RE:Пропал абонемент 1 неделя Larisa_F RE:Серия "Новые сказочные повести" издательство "Самовар" ... 2 недели sem14 RE:Серия "Символы времени" издательства "Аграф" 3 недели Larisa_F RE:Серия книг «Судьбы книг» издательства «Книга» 3 недели tvv RE:faq brainstorm =) 3 недели Larisa_F RE:Серия "Что есть что" издательства "Слово"(чего не хватает) 4 недели Larisa_F RE:Серия "Очень прикольная книга", издательство Азбука-классика 1 месяц larin RE:абонемент не обновлен 1 месяц sem14 RE:За иллюминатором (серия) - чего не хватает? 1 месяц sem14 RE:Собираем серию: "Мастер серия", издательство "Лимбус". 1 месяц Larisa_F RE:Книжная серия «Сlio» издательства "Евразия" 1 месяц tvv RE:DNS 1 месяц MrMansur RE:<НРЗБ> 1 месяц Stager RE:Беженцы с Флибусты 1 месяц Tramell RE:Серия "Библиотека французской литературы" (Макбел) 1 месяц sem14 RE:Книжная серия "Жизнь в искусстве" издательство "Искусство"... 1 месяц sem14 RE:Современная корейская литература. Книжная серия... 1 месяц Впечатления о книгах
vladimir1098 про Иван Лукьянович Солоневич
17 02 Пожалуй, лучшая из прочитанных мою книг о временах Сталина. Чувствуется здоровый, ясный и твёрдый ум спортсмена. Очень впечатляет что написано языком и понятиями современными, в то время так никто не писал.
Paul von Sokolovski про Сергей Борисович Рюмин
16 02 Отлично! Хороший фэнтезийный сериал о русской глубинке, насыщенной жизни юного новообращенного мага и о чудесах, ими творимых. Память о жизни в Союзе у автора сохранилась и помогает сделать повествование реалистичным, ну - ………
mysevra про Арабов: Чудо (Современная проза, Мистика)
16 02 Вроде как описывается легендарное «Стояние Зои». И язык хорош, но такая безысходность и тоска во всём этом. Понятно, что никто нам не объяснит суть этого наказании (или благословения), и почему именно она, но хоть бы у священника ……… Оценка: хорошо
mysevra про Буало-Нарсежак: Убийство на 45 оборотах [= Очертя сердце; Пропащей душе; С сердцем не в ладу] [A Coeur Perdu ru] (Детективы: прочее)
16 02 Много эмоций и переживаний, но мало действия. Не спасает даже французский шарм. Оценка: неплохо
mysevra про Кирьянова: Разбуди в себе Женщину. Книга-практикум. Всего 10 шагов к здоровью и стройности через любовь к себе, принятие и понимание (Эзотерика, Самосовершенствование, Здоровье, Спорт)
16 02 Не ешь химию, качай энергетику – и будет тебе 100% любовь к себе. А все эти аффирмации, нашептывания и прибаутки – это как слой краски на старой штукатурке, в любой момент, особенно критический, посыплется. Оценка: плохо
francuzik про Семин: Сын помещика – 5 (Альтернативная история, Попаданцы, Самиздат, сетевая литература)
16 02 Типичный женский роман. Охи вздохи, конечно же невесты (как без них). Много много змеиного шипения и...и все. Оценка: плохо
vudy про ПолуЁж
15 02 Я падаю — понял я только тогда, когда ладони, а следом и голова ударились о холодный пол." Колобок ?
blahblah про Алмазный: Ликвидация 1946. Том 1 (Альтернативная история, Исторический детектив, Самиздат, сетевая литература)
15 02 Какая чушь! Станиславского на них нет! Не верю! Оценка: нечитаемо
udrees про Атаманов: Обрести тело [СИ] (ЛитРПГ, Самиздат, сетевая литература)
15 02 Хорошее достойное завершение серии про гоблина Амру. Органично вплелись реальная и виртуальная жизни в сюжете. Хорошее описание событий в игровом мире. Несколько удивительный поворот в сюжете в реальном мире по поводу заточения ……… Оценка: хорошо
udrees про Бойн: Аларих, король вестготов: Падение Рима глазами варвара [litres] (Исторические приключения, Публицистика)
15 02 Какая-то странная книга, где Аларих выступает в роли предмета интерьера в комнате что ли. Большая часть книги, да вообще вся книга, это просто описание жизни в Римской империи перед ее падением. Описываются множество персонажей ……… Оценка: плохо
udrees про Атаманов: Стратег из ниоткуда. Книга 2 (Героическая фантастика, Фэнтези, Попаданцы, Самиздат, сетевая литература)
15 02 Хорошо написано продолжение приключений попаданца в племя орков. Можно сказать история возвышения героя, который и вправду «стратег», занимающийся строительством своей империи. Сюда входит не только военное дело, но и множество ……… Оценка: отлично!
Олег Макаров. про Хонихоев: Тренировочный День 13 (Альтернативная история, Юмор: прочее, Самиздат, сетевая литература)
14 02 Немного авторов, которых я бы столько книг в серии выдержал читать. Не могу даже сказать, чем этот подкупает. Но с удовольствием уже тринадцатый раз Оценка: отлично! |
Отв: Внимание! При экспорте из FineReader 11 в fb2 возможно ...
Изменить размер шрифта стиля "Сноска" и "Оглавление" на ЗНАЧИТЕЛЬНО отличающийся от основного текста и проглядывать при распознании в FineReader. Найденный кусок вырезать, копировать в блокнот и возвращать копированием из блокнота.
Тема обсуждалась Голмой около двух месяцев назад, ссылку найти не могу.
Отв: Внимание! При экспорте из FineReader 11 в fb2 возможно ...
[quote Desenchantee]Тема обсуждалась Голмой около двух месяцев назад, ссылку найти не могу.
Спасибо! Значит тема закрыта
Отв: Внимание! При экспорте из FineReader 11 в fb2 возможно ...
Сноска http://lib.rus.ec/node/367351
Но там о том что часть нормальный текст вдруг может быть распознан как сноска нет!
Так что какой то смысл в моём сообщение есть :-)
Отв: Внимание! При экспорте из FineReader 11 в fb2 возможно ...
Сноска http://lib.rus.ec/node/367351
Но там о том что часть нормальный текст вдруг может быть распознан как сноска нет!
Так что какой то смысл в моём сообщение есть :-)
Отв: Внимание! При экспорте из FineReader 11 в fb2 возможно ...
Там нет. Есть ниже. Я говорил, что FR11 может счесть сноской текст до половины страницы - всё, лежащее ниже пустой строки или отбивки * * *.
Отв: Внимание! При экспорте из FineReader 11 в fb2 возможно ...
[quote Isais]Там нет. Есть ниже. Я говорил, что FR11 может счесть сноской текст до половины страницы
Спасибо! Именно так! Ну что ж, известно кто учится на своих, а не на чужих ошибках! В общем я пока буду в ворд- там просто смотришь в конец файла и все сразу понятно!! Скачал последний билд, но вряд это это поправио!
Отв: Внимание! При экспорте из FineReader 11 в fb2 возможно ...
Совершенно верно. :)
Сейчас, перед тем, как работать с текстом в ФР, я проделываю следующие операции:
- объединяю все стили сносок в один (если их всего два, то смысле объединять нет - как правило, один из них с курсивом, который при объединении может потеряться) и придаю им размер шрифта 6-7.
- каждому стилю "основной текст" придаю размер шрифта 10 (их не объединяю, поскольку при этом теряется форматирование курсивом и полужирным)
- все стили колонтитула объединяю и придаю им размер шрифта 6-7
- все стили заголовка объединяю и придаю им размер шрифта 20-26
- все стили оглавления объединяю и придаю им размер шрифта 30, курсивность и жирность.
Нажимаю "ОК" и жду, пока ФР объединит все шрифты.
Такой способ позволяет на 100% выявить неверный стиль при распознавании. В том числе, ту его часть, которая внизу страницы была распознана как сноска, - по размеру шрифта.
Метод борьбы с этими ошибками был уже описан Desenchantee. :)
Что касается самостоятельной расстановки сносок силами самого ФР, то качество этой версии хоть и намного лучше, но всё равно 100%-ной гарантии правильной расстановки нет.
Поэтому я предпочитаю пользоваться старинным методом: переношу текст сноски к слову, к которому она относится, заключая его в фигурные скобки. В ФБЕ потом эти сноски расставляются одним кликом.
В документальной литературе, где сносок очень много, сноски так не расставляю. Но после экспорта в фб2 методично - страница за страницей - проверяю сноски на наличие в боди "Примечание". Недостающие добавляю. Да, часто их текст оказывается после всего текста, но не менее часто он просто отсутствует.
При количестве сносок более 200 - этот способ всё равно более рациональный, на мой взгляд.
Отв: Внимание! При экспорте из FineReader 11 в fb2 возможно ...
[quote golma1]Сейчас, перед тем, как работать с текстом в ФР, я проделываю следующие операции:
- объединяю все стили сносок в один (если их всего два, то смысле объединять нет - как правило, один из них с курсивом, который при объединении может потеряться) и придаю им размер шрифта 6-7.
- каждому стилю "основной текст" придаю размер шрифта 10 (их не объединяю, поскольку при этом теряется форматирование курсивом и полужирным)
- все стили колонтитула объединяю и придаю им размер шрифта 6-7
- все стили заголовка объединяю и придаю им размер шрифта 20-26
- все стили оглавления объединяю и придаю им размер шрифта 30, курсивность и жирность.
Нажимаю "ОК" и жду, пока ФР объединит все шрифты.
Такой способ позволяет на 100% выявить неверный стиль при распознавании. В том числе, ту его часть, которая внизу страницы была распознана как сноска, - по размеру шрифта.
Отличный способ с гарантией!!!!
Отв: Внимание! При экспорте из FineReader 11 в fb2 возможно ...
Небольшое техническое дополнение - мне так удобнее. После объединения, находите первую сноску, нажимете кнопку стили, далее OK и сноска окрасится зелёным цветом. Далее листа страниы (Alt+стрелка) вы видите зелёные куски текста - это и есть область СНОСКИ!!! Так очень быстро можно посмотреть весь проект! Ярко зелёная область просто бросается в глаза!
Отв: Внимание! При экспорте из FineReader 11 в fb2 возможно ...
Кстати говорят есть новый билд. Кто ни будь на нём пробовал? У меня 11.102.481 прошлогодний
Отв: Внимание! При экспорте из FineReader 11 в fb2 возможно ...
11.0.102.583 - те же ошибки. Обещали исправить в 12, но когда он будет...
Отв: Внимание! При экспорте из FineReader 11 в fb2 возможно ...
[quote Desenchantee]11.0.102.583 - те же ошибки. Обещали исправить в 12, но когда он будет...
Спасибо что предупредили! Скачал из торрентов собирался ставить. Мой совет ребятам из Фр - сделайте опцию "различать" и "не различать"! После таких шуток, когда полстраницы обычного текста превращается в сноску, лучше без! И конечно хорошо бы, что бы экспорт из ФР был управляемый - если я сделал стиль сноска то это и есть сноска!