скрипт для лингвистического анализа текста
Опубликовано вс, 28/12/2008 - 12:58 пользователем Wictor
Forums: Просматривая отзывы на книгу Хаецкой Царство небесное натолкнулся на интересную статистику, сгенерированную скриптом (http://fantlab.ru/work9929): Цитата: Лингвистический анализ текста: Учитывая то, что большинство современных книг весьма низкого качества, задумался: можно ли дать предварительную оценку книги на основании этих цифр. Вообще при выборе книги вы бы на такую статистику обращали бы внимание?
|
Вход на сайтПоиск по блогам и форумамUser menuПоследние комментарии
tvv RE:Беженцы с Флибусты 17 часов
tvv RE:Доступ 27 1 день Isais RE:Вадим Иванович Туманов - Всё потерять - и вновь начать с... 1 день Isais RE:Семейственность в литературе 4 дня Isais RE:Древний Рим. Подборка книг 4 дня Саша из Киева RE:Подайте бедному копеечку на книжку с литреса... 5 дней Саша из Киева RE:"Экс" и "нео": разноликие правые 5 дней medved RE:Предупреждение: "зеркала" флибусты 2 недели Isais RE:Соседи 2 недели babajga RE:Как сова отправилась в отпуск 3 недели Саша из Киева RE:Горящие паруса 1 месяц Саша из Киева RE:Подвиг героев - судьба страны. МНР: люди и годы 1 месяц commodore RE:Письма 1 месяц Саша из Киева RE:Три минуты истории 1 месяц nehug@cheaphub.net RE:Как бы с этим побороться и побороть? 1 месяц Саша из Киева RE:Книги на латышском языке 1 месяц stevecepera RE:Список современных французских писателей? 2 месяца etorus2008 RE:Отв: Помогите найти книгу по описанию 2 месяца Впечатления о книгах
decim про Райан: Песнь крови [Blood Song ru] (Героическая фантастика, Фэнтези)
18 07 Отлично как для фэнтези, а для книги вообще просто хорошо. Перевод приличный. Оценка: отлично!
Barbud про Лео: Сделай что сможешь. Развивая успех (Альтернативная история, Исторические приключения, Попаданцы, Самиздат, сетевая литература)
17 07 Все по-прежнему. ГГ, несмотря на мальчишеское тело, непомерно крут - ворочает огроменными деньжищами, в стрельбе побеждает офицеров, из незнакомого лука навскидку попадает по заказу куда просят, предприниматели, военные и ……… Оценка: неплохо
Лысенко Владимир Андреевич про Ераносян: Доброволец (Альтернативная история, Боевик)
17 07 Нет не сюжета, все свалено в одну кучу. Оценка: нечитаемо
voronin345 про Ераносян: Доброволец (Альтернативная история, Боевик)
17 07 один бандюк супротив другога бандюка....прелесть!!! Оценка: нечитаемо
мила7 про Куно: Повенчанные временем [litres] (Любовная фантастика)
15 07 Хорошо написано. Мне понравилось. Оценка: отлично!
Lena Stol про Видум: Договор (Фэнтези, Попаданцы, ЛитРПГ, Самиздат, сетевая литература)
15 07 Не понравилось - сюжет почти не двигается, герой занят прокачкой себя любимого. Надоело перечисление навыков, что за чем следует, что ещё надо прокачать и т.д. Оценка: плохо
Саша из Киева про Алексеев: О русской доблести и славе (Историческая проза, Детская проза, История, О войне)
14 07 Как жаль, что Сергей Петрович Алексеев не написал об Александре Невском!
StrelaVV про Зазеркалье [Шарапов]
14 07 Первая книга очень понравилась, читать было интересно и даже страшно, сразу вспомнилось детство, где ночью виделись призраки, бандиты и покойники
Isais про Нури: Дочь ведьмы [СИ : Литрес] (Ужасы)
13 07 Старательно. По правилам. Неубедительно. Читал с полуночи до двух ночи, так и не проникся. Чего-то недоложили в этот борщевой набор. Пластмассово как-то. Оценка: неплохо
nik_ol про Луганцева: Чисто убойное дело [litres] (Иронический детектив, Детективы: прочее)
13 07 А что, Татьяна больше не пишет книжки?... Жду не дождусь новых, люблю читать перед сном и в транспорте, для разгрузки мозга! Оценка: отлично!
Wild_XC70 про Дроздов: Невеста инопланетянина (Альтернативная история, Космическая фантастика, Самиздат, сетевая литература)
12 07 Дождался проды. Лучше бы её не было. Похоже Дроздов перегорел. Оценка: плохо
mysevra про Каверин: Два капитана [с непрозрачными иллюстрациями] (Советская классическая проза, Приключения: прочее)
12 07 Поймала себя на том, что завидую главному герою. «Если вы думаете, что приключения опасны, попробуйте рутину – это смертельно». Оценка: отлично! |
Отв: скрипт для лингвистического анализа текста
Хотите поверить алгеброй гармонию? :)
Нет. Цифры любопытные, но, увы, о качестве книги они ровным счетом ничего не говорят.
Отв: скрипт для лингвистического анализа текста
А если бедный язык у автора? Ну т.е. значение "Активный словарный запас"?
Отв: скрипт для лингвистического анализа текста
Вы считаете, что у Елены Хаецкой "бедный язык"? :)
Отв: скрипт для лингвистического анализа текста
Я вот тоже очень удивилась. Зато выявилась достоверность "скриповой" оценки текста. :)
Отв: скрипт для лингвистического анализа текста
Под словом "автор" я имел в виду автора гипотетического. Хаецкая мне нравится, хотя в некоторых ее произведения встречаются повторы чуть ли не абзацев. Например куски текста из Саги о Хелоте встречаются в Харольде.
Отв: скрипт для лингвистического анализа текста
Не люблю говорить о сферических конях в вакууме. В Вашем примере активный словарный запас автора "ниже среднего". С творчеством автора Вы знакомы. Значит, можете сделать выводы. Вы считаете, что у данного автора "бедный язык"? Если ответ "да", то Вы можете смело использовать данный скрипт для предварительной оценки произведения :)
Отв: скрипт для лингвистического анализа текста
На именно такую статистику - скорее не обращал бы, чем обращал.
Но вообще-то идея не такая уж дурацкая, гармонию - не гармонию, а некоторые характеристики текста программно поймать вполне можно, хоть тот же "Штампомер" вспомнить. У меня давно свербила идея попробовать на зубок тексты людей, явно не умеющих писать (ака графоманов).
Есть как минимум два довольно легко формализуемых признака графоманского текста:
1. Избыток восклицательных знаков в прямой речи героев.
2. Вязкость словоупотребления, то бишь - одинаковые или однокоренные слова в соседних предложениях (например "Но вообще-то идея не такая уж дурацкая..." и "У меня давно свербила идея...").
Был ешё и третий признак, но я его, каюсь, забыл...
Отв: скрипт для лингвистического анализа текста
Вот ещё можно вдоволь поиграться: http://rusf.ru/books/analysis/ :)
Отв: скрипт для лингвистического анализа текста
Можно обращать и на такую но ... только строить ее не по книге, а по автору. Т.е. ввести весь его опубликованный корпус и построить профиль, желательно в привязке ко времени, что б была видна и динамика. Но при этом не забывать, что это относительные характеристики и их надо сравнивать с "подпольем" и "потолком" ;), т.к. средняя температура по больнице ничего толкового не выявит.