скрипт для лингвистического анализа текста
Опубликовано вс, 28/12/2008 - 12:58 пользователем Wictor
Forums: Просматривая отзывы на книгу Хаецкой Царство небесное натолкнулся на интересную статистику, сгенерированную скриптом (http://fantlab.ru/work9929): Цитата: Лингвистический анализ текста: Учитывая то, что большинство современных книг весьма низкого качества, задумался: можно ли дать предварительную оценку книги на основании этих цифр. Вообще при выборе книги вы бы на такую статистику обращали бы внимание?
|
Вход на сайтПоиск по блогам и форумамUser menuПоследние комментарии
Aliki RE:Подайте бедному копеечку на книжку с литреса... 6 дней
weis RE:Прошу переформатировать, распознать, etc... 3 недели larin RE:Заплатила, а абонемента нет и скачать ничего не могу! 1 месяц sibkron RE:Серия "Библиотека французской литературы" (Макбел) 1 месяц akorish RE:Регистрация 2 месяца Tramell RE:Серия "Очень прикольная книга", издательство Азбука-классика 2 месяца Larisa_F RE:Серия "Я познаю мир" издательства "АСТ, Астрель, Олимп",... 2 месяца konst1 RE:Ух, как я не люблю спамеров! 2 месяца tvv RE:DNS 2 месяца sem14 RE:«Не забыть бы тогда, не простить бы и не потерять!»-2 ... 2 месяца larin RE:Заблокирован 3 месяца konst1 RE:Серия «Интеллектуальный детектив» изд-ва АСТ 3 месяца Larisa_F RE:Серия книг «Судьбы книг» издательства «Книга» 3 месяца fixel RE:Пропал абонемент 3 месяца sem14 RE:Книжная серия "Жизнь в искусстве" издательство "Искусство"... 4 месяца sibkron RE:"100 славянских романов", серия изд.-ва "Центр книги... 4 месяца Larisa_F RE:Серия "Новые сказочные повести" издательство "Самовар" ... 5 месяцев sem14 RE:Серия "Символы времени" издательства "Аграф" 5 месяцев Впечатления о книгах
Aleks_Sim про Капоте: The Muses Are Heard [en] (отсутствует)
03 07 Да по-русски есть на Либрусеке b/181381
vudy про Далин: Убить некроманта [litres] (Героическая фантастика, Фэнтези)
03 07 Книга ничего бы не потеряла, если бы ГГ был просто некромант, а не некромант-глиномес.
Олег Макаров. про Грачев: Горбачёв. Человек, который хотел, как лучше… (История, Биографии и Мемуары)
03 07 Очень интересно читать комментарии к книге. Люди явно её не читали. Ну, и то, что Горбачёв для них виноват во всех семидесяти четырёх годах беспредела, тоже очевидно.
Igrina про Капоте: The Muses Are Heard [en] (отсутствует)
03 07 Я нашла книгу на Флибусте, но не умею заливать Ссылка на Флибусту: http://flibusta.is/b/177687 По-русски
Stager про Земляной: Крылья Империи. Полный форсаж! [HL] (Боевая фантастика, Космическая фантастика)
02 07 В умах многих в России обязательны олигарх и патриарх. УГ. Оценка: плохо
Sello про Бенгтссон: Викинги [Röde Orm] [The Long Ships ru] (Историческая проза)
01 07 Читабельно, несомненно. Местами интересно, местами - не очень, все эти "размышления" на религиозные темы, пародирующие выяснение отношений между различными конфессиями, а также язычниками (как мне кажется), что назывется, ……… Оценка: хорошо
xZiminxx про Усов: Из огня да в полымя. Книга 3 (Альтернативная история, Попаданцы, Самиздат, сетевая литература)
30 06 автор лижет зад путинской вороватой власти. а так если выкинуть политику вроде не плохо Оценка: неплохо
Isais про Белов: Заступа [СИ] (Боевая фантастика, Ужасы, Самиздат, сетевая литература, Славянское фэнтези)
28 06 Думал, добавлю недостающее и быстренько сверстаю, не глядя на текст, и... зачитался!!! И по дороге вычитал вчерне, поправил много пунктуационных и чуток орфографических ошибок. Правда, это хорошо и хорошо весьма! И не ……… Оценка: хорошо
mysevra про Игнатова: Волчья верность (Боевая фантастика)
28 06 Очень нравятся истории автора и её стиль изложения. И отношение не поменялось со временем, как это часто бывает. Жаль, что ничего нового нет, во всяком случае, мне не попадалось. Оценка: отлично!
mysevra про Игнатова: Пыль небес (Боевая фантастика)
28 06 Да я бы перечитывала за один только эпизод с фильмами о Яледской битве. «Мне не понравилось то, что они сделали. Без этих людей Новый год будет лучше» - по-моему, самая лучшая форма справедливости. Оценка: отлично!
mysevra про Игнатова: Последнее небо (Боевая фантастика, Научная фантастика)
28 06 Красивая история. Баланс на лезвии между милота и жуть. Яркий мир. Персонаж, который по-хорошему должен вызывать ужас и отвращение как потенциальный враг, но ему сопереживаешь, и во многих ситуациях он оказывается человечнее праведников. Оценка: отлично!
udrees про Михайлов: Пепел доверия-3 (Боевая фантастика, Ужасы, Постапокалипсис, Самиздат, сетевая литература)
28 06 Отличная третья книга из серии про зомбиапокалипсис, хотя конечно там не совсем зомби. Но такого описания конца света в стиле «зомби» и таких противников мне еще не встречалось. Слишком сильных, быстрых, пока не умных и многочисленных. ……… Оценка: отлично! |
Отв: скрипт для лингвистического анализа текста
Хотите поверить алгеброй гармонию? :)
Нет. Цифры любопытные, но, увы, о качестве книги они ровным счетом ничего не говорят.
Отв: скрипт для лингвистического анализа текста
А если бедный язык у автора? Ну т.е. значение "Активный словарный запас"?
Отв: скрипт для лингвистического анализа текста
Вы считаете, что у Елены Хаецкой "бедный язык"? :)
Отв: скрипт для лингвистического анализа текста
Я вот тоже очень удивилась. Зато выявилась достоверность "скриповой" оценки текста. :)
Отв: скрипт для лингвистического анализа текста
Под словом "автор" я имел в виду автора гипотетического. Хаецкая мне нравится, хотя в некоторых ее произведения встречаются повторы чуть ли не абзацев. Например куски текста из Саги о Хелоте встречаются в Харольде.
Отв: скрипт для лингвистического анализа текста
Не люблю говорить о сферических конях в вакууме. В Вашем примере активный словарный запас автора "ниже среднего". С творчеством автора Вы знакомы. Значит, можете сделать выводы. Вы считаете, что у данного автора "бедный язык"? Если ответ "да", то Вы можете смело использовать данный скрипт для предварительной оценки произведения :)
Отв: скрипт для лингвистического анализа текста
На именно такую статистику - скорее не обращал бы, чем обращал.
Но вообще-то идея не такая уж дурацкая, гармонию - не гармонию, а некоторые характеристики текста программно поймать вполне можно, хоть тот же "Штампомер" вспомнить. У меня давно свербила идея попробовать на зубок тексты людей, явно не умеющих писать (ака графоманов).
Есть как минимум два довольно легко формализуемых признака графоманского текста:
1. Избыток восклицательных знаков в прямой речи героев.
2. Вязкость словоупотребления, то бишь - одинаковые или однокоренные слова в соседних предложениях (например "Но вообще-то идея не такая уж дурацкая..." и "У меня давно свербила идея...").
Был ешё и третий признак, но я его, каюсь, забыл...
Отв: скрипт для лингвистического анализа текста
Вот ещё можно вдоволь поиграться: http://rusf.ru/books/analysis/ :)
Отв: скрипт для лингвистического анализа текста
Можно обращать и на такую но ... только строить ее не по книге, а по автору. Т.е. ввести весь его опубликованный корпус и построить профиль, желательно в привязке ко времени, что б была видна и динамика. Но при этом не забывать, что это относительные характеристики и их надо сравнивать с "подпольем" и "потолком" ;), т.к. средняя температура по больнице ничего толкового не выявит.