скрипт для лингвистического анализа текста
Опубликовано вс, 28/12/2008 - 12:58 пользователем Wictor
Forums: Просматривая отзывы на книгу Хаецкой Царство небесное натолкнулся на интересную статистику, сгенерированную скриптом (http://fantlab.ru/work9929): Цитата: Лингвистический анализ текста: Учитывая то, что большинство современных книг весьма низкого качества, задумался: можно ли дать предварительную оценку книги на основании этих цифр. Вообще при выборе книги вы бы на такую статистику обращали бы внимание?
|
Вход на сайтПоиск по блогам и форумамUser menuПоследние комментарии
weis RE:Подайте бедному копеечку на книжку с литреса... 5 часов
babajga RE:Белая княжна 1 день Nicout RE:Таинственная личность админа Флибусты 2 дня Isais RE:Файл достаточно хорош. Нет смысла в его улучшении. Ага,... 3 дня mazay RE:Sleepy Xoma - Bagⲣѱnoⲣojdennaѱ 6 дней zlyaka RE:С Новым годом! 6 дней Isais RE:Детство, опаленное войной (Вторая мировая 1939-1945 и ВОВ) 1 неделя SparkySpirit RE:Прошу переформатировать, распознать, etc... 1 неделя SparkySpirit RE:Жорж Санд - переводы 19 века 1 неделя Саша из Киева RE:Наш дом - СССР 1 неделя babajga RE:Чернушка. Повести 2 недели Саша из Киева RE:Сказки далёких островов 2 недели babajga RE:Лопоухий бес 2 недели babajga RE:Ежик покидает дом 2 недели babajga RE:Сказки бабушки Черепахи 2 недели babajga RE:Свист диких крыльев 2 недели Саша из Киева RE:Кто сможет раздобыть и оцифровать нужные мне книги? 2 недели Саша из Киева RE:Турецкие мусорщики в Анкаре открыли библиотеку, полную... 3 недели Впечатления о книгах
nik_ol про Джентльмен сыска Иван Подушкин
08 01 Выложите уже, пожалуйста, новое от Донцовой что-то, а то от Пелевина уже ум за разум заходить начал)))).
Анни-Мари про Потомокъ
08 01 Замечательная серия. Любопытно, будет ли продолжение? В целом, все логически завершено, но! Такое ощущение, что автор допускает, да.
pulochka про Френкель: Бог, которого не было. Красная книга (Проза)
08 01 Это бред сумасшедшего? Как ЭТО вообще можно читать? Оценка: нечитаемо
decim про Серяков: Русы во времена великих потрясений (История, Научпоп)
08 01 Весьма любопытные гипотезы. Однако судить о бесписьменном народе, каким в те поры были предки современных славян(русами их назвал Ибн-Фадлан гораздо позже, и не были то Ruotsi, варяги? собственно славян соседи по Балтике называли ………
Barbud про Ларин: Назад в СССР (Детская фантастика, Самиздат, сетевая литература)
07 01 Чушь какая-то. Автор, вероятно, молодой молокосос, не имеющий понятия о том, как общались пионеры в то время и каких слов и оборотов они вообще не знали. Да и ведут они себя абсолютно неестественно для тогдашних реалий. Затяжной ……… Оценка: неплохо
RusD про Елманов: Серый ангел [litres] (Попаданцы, Историческое фэнтези)
07 01 Это, похоже, 2я часть книги "Последний шанс империи
Вита Бревис про Руслан Владимирович Жуковец
07 01 То что я прочла и поняла - хорошо. Отсюда я заключаю, что и все остальное - тоже. Я прочитала характеристику Порфирия Иванова. Великолепно. И глубина , и анализ, и все такое.
mysevra про Выставной: Тварь (Боевая фантастика)
07 01 Насколько была увлекательной первая книга, настолько же неинтересна вторая. P.S. Здорово, что вы есть, я безумно скучала. Оценка: неплохо
dolle про Пехов: Птицеед (Фэнтези, Самиздат, сетевая литература)
07 01 Интересный новый мир Пехова.Мелкими мазками раскрывается во время повествования ,но к концу первой книги вопросов о нём станет ещё больше.Сюжет,интрига, герои есть.Впрочем все миры Пехова "ламповые".Тот случай когда автор ……… Оценка: отлично!
Lan2292 про Алексин: Маг поневоле [СИ] (Фэнтези, Самиздат, сетевая литература)
06 01 ХРЕНЬ ПОЛНАЯ, РЕАЛЬНО ПЫТАЛАСЬ ПРОЧИТАТЬ, НО НЕ СМОГЛА ПРЕОДОЛЕТЬ ЭТУ КАШУ. Оценка: нечитаемо
polyn про Мартова: Одна смертельная тайна [litres] (Детективы: прочее)
05 01 Необычайно атмосферная книга, что даже я,обычно мало обращающая внимание на антураж, прониклась. Автор проделал гигантскую работу, изучая крестьянский быт середины 19 – начала 20 века российской глубинки. Оценка: отлично!
Дядя Морган про А. В. Панов
05 01 полёт Юрия Гагарина он тоже отрицал" И правильно отрицал, ведь Ю.Гагарин "Бога не видел", а значит небесной тверди не достиг, крутился где-то поблизости, в стратосфере. |
Отв: скрипт для лингвистического анализа текста
Хотите поверить алгеброй гармонию? :)
Нет. Цифры любопытные, но, увы, о качестве книги они ровным счетом ничего не говорят.
Отв: скрипт для лингвистического анализа текста
А если бедный язык у автора? Ну т.е. значение "Активный словарный запас"?
Отв: скрипт для лингвистического анализа текста
Вы считаете, что у Елены Хаецкой "бедный язык"? :)
Отв: скрипт для лингвистического анализа текста
Я вот тоже очень удивилась. Зато выявилась достоверность "скриповой" оценки текста. :)
Отв: скрипт для лингвистического анализа текста
Под словом "автор" я имел в виду автора гипотетического. Хаецкая мне нравится, хотя в некоторых ее произведения встречаются повторы чуть ли не абзацев. Например куски текста из Саги о Хелоте встречаются в Харольде.
Отв: скрипт для лингвистического анализа текста
Не люблю говорить о сферических конях в вакууме. В Вашем примере активный словарный запас автора "ниже среднего". С творчеством автора Вы знакомы. Значит, можете сделать выводы. Вы считаете, что у данного автора "бедный язык"? Если ответ "да", то Вы можете смело использовать данный скрипт для предварительной оценки произведения :)
Отв: скрипт для лингвистического анализа текста
На именно такую статистику - скорее не обращал бы, чем обращал.
Но вообще-то идея не такая уж дурацкая, гармонию - не гармонию, а некоторые характеристики текста программно поймать вполне можно, хоть тот же "Штампомер" вспомнить. У меня давно свербила идея попробовать на зубок тексты людей, явно не умеющих писать (ака графоманов).
Есть как минимум два довольно легко формализуемых признака графоманского текста:
1. Избыток восклицательных знаков в прямой речи героев.
2. Вязкость словоупотребления, то бишь - одинаковые или однокоренные слова в соседних предложениях (например "Но вообще-то идея не такая уж дурацкая..." и "У меня давно свербила идея...").
Был ешё и третий признак, но я его, каюсь, забыл...
Отв: скрипт для лингвистического анализа текста
Вот ещё можно вдоволь поиграться: http://rusf.ru/books/analysis/ :)
Отв: скрипт для лингвистического анализа текста
Можно обращать и на такую но ... только строить ее не по книге, а по автору. Т.е. ввести весь его опубликованный корпус и построить профиль, желательно в привязке ко времени, что б была видна и динамика. Но при этом не забывать, что это относительные характеристики и их надо сравнивать с "подпольем" и "потолком" ;), т.к. средняя температура по больнице ничего толкового не выявит.