Вы здесьВАЛИДНОСТЬ. что это такое и с чем ее едят? Попытка вынести на обсуждение вопрос минимальных требований к книгам.
Опубликовано чт, 18/12/2008 - 08:36 пользователем yurbox
Вроде как назрело. Не холиварим. Только конструктив Валидность - минимальные требования к файлу для того, чтобы он мог появиться в библиотеке. Валидный файл - это: 2. файл с текстовым содержанием, который поддается прочтению специализированными на его формате программами, либо офисными текстовыми редакторами, обладающими функцией 3. файл, сквозная фрагментация текстового слоя которого не меньше 25% (при условии, что смысловая составляющая такого текста не утрачивается). Текст, удовлетворяющий требованию 25%, являющийся цельным блоком (середина, конец, начало) считается валидным и полным при отсутствии полного текста в библиотеке и выполнении условий п.5. 4. отдельные страницы файлов графического формата фрагментами не являются. 5. в теле файла независимо от его формата ОБЯЗАТЕЛЬНО должны указаны быть автор и название публикуемого документа. 6. минимальный размер. Здесь происходит основная загвоздка, ибо при заниженном минимуме возникает куча трудностей с упорядочиванием, а так же создается почва для спама. При разумном подходе минимальный размер нужно, наверное, все же ограничивать. Это спорно. о формате фб2 Жанр - штука обманчивая и при массовой заливке ее можно упускать, главное, чтобы файл находился поиском по автору или названию. Качество - внешние и внутренние составные части, обеспечивающие улучшение внешнего вида документа. параллельно с этой веткой идет обсуждение на тему качества, думаю, что не стоит спорить какие книги нам нужны - качественные или некачественные. Конечно качественные, и там можно будет поговорить о приоритета одних видов качества над другими.
|
Вход на сайтПоиск по блогам и форумамUser menuПоследние комментарии
monochka RE:Подайте бедному копеечку на книжку с литреса... 1 день
Larisa_F RE:Серия "Новые сказочные повести" издательство "Самовар" ... 1 неделя sem14 RE:Серия "Символы времени" издательства "Аграф" 1 неделя Larisa_F RE:Серия книг «Судьбы книг» издательства «Книга» 2 недели tvv RE:faq brainstorm =) 2 недели Larisa_F RE:Серия "Что есть что" издательства "Слово"(чего не хватает) 2 недели Larisa_F RE:Серия "Очень прикольная книга", издательство Азбука-классика 2 недели larin RE:абонемент не обновлен 3 недели sem14 RE:За иллюминатором (серия) - чего не хватает? 3 недели sem14 RE:Собираем серию: "Мастер серия", издательство "Лимбус". 3 недели Larisa_F RE:Книжная серия «Сlio» издательства "Евразия" 3 недели larin RE:Пропал абонемент 1 месяц tvv RE:DNS 1 месяц MrMansur RE:<НРЗБ> 1 месяц Stager RE:Беженцы с Флибусты 1 месяц Tramell RE:Серия "Библиотека французской литературы" (Макбел) 1 месяц sem14 RE:Книжная серия "Жизнь в искусстве" издательство "Искусство"... 1 месяц sem14 RE:Современная корейская литература. Книжная серия... 1 месяц Впечатления о книгах
MrMansur про Дубнов: Книга жизни [воспоминания и размышления] (Биографии и Мемуары)
07 02 Так есть же в формате fb2 http://209.42.197.18/b/786038
MrMansur про Прилепин: Тума (Современная проза)
07 02 Первая мысль - как же много крови проливали. Но потом осознание: почему проливали? Так было, ьак есть и так будет пока существует эта раковая опухоль - человек... Владея русским и татарским, было интересно читать многоязычные ……… Оценка: отлично!
polyn про Корсакова: Лисье золото [СИ litres] (Ужасы, Триллер, Самиздат, сетевая литература)
07 02 Очень интересное начало серии Оценка: отлично!
udrees про Каменистый: Запрещённый юг (Боевая фантастика, Фэнтези, Попаданцы, ЛитРПГ)
07 02 Смешно написано, продолжение хорошее. Понравится любителям серии. Герой снова попадает в переделки, снова сражается с сильными противниками, и снова получает кучу прогресса. Описания статов и достижений иногда могут раздражать, ……… Оценка: отлично!
udrees про Атаманов: Новые Боги (Боевая фантастика, ЛитРПГ, Самиздат, сетевая литература)
07 02 Смешное окончание приключений. Все было бы хорошо, если бы не вмешательство богов в дела земные. Хотя конечно изначально все предупреждены, что они игроки в большой Игре. Но в 4-й книге приключения в своем стиле, интересные ……… Оценка: хорошо
udrees про Атаманов: Верховья Стикса [СИ] (ЛитРПГ, Самиздат, сетевая литература)
07 02 Я полагаю не вторая, а третья книга может быть окончанием всей серии. Концовку чуть поменять и все, логический венец приключений гоблина. Собственно, в таком же стиле грамотное описание приключений гоблина, победы над сильными ……… Оценка: хорошо
udrees про Атаманов: Сохранить крылья [СИ] (ЛитРПГ, Самиздат, сетевая литература)
07 02 Совершенно сумасшедшее продолжение истории про приключения гоблина-травника в игровом мире, заодно перемежающееся с событиями в реальном мире. Автор часто использует такой прием в своих книгах. Не знаю, в «Забаненном» меня ……… Оценка: хорошо
alexk про Цзи Юнь: Заметки из хижины «Великое в малом» [сборник litres] (Древневосточная литература)
07 02 Издание повторяет старый советский вариант, только предисловие выкинули. И издание, и сам файл хуже предшественника.
decim про Смурыгина: Дефицит. Как в СССР доставали то, что невозможно было достать (История, Публицистика)
05 02 Даже забег по мос. лавкам в понедельник приносил урожай, а уж в посёлках чего только не было. Среди тамошнего населения считалось предосудительным носить не то, что принято - т.е. спецовку на каждый день и старый шерстяной ………
Barbud про Трофимов: Толмач [litres] (Боевая фантастика, Попаданцы)
05 02 Автор успел накропать уже целую охапку писева про данный исторический период, но так и не озаботился получше узнать о реалиях того времени, хотя бы учебник истории почитать - ну да, чукча не читатель, чукча писатель. Тут у ……… Оценка: плохо
irukan про Ланцов: Шанс (Альтернативная история, Социальная фантастика, Самиздат, сетевая литература)
04 02 Хорошо зашла книга! На одном дыхании прочёл. Давно у Ланцова такого не было. Наш совеременник попадает в Константинополь за несколько лет до его падения. То есть, понимаешь, что всё у него получится, но всё равно до конца держит в напряжении Оценка: отлично!
blahblah про Смурыгина: Дефицит. Как в СССР доставали то, что невозможно было достать (История, Публицистика)
04 02 Ужасная книга! Автор интервьюировала знаменитых людей, которые в тоже время в большинстве своём были детьми и внуками других знаменитых людей, ездили за границу, жили в привилегированных домах, получали спецпайки, джинсы во ……… Оценка: плохо |
Комментарии
Необычайно бурная и интересная дискуссия
Попытка создания темы для обсуждения по существу встретила живейший отклик в народных массах...
Внесу, пожалуй, свои 5 копеек. Правда, это не совсем относится к валидации, но чтобы не засорять первую страницу кучей тем, думаю, что, поскольку к оформлению файлов это таки имеет отношение, то, имхо, это допустимо.
1. Хотелось бы, чтобы книги хранились преимущественно в текстовых форматах, прежде всего fb2, раз уж он принят тут в качестве стандарта. Графические форматы занимают слишком большой объем и, имея канал всего в 256K, приходится зачастую отказываться от закачки файлов в десятки мегабайт, да и диск у меня не резиновый. Кроме того, некоторые форматы, которые не являются общеупотребительными, также могут вызвать проблему. Например, формат prc на моем настольном компьютере читать довольно проблематично.
2. Хотелось бы, чтобы варианты одной и той же книги, отличающиеся только вычиткой, не плодились в неограниченном количестве. Я лично не понимаю, зачем вообще держать все варианты файла, но если это и впрямь кому-то надо, то ходя бы окончательный (на каждый текущий момент) вариант книги как-то был выделен от остальных. Самое неприятное, что в "последних поступлениях" зачастую также имеется по 3-5 вариантов некоторых книг, причем часто одного и того же размера. Честно говоря, неохота выкачивать все варианты и тем более все их анализировать, чтобы понять, какой вариант - окончательный. Это неудобно.
3. Это довольно мелкий вопрос, но все же. Хотелось бы, чтобы все файлы именовались единообразно (В последнее время, правда, в основном уже соблюдается) и если уж имя файла начиинается с автора книги, то чтобы сначала шла фамилия, а потом имя (а не наоборот, как я смотрю, сложилось на Либрусеке).
Отв: Необычайно бурная и интересная дискуссия
Все так, кроме предпочтения форматов. Именно в графических форматах присутствует чуть не половина уникальных книг и журналов, т.к. нереально перевести в фб2 множество формул, схем и картинок. Вас лично никто ведь не заставляет их скачивать - дело это сугубо добровольное ;), а формат файлов виден. Единственно, я бы посоветовал тем, кто будет в дальнейшем делать сам такие файлы, отказаться от pdf в пользу djvu, т.к. последний гораздо компактнее.
Отв: ВАЛИДНОСТЬ. что это такое и с чем ее едят? Попытка ...
Не хватит ресурсов человеческих. И решение придется кому-то принимать, опять же - дополнительные полномочия и склоки по поводу удаленных версий. Они время от времени и так всплывают.
Вроде бы просто фамилии. без имен.
Отв: ВАЛИДНОСТЬ. что это такое и с чем ее едят? Попытка ...
Я и не требую непременно удалять, но как-то помечать последний вариант все же не мешало бы. Или хотя бы, чтобы каким-то образом была виддна хронология версий. А разбираться в 3,4,5 версиях тем более не хватит ресурсов человеческих. Какой-то выход все же нужен.
Сейчас скачал книгу для пробы, действительно только фамилия. Если это стало новым стандартом и будет применяться ко всем файлам, то замечательно.
Отв: ВАЛИДНОСТЬ. что это такое и с чем ее едят? Попытка ...
Дубли отлавливаем и удаляем. Оставляя лучшие версии. Этим правом также, кстати, наделен любой пользователь библиотеки.
Отв: ВАЛИДНОСТЬ. что это такое и с чем ее едят? Попытка ...
Просто я скачиваю каждый день "Последние поступления" и сразу заношу в свою библиотеку. И практически каждый день несколько книг встречаются в "Последних поступлениях" несколько раз. И, честно говоря, ударность труда отдельных пользователей или библиотекарей, в течении одного дня умудряющихся залить на Либрусек до 5 дублей одной книги, меня просто поражает. ;)
Получается, что в реальном режиме времени отловить дубли вручную совершенно не реально.
А нельзя ли автоматизировать устранение дублей только из "Последних поступлений", например, путем помещения в нее только самого последнего по времени дубля?
Отв: ВАЛИДНОСТЬ. что это такое и с чем ее едят? Попытка ...
1. Библиотекари - тоже пользователи. Насчет ударности труда: вы же сами ратовали за то, чтоб лили больше, без разбора, а библиотекари
к 3000 годуразберутся. Вот и разбираемся.2. Дубли ловятся не только в последних поступлениях, а во всей библиотеке.
Отв: ВАЛИДНОСТЬ. что это такое и с чем ее едят? Попытка ...
Во-первых, я ратовал за то, чтобы лили больше разных книг, а не по пять дублей одной и той же книги. И непонятно вообще, откуда появляется столько версий за ОДИН день (причем это КАЖДЫЙ день и НЕ С ОДНОЙ книгой)? Не лучше ли заливать только окончательную версию правки? Тогда бы и дублей было бы максимум два, а не 5 и время и усилия тех, кто правит, тоже было бы сэкономлено. Так что для меня такое количество дублей за один день просто загадка.
Во-вторых, я и не требую, как Вы, верно, заметили, чтобы библиотекари разбирались в реальном режиме времени. Я спросил насчет возможности автоматизировать исключение дублей из последних поступлений. Ответа я не услышал.
В любом случае, я предпочитаю вариант много книг, даже если это влечет много дублей, чем мало дублей, но мало и книг.
PS Я заранее признаю, что я злобный и гнусный враг №1 всех библиотекарей Либрусека и это исключительно из-за меня Либрусек далек от совершенства, особенно в плане качества книг. Только, пожалуйста, перестаньте кидаться в меня камушками.
Отв: ВАЛИДНОСТЬ. что это такое и с чем ее едят? Попытка ...
1. Люди льют, что хотят. Им, видимо, лениво посмотреть на наличие или отсутствие книги. И лениво что-либо делать с тем, что они льют. Не всем, конечно, некоторым.
2. По возможности автоматизации - это не ко мне. Может, agrey знает или pkn. А как, кстати, исключить дубли - их же сначала сверить надо и оставить более качественный вариант.
3. Это не кидание камушками. Просто честный ответ на поставленные вами вопросы предполагает выброс некоторого количества такого гравия: либо мы строго контролируем закачки, и иногда кратковременно могут пострадать невинные люди, либо мы оставляем, как есть, и появляется много сопутствующего мусора.
Отв: ВАЛИДНОСТЬ. что это такое и с чем ее едят? Попытка ...
Поскольку всем дублям присвоены номера, то система видит, что это один и тот же файл. Поэтому при добавлении книги можно было бы усложнить добавление дубля, усиленно спрашивая, точно ли хотят добавить дубль. Тогда ленивый не станет добавлять. Заодно это некая защита и от вандалов.
А я и не предлагаю удалять дубли. Просто в "Последние поступления" помещать только один файл из дублей. Например, последний по времени или самый большой.
Так я и пытаюсь найти вариант, чтобы и библиотекарей не грузить лишней работой и чтобы мне было проще скачивать книги. Но я лучше потерплю неудобства, если альтернативой будет уменьшение количества книг.
Отв: ВАЛИДНОСТЬ. что это такое и с чем ее едят? Попытка ...
Последний по времени или самый большой может быть худшего качества.
Отв: ВАЛИДНОСТЬ. что это такое и с чем ее едят? Попытка ...
Да я все равно все файлы перегоняю в текстовый формат. Так что мне качество не так уж и важно
Отв: ВАЛИДНОСТЬ. что это такое и с чем ее едят? Попытка ...
Ну, я тоже в rtf перегоняю, но ведь и другие пользователи есть.
Отв: ВАЛИДНОСТЬ. что это такое и с чем ее едят? Попытка ...
И много поможет другим пользователям куча дублей? Вот сейчас просмотрел последние поступления, так там книга Сергей Тармашова "Катастрофа" представлена в 6 (шести) вариантах! Рекорд! (точнее антирекорд...) С учетом того, что каждый день не одна книга имеет по нескольку дублей, то я не представляю себе, что кто-нибудь может реально просмотреть все эти дубли для выбора наилучшего. Поэтому, имхо, все же лучше выбирать оптимальный (хоть по какому-то критерию) дубль, а при необходимости пользователь может посмотреть и остальные дубли в библиотеке на предмет выбора более подходящего варианта.
чтобы не плодить посты, еще несколько замечаний по другим вопросам.
Конечно, никто не заставляет, но если хочется? ;) А посмотришь на файлы мегабайт в 20 и, хоть рука и дрожит ;), а галочку с них снимешь... Я ж и не писал, что вообще графические файлы не нужны. Я просто хотел бы, чтобы от них по возможности отказывались.
А вот сейчас просмотрел последние поступления, вот там по-прежнему имя файла формируется как <имя автора>_<фамилия автора>_<название книги>.
Нельзя ли и в Последних поступлениях сделать так, чтобы фамилия автора шла на первом месте?
На: http://lib.rus.ec/node/123605#comment-36700
Приношу свои извинения тов. yurbox за то, что развел в его теме оффтоп. Я уже писал, что, поскольку заметил, что, увы, никто длительное время так и не стал обсуждать эту тему по существу (а жаль, имхо), то решил, чтобы не плодить темы начать обсуждение похожмх вопросов. И я, честно скажу, совершенно не ожидал, что ветка развернется на такую длину...
Отв: ВАЛИДНОСТЬ. что это такое и с чем ее едят? Попытка ...
Не стоит извинений. Просто своим первым постом вы нарушили чудесную картинку того благороднейшего игнора, которого подобная постановка конкретных вопросов на обсуждение, несомненно, заслуживает. Ибо если все будут знать - что такое валидный файл, то становится под угрозу возможность элитарного обладания сакральными знаниям. Толпу завораживают непонятные слова.
Отв: ВАЛИДНОСТЬ. что это такое и с чем ее едят? Попытка ...
При закачке, развернуть файл в чистую строку, без всех спецсимволов и тегов. Пробелы свернуть в 1, а кавычки в непарные. Привести все к одному регистру и сравнить с такой же строкой уже имеющегося файла. Если совпадение больше 50%(границу подобрать по библиотечной статистике), тупо спрашивать у юзера, раза 3 :), типа "возможно вы закачиваете дубль, т.к. совпадает NN% текста. Вы уверены?". Окно с вопросом показывать на экране со случайным разбросом, что б юзер не тупо жмакал на клавишы.
Вариант не сложный, а дублей может и поуменьшить. Ведь эти дубли рождаются из-за отсутствия серверного инструмента сравнения файлов. Если будет возможность это сделать во время закачки - людям будет проще, т.к. не надо будет искать локальных вариантов.
Отв: ВАЛИДНОСТЬ. что это такое и с чем ее едят? Попытка ...
...Но, видимо, не для всех книг: http://lib.rus.ec/s/4938
А?
Отв: ВАЛИДНОСТЬ. что это такое и с чем ее едят? Попытка ...
Ряд книг блокируются от правок - в первую очередь новинки. Вандалам именно они не нравятся больше всего.
Но в данном случае удалить дубль сложно по иной причине. 3 дубля этой книги уже удалено, кстати.
Отв: ВАЛИДНОСТЬ. что это такое и с чем ее едят? Попытка ...
По теме валидности будем выступать, или оффтоп - это основной принцип?
Уленшпигель (сорри за кирилицу) этот топик по вашей просьбе был сделан. Или ваша просьба была провокацией, как я и предполагал? ТОпик ваш под названием Качество в итоге вылился в обсуждение видов кавычек. Очень как бы, ммм.. ммм... познавательный получился. Но вряд ли конструктивный.
Или я зря тратил время на написание пунктов шапки?
Пусть лучше тут будет пусто, как вчера, чем посторонние разговоры...
Отв: ВАЛИДНОСТЬ. что это такое и с чем ее едят? Попытка ...
Вопрос в тему. По новому ЧаВо
4.3.3.2.3 Книги в которых отсутствует более 10% текста. Очевидно, что если в тексте набор случайных символов, это тоже сюда попадает.
Ув. библиотекари. На мой взгляд 10% - это слишком жесткая планка, которую необходимо понизить хотя бы до 50%
Приведу основания. Существует файл. Полкниги от начала. Это 50%, что не укладывается в формат и не подлежит выкладке в библиотеку добропорядочным послушным юзером, читавшим ЧаВо. Другой такой же юзер имеет конец этой книги. и тоже не выкладывает на сайт.
В итоге - книга потеряна, а могла бы быть собрана в случае необходимости тем, у кого есть недостающий кусок.
Пример такой книги в библиотеке есть. Это http://lib.rus.ec/b/20500 Я вчера намеренно изменил ей название, чтобы указать на то, что она не в полном объеме. Так вот. В реале - это книга в руку толщиной и здесь представлена как раз на 50% своего объема. Допустим, сейчас при желании, можно отсканировать и выложить только второй кусок и склеить, это и без того немалый труд. при отсутствии же первой части работа увеличивается в два раза.
Это пример, возможно, и исключительный, однако факт остается фактом.
И еще вопрос. Правильно ли я поступил, изменив название таким образом?
Отв: ВАЛИДНОСТЬ. что это такое и с чем ее едят? Попытка ...
Согласен по обоим вопросам.