Вы здесьОбработка дублей.
Опубликовано сб, 31/05/2008 - 08:16 пользователем xxxyurixxx
Может все-таки стоит запретить удаление книг для всех? Сделать удаление и обработку дублей модерируемыми? Просто некоторые товарищи уже задолбали заменять отличные файлы неправлеными eBookDownloader'овскими. Сборники Лукьяненко, например, заменили. Сейчас залил назад нормальные.
|
Вход на сайтПоиск по блогам и форумамUser menuПоследние комментарии
Telly RE:Подайте бедному копеечку на книжку с литреса... 20 мин.
kopak RE:Таинственная личность админа Флибусты 1 день Саша из Киева RE:Кто сможет раздобыть и оцифровать нужные мне книги? 1 день Isais RE:Дмитрий Анатольевич Горчев - ЖЖ Дмитрия Горчева (2009–2010) 5 дней Саша из Киева RE:Детям о Ленине (Издание 1965 года) 1 неделя Саша из Киева RE:Приключения Мишки-Ушастика (Перевод Марата Брухнова) 1 неделя babajga RE:Белая княжна 2 недели Isais RE:Файл достаточно хорош. Нет смысла в его улучшении. Ага,... 2 недели mazay RE:Sleepy Xoma - Bagⲣѱnoⲣojdennaѱ 3 недели zlyaka RE:С Новым годом! 3 недели Isais RE:Детство, опаленное войной (Вторая мировая 1939-1945 и ВОВ) 3 недели SparkySpirit RE:Прошу переформатировать, распознать, etc... 4 недели SparkySpirit RE:Жорж Санд - переводы 19 века 4 недели Саша из Киева RE:Наш дом - СССР 1 месяц babajga RE:Чернушка. Повести 1 месяц Саша из Киева RE:Сказки далёких островов 1 месяц babajga RE:Лопоухий бес 1 месяц babajga RE:Ежик покидает дом 1 месяц Впечатления о книгах
Skyns71 про Тютелов: Славянская здрава (Эзотерика, Здоровье)
25 01 Еще одна отчаянная попытка высосать из пальца "великое прошлое" и "тайны национальной эзотерики" - причем повторяя типично западноевропейскую моду. Только с отставанием примерно лет на сто.
Саша из Киева про Муранов: У світі водоспадів (Легенди і правда про водоспади) [uk] (Геология и география)
25 01 Эта книга в оригинале написана на русском языке. Неужели она была издана только в переводе на украинский?
Sello про Акопян: Кавалер Ордена Золотого Руна (Юмористическая проза)
24 01 Читать не буду, даже если выяснится, что написано божественным языком. Меня интересует другое: что за жлобство наблюдается в последнее время, привлекать к себе внимание, используя известные имена в литературе, тех, кто прославился ……… Оценка: нечитаемо
decim про Шамбаров: Почему мы дошли до Берлина? Параллельная история Второй мировой войны (Исторические приключения, О войне)
24 01 Популярно стало мымыкать от имени отцов и дедов - они сами уже ничего не скажут. И выглядит это как "позор джунглям!" из-за спины Шер-Хана...
Barbud про Рейхсфюрер 1943
23 01 Гм... "Первый том неоднократно удостоился сравнения с лучшими работами великого Олега Рыбаченко" - да уж, это такая рекомендация, что после нее все сомнения "читать-не читать" отпали начисто))
mysevra про Мори: Пустой человек (Космическая фантастика, Социальная фантастика, Ужасы)
23 01 Стóящий сборник, есть оригинальные истории, рассказанные хорошим языком. Но немного депрессивно; послевкусие от прочтения не приятно-жутенькое, а стыло-обречённое. Оценка: хорошо
Wild_XC70 про Дроздов: Интендант третьего ранга. Herr Интендантуррат [Дилогия] (Альтернативная история, Попаданцы)
22 01 Мне понравилось. Живой сюжет. Хороший слог. Оценка: отлично!
Wild_XC70 про Дроздов: Зубных дел мастер (Попаданцы, Самиздат, сетевая литература)
22 01 Начало интересное. Жду проду. Оценка: хорошо
Wild_XC70 про Дроздов: Командировка в ад [СИ] (Боевая фантастика, Приключения: прочее, Самиздат, сетевая литература)
22 01 Редкостное нечитабельное гуано. Писал не Дроздов а Матвиенко. Оценка: нечитаемо
Columbus про Мир вашему дому!
22 01 дядя_Андрей а ничего, что никаких "Татарстана, Хакассии, Мордовии, Удмуртии, Коми, Чувашии, Ханты-Мансийска" просто не существовало до прихода туда Русских людей? Не забудь об этом, когда будешь говорить о "покорении ………
V_E про Бегоунек: 7 недель в полярных льдах (Путешествия и география)
22 01 Жанры указаны - путешествия и география. Киберпанк я не указывал. Даже не знаю такого жанра.
дядя_Андрей про Мир вашему дому!
21 01 Второй гашек, а ничего, что никаких "Татарстана, Хакассии, Мордовии, Удмуртии, Коми, Чувашии, Ханты-Мансийска" просто не существовало до прихода туда Русских людей? у Олега Николаевича замечательные книги с правильными ……… |
Комментарии
Re: Обработка дублей.
Зачем заливать? Можно восстановить удаленное. Насчет модерации не согласен - неудобно + много работы модераторам, которых сейчас нет и т.д. Что действительно нужно, если уж делать модераторов, то дать им(и только им!) возможность удаления книг навсегда. Зачем это надо? Есть авторы у которых написано 10 книг, а в удаленных 60+ Причем версии книги идут так: 1 версия --- добавлена анотация --- исправлена опечатка(одна) --- исправлена опечатка(еще одна) и т.д. Нафиг хранить все эти промежуточные вещи? Плюс появляются "доброжелатели", которые восстанавливают все подряд. Итог: каша на полке у автора.
Re: Обработка дублей.
Да-да-да! Я сама недавно только с 3-го раза "правильно" залила книгу. *краснеет*
Промежуточных два варианта никому не нужны.
Re: Обработка дублей.
Не знал. Спасибо. Работы, кстати, не так уж и много. Человек 5-10 вполне справятся. Думаю, что из числа постоянно заливающих книги, желающих быть модераторами наберется достаточно.
И восстанавливать уделенное не очень удобно. То что раньше в библиотеке была книга лучшего качества практически никто не знает и восстанавливать некому.
Re: Обработка дублей.
а что, резонно.
Re: Обработка дублей.
А может быть как-то присваивать "облизанным" вариантам статус незаменимых? Правда как это осуществить программно в Друпале не представляю.
Вот именно статусы "окончательного варианта" и можно было бы оставить модераторам. Или обратный вариант - под замену открыты только невалидные книги. Еще подумать надо. Вообще, задачка логистическая или управленческая, решения должны быть различными. В зависимости от степени ограничений, которые выставляются определенным группам пользователей.
Re: Обработка дублей.
Не знаю, реально ли тут что-то изменить. Сам вики-принцип формирования библиотеки не дает что-то сделать в этом плане. Иначе потеряем больше - затруднится заливка. Наверное, надо заливающим иметь больше ответственности. Дублей, действительно, море. Другое название, другой жанр... И вот вам новая книга, а по сути - та же самая, но хуже. И главное, люди ведь это делают не со зла, а считают, что помогают библиотеке :(. Предложение Ларину: при заливке книг сделать крупное, яркое сообщение - предупреждение, типа: А вы уверены, что заливаемая вами книга отсутствует в библиотеке? А вы уверены, что ваша версия лучше, чем имеющаяся в библиотеке? А модераторы - это несерьезно, увы.
Re: Обработка дублей.
Это не вариант. Я сейчас правлю поэзию - она полностью не отформатированная, зато формально валидная. :-(
Да и "простые" книги, прошедшие валидацию, не всегда могут получить статус "окончательного варианта". Так что валидность не может быть критерием.
Re: Обработка дублей.
"Приходите и модераторствуйте над нами!" - за такие неприличные предложения нужно банить :)
Можно посылать уведомления "залитая вами книга n1 заменена на n2", вывесить на видном месте список удаленных и замененных книг, помечать заведомо валидные книги, и т.д. То есть, следует соблюдать принципы wiki, раз уж взялись.
С этой задачей и простенький скрипт прекрасно справится. Когда понадобиться свободное место на диске.
Re: Обработка дублей.
Отвечу своей собственной цитатой:
Свободное место - последнее что меня волнует. Я же не говорю: давайте уберем возможность "удаления" книг пользователями. Я говорю: давайте выберем групу модераторов и дадим им возможность окончательного удаления промежуточных версий книг.
Не обижайся, но это маразм. Заливается и правится огромное количество книг ежедневно(около двух сотен, а иногда и больше).
Re: Обработка дублей.
И это тоже проще решить техсредствами.
Ну, и?.. Пара модераторов с этим справятся лучше пары сотен добровольцев?.. Не обижайся, но это не меньший маразм :)
Re: Обработка дублей.
Не знаю, как насчёт модераторов - не думала над этим вопросом, да и не чувствую (пока?) необходимости, но вот против рассылки я была бы категорически против.
Тут не получается отписаться от уведомлений об ответах из форума (кстати, кто-то знает, как это сделать?), а если к ним ещё добавятся уведомления о перезаливке книг, то вообще придётся заводить отдельный почтовый ящик только для этих целей. :-(
Представьте себе, что будет делаться у людей, заливающих регулярно книги. УжОс!
Re: Обработка дублей.
На ifolder.ru файлы заливать не доводилось? :)
Почтой слать уведомления совсем не обязательно. Можно в "личку". Можно (и нужно!) сделать страничку персональной статистики по залитым книгам... Само собой разумеется, юзер должен иметь возможность все это отключить.
Re: Обработка дублей.
Нет. А шо, страшно? ;-)
Re: Обработка дублей.
Нудно. Очень неудобный, для тех заливает, обменник.
А никто и не должен эту страничку видеть, кроме самого юзера.
Э... А как их проверять-то? Создадим СБ Либрусека? :)
Меня лично вполне бы устроил и чекбокс "показывать 'сомнительные' книги".
Re: Обработка дублей.
Держать на сервере любую информацию о том кто сколько какого копирайта залил - мягко говоря, нежелательно.
Re: Обработка дублей.
Ну, мне вот, мягко говоря, пофиг. А для кого опасно - тот конечно должен иметь возможность все это отключить.
Re: Обработка дублей.
Да мне как бы тоже пофиг... пока повестка не пришла ;-) (плюет по три раза через все плечи и стучит по всему деревянному - голова, естественно, отзывается глухой болью)
Но мне так кажется что это и для Ларина нежелательно.
И вот кстати попутная мысль - а нельзя ли сделать такой скрипт (локальный на клиенте, как Ваши пользовательские) который бы держал список залитых мною книг - но не на сервере, а на моем компе?
Хотя я пока и не вижу зачем (ну кроме тщеславие почесать) мне такой список был бы нужен... но все равно хочется. Не так чтобы сильно, правда. Я все равно держу в отдельном директории копии залитого.
Re: Обработка дублей.
* задумчиво смотрит на значки мюторрента и емула в трее *
Книжки, говорите?..
Ларину, пожалуй, тоже пофиг. Руки у ебук-копирастов (как звучит!) коротки.
Тогда уж лучше делать нормальный upload manager, на языке уровнем пониже скриптов.
Re: Обработка дублей.
*весело смотрит на зелененький индикатор Флешгета, качающего в двадцать четыре горла очередные хай-дефинишн кинухи с рапиды*
А мы пирингом не занимаемся. Соответственно, и не распространяем. Так что прихватить нас за выступающие части тела совсем не так легко.
Не знаю. Может быть. Я бы на его месте, все-таки, не держал на сервере информацию о том кто что залил.
Ну это явно оверкилл, задача того не стоит.
Re: Обработка дублей.
Ай-яй-яй! Задумайтесь - откуда на рапиде киношки берутся?.. Может, как раз я ее туда и залил? ;)
Как сказать... У JavaScript есть такой недостаток: максимальный размер cookie ~4Kb. Какие уж тут списки файлов...
Впрочем, попробую поиграть с относительно новой фичей "Local Storage" (~60Kb). Посмотрим, что из этого выйдет.
Re: Обработка дублей.
Как - откуда?! Самозарождаются, конечно. Как булки на деревьях.
Re: Обработка дублей.
Логично. И чего к нам защЫтники копирайтов цепляются?..
Re: Обработка дублей.
Я так думаю что исключительно из врожденной вредности.
Re: Обработка дублей.
О-о-о! Так ты тоже из Ксанфа? :D
Re: Обработка дублей.
это что такое?
королевство тёмных эльфов или павильон для уничтожения ядерных отходов?))))))))))
просто звучит немного пугающе название))))))
Re: Обработка дублей.
Энтони Пирс, серия "Ксанф", на русском читал 20 книг. Хотя написано для детей (в основном), но вполне доступно и взрослым :)
Re: Обработка дублей.
согласен, страничка статистики по всем книгам которые я заливал или правил - супер!!
типо watchlist'a на википедии =)
Re: Обработка дублей.
Цитируя pkn: ....мягко говоря, нежелательно.
Re: Обработка дублей.
Все это решается просто: книги отправляются в список не автоматом по факту заливки, а вручную. Если я хочу следить за данной книгой - жму на кнопку "наблюдать" (сейчас я пользуюсь для этой цели книжной полкой, но это не очень удобно). Конечно, наблюдать можно не только за теми книгами, которые залил сам.
Re: Обработка дублей.
отличная идея!!!! мне бы такое в голову никогда не пришло)))
кстати, у меня вопрос, эту случайно не ты в вычитке переводила отсканенные книги djvu в fb2? можно попросить тебя то же самое сделать с одним учебником??
Re: Обработка дублей.
Если ты о "1189 годе", то у меня был текстовый файл из другого источника. А что за учебник? Если в нем много иллюстраций и формул, лучше оставить в djvu, мне кажется.
Re: Обработка дублей.
я не о нем.
у мну есть учебник польского, но там нет ocr слоя.
я хочу оставить книгу в djvu, но!
1. я не знаю как добавить ocr слой
2. не знаю как сделать оглавление
обяснишь?)
Re: Обработка дублей.
Неа, сама не знаю.
Re: Обработка дублей.
Да... Да. Да!! Не нужно хранить на сервере ничего лишнего. Как сказал О. Бендер, - "уберите фотографа, он мешает моей шахматной мысли" ;) А мы тут не междупланетный турнир устраиваем, а всего лишь... Ну, да ладно, все и так знают. Что я заливаю, например, на рапиду, я оставляю у себя в виде ссылки. Там и адрес, и код удаления. И довольно.
Re: Обработка дублей.
Re: Обработка дублей.
Сам не разобрался. :( Пришлось изменить почтовый ящик в настройках на - теперь "спам" с либрусека не доходит.
Re: Обработка дублей.
блин, вот что значит глючный интернет :( Тройной пост
Re: Обработка дублей.
Мне придёт ТРИ уведомления. В-)
Re: Обработка дублей.
Я борюсь с этим путем максимального повышения терпения и максимального понижения нетерпения. Килкнул на "отправить" - оно му-му... му-му... му-му... тогда я не кликаю второй-третий раз, а перехожу к другим делам. Минут через десять возвращаюсь, рефрешу страничку в другом окне - как правило, пост появляется.
Re: Обработка дублей.
Что-то много воды... Вопрос к занимающимся оцифровкой и прочими премудростями, в просторечии именуемыми созданием электронных книг:
Насколько точно можно определить правильность книги и вообще, возможно ли это?
Какие критерии нужно использовать при таком отборе?
Если ответ отрицательный, то никаких рычагов управления, кроме жесткого администрирования (абсолютно не соответствует модели ресурса) не вижу.
Если "правильность" книги поддается определению, (кстати, можно увязать с проектом вычитки - уж там-то должны по определению получатся наиболее правильные варианты), напрашивается введение для таких книг введение статуса "Finish", который не позволяет удалить или заменить данный вариант без снятия статуса. Модераторы не нужны, просто установкой статусов и дальнейшей правкой статусных произведений будет заниматься группа вычитки и коррекции.
Окончательное удаление остается в руках Ларина - слишком серьезные права. Если группа вычитки будет работать и будет достаточно обширной - через некоторое время появится вполне приличная по объему вполне "правильная" подборка.
Еще один плюсик - в подборке будут в основном новинки и наиболее популярные произведения.
А дубли пусть существуют. Пока не стоит вопрос нехватки места, они не очень мешают. А вот статус позволит читателю отобрать из нескольких дублей тот, который наиболее близок к совершенству.
Могу ошибаться, или не видеть каких-то очевидных проблем. Может кто-то подскажет другое решение по данному вопросу...
Re: Обработка дублей.
Во-вторых, заливалка новых книг всегда бодро рапортует "дубль найден и удалён", а должна смотреть и на ebookdownloader'ность с fb2fix'ностью, и на номер версии (отказываться заменять более древнюю на более свежую, версией 1.0 вообще никакую не замещать, версии >= 2 не заменять никакими), и только если заливаемая свежЕе - тогда, так уж и быть, пусть выводит дубля и предлагает между ними выбрать.
В-третьих, при просмотре книги (и даже при наведении мыша на линк на книгу - по крайней мере, при поиске и просмотре обновлений) неплохо бы сообщать ID и номер версии документа, ник его автора и дату заливки. (Часть этой информации можно получить на странице исправления книги, но не всю и это не сильно удобно.)
Re: Обработка дублей.
Можно попробовать такой вариант до кучи:
1) Составить список признаков, явно отличающих более сложное форматирование книги от более простого
(заголовки, эпиграфы, стихи, цитаты, сноски и проч)
2) Наличие/отсутствие признаков ebookdownloader'ности с fb2fix'ностью
3) Размер
4) Картинки-обложки
5) Аннотации
6) Валидность
При попытке менять книгу со сложным форматированием на вариант плэйн-текста - отказывать.
Re: Обработка дублей.
по моему это довольно сложно воплотиьт, чтобы при заливке каждой книги такое делалось...
Re: Обработка дублей.
Помоему, все ушли не в ту степь.
Самый простой вариант, прикрутить оценки качества к книгам.
Книги с неким количеством проголосовавших, но получившие сумму оценок ниже определенного уровня, автоматом пусть убираются в спойлер "Книги сомнительного качества".
Пройдет время и библиотеке будет красота (но тут уже от читателей зависит).
А удаление всеми желающими - зло.
Re: Обработка дублей.
люди и самой книге ставят оценки не очень активно, а вот качеству книги совсем мизерное число будет((((
пусть лучше ларин обратно приделает поиск дублей по id книги.
теперь оно не работает((((((((((
папки "удалённые" и "дубли"
В контроле за удалением есть здравый смысл. Например, приходит какой-то поц с литреса и удаляет книги. В связи с этим предлагаю следующее. Удалённые книги должны лежать в особой папке "удалённые". Такая папка есть на целом ряде почтовых серверов. Файлы в предложенном варианте из папки "удалённые" пользователи удалить не могут, но могут при необходимости восстановить. Если файлы не восстановили в течении какого-то срока, скажем, недели с момента удаления, тогда они удаляются автоматически. Возможно, что есть смысл и в аналогичном контроле сверки дублей. Дубли при этом удаляются окончательно, а отправляются в папку "дубли", если их не затребовали назад на повторную сверку в течении недели - удаляются автоматически.
Re: Обработка дублей.
Возможно, следует делать так: Заменять/удалить книги не сразу, сделав предварительный опрос пользователей. Если какой-либо юзверь решил заменить/удалить книгу, то это происходит не сразу, а оба варианта помещаются в некий лист опроса: "Пользователь такой-то предлагает заменить книгу такую-то". Причина (заполняется инициатором) "более качественное форматирование" (допустим). И рядом голосовалка в простейшем виде. Любой, всяк сюда входящий, сможет просмотреть бегло оба варианта и голосовать "Да"/ "Нет". По итогам n дней книга автоматически заменяется/удаляется. Это защитит библиотеку от чистильщиков с литреса и просто неадекватных пофигистичных ламеров.
От дублей можно оборонятся аналогично "Пользователь такой-то предлагает добавить автору такому-то произведение такое-то". И рядом голосовалка Хотим/Не хотим/Это дубль/. В случае победы по п 3 книга попадает автоматически в опросник замены.
Библиотека выгодно отличается от Википедии в том, что там для того чтобы сделать вывод о качестве / правильности статьи надо обладать специальными знаниями. Здесь же большинство может все-таки отличить разницу между текстами.
Для экономии результат голосования выкладывать рядом с голосовалкой, чтобы, например, при подавляющем "за" люди не тратили время на сравнивание.
Ну если такой механизм не защитит, то уж, звиняйте, ничего не поможет, тогда и жаловаться нех.
Re: Обработка дублей.
У Крайтона Майкла есть дубли романа Крылья
Научная Фантастика Детектив
- Крылья 1118K
Триллер
- Крылья 676K
Первый нужно удалить; плохо отформатирован, без обложки.
Как или кто это сделает? ;-)
Re: Обработка дублей.
это под каждому из пользователей =)
надо просто нажать: исправить и объединить с другой книгой
Re: Обработка дублей.
Т.е. беру неправильную книгу, исправляю и объединяю с правильной? неправильная удалится?
И в чём отличие от просто "удалить"?
Страницы