(Максим Мошков, пожалуй, в представлении не нуждается. По крайней мере, я не буду этого делать. Однако всем рекомендую сначала ознакомиться с интервью "Разговор с Максимом Мошковым" (Дата: сентябрь 2001, автор Сергей Серегин). Этот материал послужил мне отправной точкой для составления вопросов и его прочтение было бы полезно читателям. (Еще несколько интервью лежит по адресу: http://lib.ru/AWARDS/ (прим. Максима Мошкова)).
Максим, данное интервью я хотел бы ограничить обсуждением Библиотеки Максима Мошкова - и обойти стороной "Самиздат". На мой взгляд, СИ - очень обширная тематика, вопросов - много; лучше по этому поводу поговорить отдельно. К тому же, я надеюсь, что вопросы читателей помогут понять наиболее острые проблемы "Самиздата". Вы не возражаете?
Давайте начнем со статистики: сколько людей (хостов: уникальных IP-адресов, с которых запрашивались страницы сайта) выходит на библиотеку Мошкова? В библиотеке приведены следующие данные: Visitors: 1994 Dec:18, 1995 Oct:750, 930, 1300, 1996: 1500, 1900, 2600, 2900, 3300, 4100, 5200, 5200, 6000, 7000, 11000, 6500, 1997:10800, 10300, 6000, 6000, 6500, 6100, 4000, 4000, 4000, 6200, 8800,12600 1998: 14000, 11200, 13900,, 7700, 18000,,, 29500, 32500. С 1 по 31 августа 2002 года статистикой зафиксировано 247,000 уникальных хостов.
А сколько, допустим, с 1 ноября по 30 ноября? И сколько читателей выходят именно на библиотеку, сколько отдельно на Самиздат, Музыка, Заграницей? Разумеется, это всегда можно узнать на top.list.ru - но хотелось бы эти цифры услышать от вас.
Сейчас в месяц на lib.ru приходит 400,000 uniq-hosts, на "Самиздат" - тысяч 60-80, "Заграницу" - тысячи 3-6, "Музыкальный хостинг" - тысяч 10-30 - не помню точно.
Лучше пойти в топ.лист и срисовать число посетителей за месяц.
В таком случае, воспользуемся статистикой Rambler's Top100 (для примера на 20.12.2002): "Библиотека Мошкова LibRu:ДЕТЕКТИВ,ФАНТАСТИКА,ПРОЗА: Уникальных адресов посетителей (хостов): Сегодня 2 642; Вчера 17 033; За 7 дней 116 394; За 30 дней 502 047 Всего 11 631 135"
На основе приведенной статистики: как вы оцениваете посещаемость библиотеки в общей структуре Рунета? Допустим, Яндекс, некоторые информационные порталы - более посещаемы. А библиотека на каком месте?
По посещаемости среди всех ресурсов библиотека входит в первую полусотню, но не входит в первые 20. Поскольку это - не новости, не юмор, не порнуха, не почтовый сервер, не поисковик, а ресурс литературной тематики, то для него - посещаемость вполне приличная. Хотя, могла бы быть и побольше.
Количество посетителей библиотеки постоянно растет?
Растет. Но не так быстро, как общий рост числа пользователей Рунета. В Рунете сейчас порядка 4 млн. регулярных пользователей, в библиотеку из них заходит всего 10%.
А количество книг в библиотеке увеличивается? Если да, то насколько: есть ли темпы роста?
Уже года два-три темп прироста книг стабилизировался и не изменяется. Оценить его можно, просмотрев http://lib.ru/What-s-new и предыдущие списки новинок. Я уперся в потолок - выкладываю ровно столько, сколько успеваю выложить. Присылают - больше, и мой "долг" - архив неразобранных посылок постепенно растет. (Сейчас в нем около 2000 писем лежит - около 900Мб в архиве). За лето удалось слегка подсократить завал неразобранных книг, (я написал конвертор для вордовых файлов, и это повысило мою производительность), но и только.
А количество посетителей библиотеки возрастает линейно или функцией y=x2?
Пожалуй, рост объема библиотеки и количества посетителей - линеен.
Были ли у библиотеки очевидные спады в количестве читателей? Если да, то могли бы вы объяснить причины?
Провал в посещаемости был, когда сервер заваливался и не мог обслужить всех посетителей. В 2000 году я купил выделенную машину, с тех пор особых провалов не допускаю. Естественно, летом начинается мертвый сезон - посещаемость уменьшается процентов на 10.
О КОНКУРЕНЦИИ
Почему вы назвали библиотеку именно "Библиотека Максима Мошкова", а не допустим "Общая библиотека Интернета" или "Коллективная библиотека единомышленников"? Наименование "Библиотека Мошкова" получилось исторически или вы сознательно хотели оставить свою фамилию в названии?
Первоначальное (1994 год) название у нее было "Моя библиотека". После того, как я несколько раз наткнулся на ссылку на нее в виде "Моя библиотека" на чужих страницах, я понял, что надо что-то делать, и переименовал в "Библиотеку Мошкова". После того, как я купил для нее домен lib.ru, я стараюсь поддерживать название "Lib.ru: Библиотека Мошкова". Вряд ли его потребуется менять, я довольно консервативен.
Имеете ли вы конкурентов: похожие библиотеки по размерам, посещаемости, известности? На главной странице Библиотеки Максима Мошкова написано: "Самая известная в Рунете электронная www-библиотека". А какие существуют более крупные? Более посещаемые? Кто в первых рядах за вами или перед вами? И какая библиотека вторая по известности?
На поле бесплатной раздачи информации (точнее - не бесплатной, а за мой счет), хотелось бы иметь побольше "конкурентов". Чтоб не одному стоять в поле.
Моя коллекция НЕ является: самой большой (подборки на компактах - больше раза в два-три), самой старой (файловые архивы с литературными произведениями на русском языке возникли за несколько лет до того, как я появился в Интернете), самой удобной (тот же "Самиздат" - на порядок толковее продуман и организован).
С чем не буду спорить, так с тем, что она - самая посещаемая, и, видимо, самая известная.
А вообще, электронных библиотек - полон интернет. Десятки - размером ничуть не меньше моей. Сейчас глянул в Топ-лист: на втором месте - Bestlibrary Алексея Кузьмина. Тоже очень капитальный ресурс, только тематическая направленность слегка другая: я упираю на классическую и серьезную, а он - на развлекательную литературу. Остальные - легко найдете в разделе литература Рамблера, Топ-листа, или тут http://lib.ru/litarhiwy.dir.
Сейчас Интернет стремительно развивается и конкуренция между сайтами растет. Если, допустим, солидная фирма, которой нужна реклама в Рунете, скачает всю библиотеку Мошкова, активно займется сканированием актуальных книг и размещением их на своем сайте.... Смогут ли они отодвинуть на задний план библиотеку Мошкова? Такие попытки наблюдались?
Не вопрос. Запросто. Просто надо слегка вложиться материально, тогда подвинуть
одиночку будет легко. Я прикидывал, во сколько обойдется подобное удовольствие: 100-200 тысяч долларов и пара лет работы. Объемы совершенно не запредельные.
Почему именно "100-200 тысяч долларов и пара лет работы"? В интервью с С. Серегиным вы сказали: "Для того, чтобы сделать свою интернет-библиотеку, достаточно пойти на рынок, купить пару-тройку компакт-дисков с электронными книжками, свалить все на винчестер, приписать к этому какой-нибудь скрипт, и все. Библиотека готова. В общем, двести рублей на покупку дисков и неделька на программирование - не такие уж большие затраты".
На что уйдут основные деньги для "обгона" вашей библиотеки: на сканирование книг, их конвертирование, разработку собственной концепции или просто для рекламной раскрутки сайта в Интернете?
Просто библиотеку, из уже имеющихся файлов и коллекций скомпилировать - дело не очень сложное. Но ведь речь пошла об "догнать и перегнать". А для того, чтобы сейчас раскрутить свой интернет-ресурс - нужно время и активнейшая квалифицированная работа интернет-промоутеров, программиста, системного администратора, сканировщиков, редакторов, литобозревателей, постановщика задач. И деньги платить придется либо специалистам, либо закупать рекламу у других интернет-площадок - а удовольствие это дорогое.
Взрывного спроса на библиотеки - не ожидается (это вам не пожар Останкинской вышки и не "Норд-Ост", на которых, было дело, выскочили в первые ряды несколько свежезапущенных интернет-ресурсов), а раз так - то нужна долгая упорная работа, эта новая библиотека должна существенно отличаться по содержанию и удобству от остальных, и т.д. В итоге и получаем - год-два работы, 5-10 сотрудников, зарплата, соцстрахование, накладные расходы, аренда, помещение, оборудование, хостинг, оплата трафика, налоги...
В оптимистичном варианте - 5000$ в месяц, в пессимистичном - насколько хватит расточительной фантазии у менеджеров проекта. Можно и миллион потратить.
И все-таки, как вы думаете, что сможет этому "обгону" помешать? Какие есть уникальные плюсы у вашей библиотеки: известность сайта, привычка читателей ходить на lib.ru, оперативность ресурса, задействованность во многих интернет-структурах или что-то еще?
Помешать этому может только одно - не видно, какой смысл в трате таких денег. И как от этого получить отдачу. Если найдется бизнес-решение, позволяющее сделать затею прибыльной - никаких патриотических причин цепляться за lib.ru у читателей не будет. Побеждает удобство и объем предоставляемых услуг, и здесь я один с серьезной конторой тягаться не берусь.
И последний вопрос на эту тему: есть ли какие-то проекты по слиянию библиотек? Ваше отношение к этому?
Слияние библиотек в организационном смысле - занятие бесперспективное. Каждая из них - строится индивидуалами, под свой личный взгляд на вещи. Для организационного слияния просто нет объективных предпосылок. Зачем становиться кому-то в подчинение, или самому начинать командовать кем-то, когда и своих проблем хватает?
Что до слияния фондов (накопленных оцифрованных текстов), то оно и так происходит посредством "круговорота файлов в Интернете". Естественно, завязываются знакомства, возникает кооперация, информационный и текстовый обмен между библиотеками.
ВЗГЛЯД ИЗНУТРИ
Поговорим о принципах построения библиотеки: большинство поступлений - новые книги или известные литературные сочинения? Может быть, ситуация постоянно меняется?
Все поступления - это книги, присланные в библиотеку читателями (их отсканировавшими) и авторами (их написавшими). Новые, старые - всякие. Статистически, видимо, это как-то можно выразить, но, по моим ощущениям, есть место всем жанрам, всем направлениям.
Когда-то давно - не было почти ничего, кроме фантастики. Но сейчас ситуация выровнялась, серьезные жанры гораздо лучше представлены в общем потоке новых поступлений. Пополнение идет стихийно, поэтому и имеем - среднестихийный подбор новинок.
Есть ли критерии, по которым вы определяете, будет присланная вам оцифрованная книга занесена в библиотеку? Вы книгу просматриваете или доверяете человеку, передавшему вам оцифрованный текст?
Если книги публиковались на бумаге - стараюсь их брать. Если не публиковались - стараюсь перенаправлять авторов в "Самиздат". Естественно, бывают случаи, нарушающий этот принцип и в ту и в другую сторону, но ведь мы об общей тенденции говорим. Самые яркие книжки, получившие высокие оценки и посещаемость в "Самиздате", я копирую в библиотеку, а издававшиеся авторы довольно часто заводят себе раздел в "Самиздате", поскольку там можно управлять своими текстами оперативно, не тратя время на ожидание, когда я разберусь с их посылками (не забудьте про 2000 неотвеченных писем...)
Если, допустим, вам предложат оцифрованный текст работы "Как вырастить свинью в домашних условиях?" - в какую рубрику вы этот труд положите?
Скорее всего, спроважу в "Самиздат". Хотя - зависит от настроения. Могу поставить в http://lib.ru/NTL/ (Наука и техника) или http://lib.ru/NATUR/ (Природоведение).
Или, например, вам посылают книги по психологии, орнитологии, нейрофизиологии неизвестных авторов. Вы просто их размещаете и все - ведь не смотрите же содержание? Или как? Может быть, у вас есть свои эксперты?
Если удается легко определить, куда ее класть - кладу. А если в несколько минут не
удается, книжка попадает в долгий ящик отложенных, а там уже - как фишка ляжет.
Когда я пользовался библиотекой, то часто замечал новые ссылки на совсем свежие интернет-ресурсы. Вы успеваете еще и оставлять линки на ресурсы - или это делает какая-то программа?
Ссылки ставлю сам. Иногда их читатели подкидывают, иногда - сам натыкаюсь. Довольно часто мне присылают книжки из других библиотек и тематических сайтов. В таких случаях я линкую эти сайты в соответствующий раздел, чтобы мои посетители смогли получить по этой теме дополнительную информацию. (Узкие специалисты всегда больше знают про свой предмет, чем широкие...)
Раз уж речь о программировании: как вы закачиваете в библиотеку новые тексты? Насколько этот процесс можно автоматизировать?
Все присланные тексты конвертируются к моему единому формату. Если подходящего конвертора еще нет, я комбинирую имеющиеся или пишу новый.
А отформатированные - раскладываю по каталогам обычным текстовым редактором Emacs. Html-верстку сайта обеспечивает цги-скрипт на перл, который был написан в 95-году и с тех пор неоднократно (но незначительно) модифицировался.
Возможно ли организовать поиск в Интернете отсканированных текстов с ресурсов открытого доступа и последующую их закачку в библиотеку автоматически?
Совсем автоматически, видимо, невозможно. Но организовать хотя бы полуавтоматическую систему - надо бы. Хотелось бы. Не знаю, хватит ли сил и ресурсов. Скорее всего - не хватит, но стремиться буду.
При прочтении отсканированных текстов часто возникают проблемы - иногда в текст вставляются лишние символы или его трудно форматировать. Кто-то пишет макросы для избавления от типичных "загрязнений текста" или делает программы по принудительной проверки грамотности (на автомате). Есть ли у вас какие-то средства для "прически" текстов или какие-то рекомендации читателям? Может быть, дадите ссылку на интернет-ресурсы, где эта проблема обсуждается?
Я в состоянии "чистить" только формат представления текстов. Ошибки распознавания ловить не научился. Но ребята, систематически занимающиеся OCR'ом - волей-неволей вынуждены писать для себя подобные скрипты. Следы этих работ можно обнаружить по адресу: http://lib.ru/COMPULIB/ (по крайней мере, некоторое количество ссылок по теме).
Вы - программист, автор книг по программированию. Насколько свои знания вы используете, чтобы автоматизировать работу в библиотеке Максима Мошкова?
Я написал около пятидесяти конверторов-чистильщиков для библиотечных файлов. Но есть и другой путь: Самиздат. Это - большое подспорье в работе. Темп поступлений туда превышает темпы пополнения библиотеки. Т.е., это как раз и было реализацией моей мечты - поменьше работать, переложив заботу о текстах на плечи самих авторов.
Может, вы написали специальный софт, чтобы сразу просматривать несколько форумов? Или, например, так: в каком-то форуме упоминают вашу фамилию.... А у вас - программка, вам ссылочка идет: посмотри, мол, Максим, что там о тебе говорят?
Отсматривать форумы - уже не моя забота. Я почти не брожу по интернету. Опыт показывает, что если слишком сильно поминают мою фамилию, значит, кто-нибудь рано или поздно поделится со мной ссылкой. А если не поделились, то, видимо, не очень-то и нужно мне было об этом обсуждении знать. Есть замечательная вещь - заменитель всех форумов, чатов, ICQ и т.п. - обычная электронная почта. Все в одном месте, ничего не упустишь из виду.
А если серьезно, насколько можно упростить работу в сети программным путем? Как вы это для себя решаете, и, в первую очередь, применительно к библиотеке?
Способ я знаю только один - использовать энергию масс. Вместо того, чтобы самому делать всю работу, надо дать возможность участвовать в этом другим. В части сопровождения библиотеки такое направление - наиболее естественное и разумное.
Я - один, а посетителей - много. Если каждый потрудится совсем чуть-чуть, результат получится на порядок выше, чем если бы я вкалывал один до потери пульса. Поэтому я постепенно перевожу разделы библиотеки на самообслуживание. Три ресурса уже созданы, на очереди - туристический раздел и раздел аудио-книг.
Таким образом, в перспективе вы хотите всю библиотеку перевести на принципы "Самиздата"? Или какая-то часть все же останется за Максимом Мошковым?
Сейчас новые тексты присылают мне по е-майл, а размещаю их в библиотеке (рубрицирую, выбираю раздел, тематику), чищу-конвертирую - я. В Самиздате каждый автор сам в состоянии разместить свои произведения в своем разделе - для этого ему достаточно заполнить соответствующие формы для добавления текста.
Хочется и в библиотеке предусмотреть автоматизированный интерфейс для добавления и рубрикации произведений - чтоб их могли добавлять читатели (или - проверенные временем помощники).
О КОМПАКТ-ДИСКАХ
Месяца три назад я узнал, что вышла "Библиотека Мошкова" на трех CD. О ней я читал и на "Трибуна люду". Вы знаете об этом выпуске, участвовали как-то в проекте? Или ваша позиция со времен разговора с Сергеем Серегиным не изменилась?
Я не одобряю выпуска библиотеки на CD, и с тех пор своего мнения не изменил.
В "Библиотеке в кармане, выпуск 15" - в разделе "Благодарности" Максим Мошков стоит первым. Также в разделе "Где еще можно найти тексты?" указано два адреса: www.lib.ru и www.bestlibrary.ru. Хоть мы уже прошли вопрос о конкурентах - но это что, ваш главный конкурент?
Bestlibrary - вторая из библиотек по посещаемости. Назвать ее конкурентом - рука не поднимается, мы знакомы и дружим уже года четыре. Конкуренция возникает, когда есть что делить. А сейчас - делить нечего, поле деятельности настолько обширное, что на нем поместились бы еще 1000 таких же "конкурентов". И я был бы этому только рад: система библиотек является жизнеспособной, когда потеря одного ресурса не выводит из доступа значительные эксклюзивные объемы информации.
Вышеприведенные ссылки в "Библиотеке в кармане" - благодарность за то, что организаторы черпают тексты из www.lib.ru?
Черпают. Но и я ведь порой черпаю из той же "Библиотеки в кармане", если мне хочется выложить какой-то текст, и из той же Bestlibrary. Повторюсь: идет круговорот книг, в котором заинтересованы и другие библиотеки, и я, и наши посетители.
Выпуск CD с текстами книжек, по вашему мнению, сокращает посещаемость библиотеки Максима Мошкова?
Возможно. Только ведь в библиотеке новинки - каждый день, а на сидюке - новинок не будет. Ну и сама по себе посещаемость - это трафик. А трафик - это нагрузка на сервер, который не резиновый.
ВЗГЛЯД СО СТОРОНЫ
В одном справочнике "Интернет-ресурсы" я прочел приблизительно следующее: "Вот, вы ходите в магазины и покупаете новые книги за бешеные деньги. Советую сначала посетить библиотеку Мошкова - более половины новых поступлений вы можете скачать там, при этом - совершенно бесплатно". Как вы прокомментируете подобное заявление?
Книжка, скаченная из Интернета, обходится читателю в три раза дороже купленной в магазине. Пока что с этим фактом не поспоришь. Поэтому в электронных библиотеках ищут, в первую очередь, то, что невозможно найти на бумаге.
Про студентов, которые пользуются халявным Интернетом, я не говорю. Но ведь скачать файл - это одно, а прочитать его - совсем другое. Прочесть книгу целиком с экрана монитора - в состоянии едва ли 5%, у остальных просто не выдерживают глаза.
Почему же тогда 10% пользователей Рунета заходит на библиотеку Мошкова?
Больше половины этих посетителей - жители зарубежья, у которых нет никакой возможности купить интересующую их книгу в магазине. Не продают русскую литературу в австралийских и американских супермаркетах. А если и продают - то не более сотни модных наименований, и недавно изданных. Все остальное - недоступно, и существует, фактически, только в электронной форме.
Таким образом, кто живет за границей, не всегда могут достать книжки, которые хочется иметь. Подвернется случай, и они все равно книжку купят, но пока не подвернулся, можно пользоваться электронным вариантом. То же касается и жителей России - бОльшую часть книг, которые они находят в библиотеке, в магазинах купить невозможно. "Out of print".
Свобода слова в нашей стране всегда была понятием относительным. В связи с этим: вы публикуете в библиотеке материалы политического характера?
Случается.
Не боитесь, что в библиотеке окажутся работы, которые в будущем смогут стать основанием для закрытия библиотеки или организацией политического процесса?
Анекдот про Неуловимого Джо1помните? Нет, не боюсь.
Что до процессов, то процессы на пустом месте не возникают, и чтоб их организовать, требуется желание их проводить с обеих сторон. А я к процессам не стремлюсь.
В общем-то, примеры есть: Лимонов, Сорокин.
Ой, ну и примеры. У людей свой бизнес, они им с увлечением занимаются. В общем, с этой стороны за библиотеку бояться не стоит. Если вопрос и возникнет (а он не возникнет), то мы его решим по келейному.
И все-таки, мне кажется, что политические страсти не минуют библиотеку и СИ. Какова ваша позиция по данному вопросу?
Чтобы любителям спорить по политическим вопросам в Самиздате было удобнее находить друг друга, самиздатовский движок все политические споры подверстывает в отдельную ленту. Правда, я сам туда редко заглядываю, поэтому не в курсе, кто там с кем "дружит" и "борется". Но если кого-то интересует политика, то Самиздат и тут поможет.
А для неполитических направлений - тоже предостаточно места (и они пользуются бОльшим интересом). А вообще - я за интернационализм и дружбу между народами.
Ходит много разговоров о подконтрольности или неподконтрольности Интернета, допустим, ФСБ или ЦРУ? Насколько, как вы думаете, государство способно вмешиваться в интернет-деятельность отдельных лиц?
Специалисты, способные действительно вести контроль за чьей либо деятельностью в Интернете, у нашего государства есть. Но не так много, как хотелось бы государству.
Поэтому, если они кем-то и занимаются, то отнюдь не безобидными русписами и пикейными жилетами, убивающими время на интернет-споры. Способы прихлопнуть любой сайт, в принципе, существуют, и они - вполне технологичны. Но не настолько технологичны, чтобы ими можно было размахивать направо и налево.
И НАПОСЛЕДОК
Кто работает по поддержанию библиотеки еще, кроме вас? Есть хоть кто-то, кто вам помогает: частично, время от времени, по отдельным вопросам?
Непосредственно библиотекой занимаюсь я один. А вот поставками текстов для нее (т.е. тем, без чего она не могла бы существовать) занимаются сотни и тысячи людей. Причем, некоторые - очень активно. Есть энтузиасты, отсканировавшие сотни мегабайтов.
Планируете ли вы создавать какой-то штат, принимать меры по резкому увеличению объема библиотеки? Или вы действуете по принципу "И один в поле - воин"?
Штата - не планирую, но механика, отлаживаемая на "Самиздате", рано или поздно будет применена и для автоматизации библиотеки.
В таком случае, как вы все успеваете?!
А я ничего не успеваю. Всем все должен, и по работе, и по библиотеке, и вообще...
Каковы дальнейшие планы по развитию библиотеки? Что стоит читателям ожидать в ближайшем будущем?
Уже полгода обещаюсь зарядить прокси-акселератор. Это снимет проблемы с загруженностью сервера, он станет легче откликаться и не будет вешаться в час пик.
Ну и, конечно, новых книг будет некоторое количество.