Создатель хранилища научных статей ArXiv.org покинул проект

o_848553

Создатель крупнейшего бесплатного интернет-хранилища научных статей физик Пол Гинспарг (Paul Ginsparg), автор известного всем физикам, математикам и астрономам сервера ArXiv, после 20 лет руководства проектом покидает его и передает права администрирования сотрудникам Корнеллского университета.

В августе 1991 года Гинспарг, незадолго до того перешедший на работу в Национальную лабораторию в Лос-Аламосе и впервые получивший в свое распоряжение персональный компьютер, запустил электронную доску объявлений. Целью было облегчить и упростить для коллег обмен и обсуждение препринтов — научных статей, еще не принятых к публикации.

«Сейчас сложно представить, сколько времени и сил приходилось тратить на печать, копирование и рассылку препринтов друзьям и коллегам перед публикацией в журналах», — пишет Гинспарг в статье, опубликованной в Nature.

Первая статья была загружена в электронное хранилище 14 августа 1991 года. Уже через два года arXiv.org стал главным ресурсом для исследователей. Спустя 20 лет в нем накопилось чуть менее 700 тысяч статей, и для большинства физиков, астрономов, математиков, для многих биологов и экономистов он стал незаменимым инструментом для работы.

Гинспарг отмечает, что его проект появился незадолго до массового распространения интернета — первый веб-сайт был запущен в ЦЕРНе всего за несколько дней до того — 6 августа 1991 года. При этом ArXiv «вышел в сеть» задолго до того, как в интернете появились первые сайты «обычных» научных журналов.

Первоначально Гинспарг предполагал, что он будет получать примерно по 100 препринтов в год, которые будут храниться в репозитории примерно три месяца — до того, как они будут приняты к печати и начнут распространяться по традиционным каналам. Однако по многочисленным просьбам коллег статьи удалять не стали.

Сейчас на сервер загружается по 75 тысяч статей в год, а скачивается — более миллиона. Общее число препринтов, по данным на 3 августа, составило 694 тысячи. Больше всего приходится на долю физики высоких энергий (более 150 тысяч), примерно по 125 тысяч статей по математике и по физике твердого тела, на четвертом месте — астрофизика (123 тысячи статей). По 20-30 тысяч статей приходится на долю ИТ-тематики, квантовой и ядерной физики. Меньше всего статей по количественным финансам — 1,5 тысячи.

«Это воодушевляет — 20 лет спустя видеть стабильно и успешно работающий ArXiv, который служит сообществу примерно в тысячу раз большему, чем ожидалось», — говорит Гинспарг.

Сейчас проект курирует библиотека Корнеллского университета. Входной контроль статей обеспечивают студенты-волонтеры. Деньги на работу хранилища выделяют около 123 научных организаций из 11 стран — те, чьи сотрудники обеспечивают наибольшую нагрузку на сервер. К концу 2010 года сервис получил от них 360 тысяч долларов, а в 2011 — уже 324 тысячи долларов от 114 институтов.

Двадцать лет назад Гинспарг полагал, что его работа в проекте займет совсем немного времени

— сам сервис был полностью автоматизирован и не будет для него «пожизненным приговором». Однако повседневная деятельность по администрированию ресурса пожирала все больше времени, проект требовал внимания каждый день, без выходных и праздников.

«С сентября управление сайтом полностью переходит в руки сотрудников библиотеки Корнеллского университета в город Итака, штат Нью-Йорк», — объявляет Гинспарг.

По его словам, он сам останется в наблюдательном совете проекта, а также будет заниматься исследовательскими проектами в сфере автоматизированного поиска и обработки данных, создания новых форматов документов и фильтров информации.

По мнению автора проекта, за 20 лет в научном мире произошли революционные изменения в системе обмена информацией, и теперь огромные массивы научных данных и литературы доступны в интернете. Однако Гинспарг с разочарованием отмечает, что научные издания в целом по-прежнему находятся на перепутье.

«Нет согласия о том, как наилучшим образом обеспечить контроль качества (научных исследований), как финансировать их, как собирать воедино данные… Я надеюсь, что использование электронной инфраструктуры в конечном счете полностью изменит способы обработки и организации научных данных», — отмечает он.

Хранилище препринтов стало незаменимым инструментом для многих ученых.

До сих пор от отправки статьи в научный журнал до ее принятия к печати и до самой публикации проходят многие месяцы, в частности из-за того, что много времени требует процедура рецензирования (оценки текста независимыми экспертами).

Кроме того, доступ к подавляющему большинству журнальных публикаций — только по подписке, которая обходится весьма недешево.

С появлением архива временной интервал между подготовкой статьи и возможностью показать ее коллегам по всему миру исчез.

«У меня каждый день начинается с чтения АrXiv’a, — говорит астрофизик Сергей Попов из Астрономического института имени Штернберга. — Это в первую очередь источник свежей информации, позволяющий следить за своей (и не только) областью. Если с ним что-то случится, сразу же появится замена, так как без такого портала жить сложно».

«Проект важен, так как именно там можно бесплатно почитать свежие статьи — для России это важно», — отмечает астроном Леонид Еленин из Института прикладной математики имени Келдыша.

Он напоминает, что стоимость доступа к полному тексту одной статьи на сайте престижного журнала может составлять около 30 долларов. Учитывая не слишком высокие доходы российских ученых, архив для многих из них является единственной возможность оставаться в курсе последних достижений в своей области.

Читайте также: