arXiv.org — Википедия

arXiv
Изображение логотипа
URL arxiv.org
Коммерческий нет
Тип сайта наука
Язык (-и) английский
Владелец Корнеллский университет
Создатель Пол Гинспарг
Начало работы 14 августа 1991; 33 года назад (1991-08-14)
Страна
Логотип Викисклада Медиафайлы на Викискладе

arXiv.org (произносится [архи́в], X читается как греческая буква «Хи») — электронный архив с открытым доступом для научных статей и препринтов по физике, математике, астрономии, информатике, биологии, электротехнике, статистике, финансовой математике и экономике. Перед публикацией статьи не рецензируются, однако проходят первичную проверку модераторов[1].

Портал был создан физиком Полом Гинспаргом в 1991 году и был назван xxx.lanl.gov, где LANL являлось сокращением от Лос-Аламосской национальной лаборатории, в которой исследователь в то время работал. В 1998 году сайт был переименован в arXiv.org. Когда в 2001-м Гинспарг перешёл работать на факультет физики Корнеллского университета и перевёз серверы с собой, местная университетская библиотека взяла на себя обязательства по администрированию и финансированию arXiv[2].

Создание arXiv оказало существенное влияние на развитие движения за открытый доступ и формирование системы препринтов как основного способа обмена научными данными в таких областях, как астрономия, астрофизика, ядерная физика и физика элементарных частиц[3]. В arXiv часто публикуются работы, оказывающие существенное влияние на развитие науки, — примером может служить решение проблемы Пуанкаре математиком Григорием Перельманом[4]. По прообразу архива были созданы и другие онлайн-репозитории научных работ, включая SSRN[5], ChemRxiv[англ.], SocArXiv[6].

Согласно данным портала, по состоянию на май 2022 года на сайт arXiv.org было загружено более двух миллионов работ[7].

Примерно с середины XX века в научном сообществе появилась неформальная практика обмена препринтами — ещё не опубликованными отчётами об экспериментах или черновыми версиями статей. Главной причиной этому послужил слишком долгий процесс публикации в журналах, который мог достигать несколько лет с момента подачи работы. При этом в отдельных отраслях науки обмен результатами новейших исследований представлял для учёных критическую важность ввиду опасности дублирования данных[8], поэтому всё больше исследователей делились своими препринтами с коллегами одновременно с подачей статьи в журнал[9]. Помимо этого, подобная система коммуникации позволяла закреплять первенство открытия — для этого научные работники отправляли результаты успешных экспериментов по почте в другие исследовательские центры, а также отдельно подписавшимся на рассылку учёным. Распространение препринтов позволяло получить комментарии от коллег перед отправкой на рецензию в журнал, а в некоторых случаях исследователи делились результатами экспериментов со статистически незначимыми результатами, которые всё равно представляли научную ценность[8][10][11][12].

В 1970—1980-е годы наибо́льшую роль в распространении препринтов сыграли учёные, работающие в области физики высоких энергий, — этому способствовало создание Европейской организации по ядерным исследованиям в 1954 году, а также характерные для этой отрасли большие массивы данных и скорость их создания[13]. В 1967 году в Стэнфордском университете началась работа над созданием компьютерной базы данных, которая смогла бы обрабатывать неограниченное количество библиографических записей. Для тестирования был использован каталог препринтов, собираемый Национальной ускорительной лабораторией SLAC. На его основе была создана SPIRES (впоследствии переименованная в Stanford Public Information Retrieval System) — база данных работ в области физики высоких энергий, содержащая библиографические данные о получаемых лабораторией препринтах[14].

Сложившаяся система рассылки препринтов позволяла авторам предотвращать ненужное дублирование исследований и при этом продвигаться вверх по карьерной лестнице, поскольку распространяемые отчёты впоследствии публиковались в рецензируемых журналах[12]. При этом бумажные препринты по-прежнему обладали рядом существенных недостатков, главным из которых было ограниченное распространение — только определённые научные учреждения были включены в рассылку, в то время как большинство учреждений в развивающихся странах были исключены из обмена. Одновременно с этим препринты по-прежнему не решали все споры о приоритете в открытиях[8][10][11].

Создатель портала Пол Гинспарг в 2006 году

Период конца 1980-х годов характеризовался массовым распространением компьютеров и новых способов электронной коммуникации. На замену рассылки бумажных версий препринтов пришла новая система — аннотации отчётов посылались физикам по электронной почте, после чего исследователи искали интересующую их статью в базе данных SPIRES и самостоятельно запрашивали копию у авторов. Работы обычно высылались по почте, и могло пройти до нескольких месяцев прежде чем запрашиваемый препринт попадал в руки получателя. Для решения этой проблемы исследователи начали использовать систему компьютерной вёрстки TeX, позволяющую легко работать с математическими формулами и генерировать электронные документы, что привело к переходу от пересылки бумажных препринтов к распространению файлов по e-mail[14].

К 1990 году исследовательница в области теории струн Джоан Кон из Принстонского Института перспективных исследований начала распространять электронные препринты по физике через электронный список рассылок, насчитывавший около ста человек. Кон и другой физик из Лос-Аламосской национальной лаборатории в Нью-Мексико Пол Гинспарг вместе посещали семинар по теории струн в Центре теоретической физики Аспена[англ.][1] летом 1991 года. Во время семинара Гинспарг услышал жалобы других коллег о быстрой заполняемости дискового хранилища из-за слишком большого количества присылаемых через рассылку препринтов (по 40—100 страниц) и понял необходимость централизации и систематизации системы обмена[9][15][16][11].

В этом же году Гинспарг создал репозиторий препринтов xxx.lanl.gov. Изначально сервис функционировал как электронная доска объявлений, рассчитанный на размещение примерно 100 заявок в год от исследователей, работающих в сфере физики элементарных частиц высоких энергий[17][10]. Работы передавались по протоколу FTP. LANL являлось сокращением от Лос-Аламосской национальной лаборатории, в которой Гинспарг на тот момент работал[18]. Только в течение первого полугодия с момента существования к серверу присоединилось более 400 пользователей[19][13].

Сервис появился как способ автоматизации уже существующих практик по обмену препринтами[20]. Гинспарг написал программное обеспечение, позволяющее загружать работы на центральный сервер, осуществлять поиск и скачивать документы. Доступ к хранилищу выполнялся через электронную почту. Физики могли подавать собственные препринты или сканировать уже имеющиеся в системе файлы, а также читать аннотации к работам и впоследствии запрашивать полный текст. Также была внедрена возможность подписки на обновления в выбранных категориях, просмотр названий и аннотаций новых работ. Несмотря на то, что xxx.lanl.gov был изначально создан для организации ранее бессистемной и хаотичной системы распространения препринтов, вскоре портал стал основной площадкой для обмена мнениями и дискуссиями о текущих исследованиях в области физики. Согласно Гинспаргу, популярность сайта частично объяснялась отсутствием инициативы со стороны научных журналов по переходу к онлайн-форматам — xxx.lanl.gov появился задолго до первых сайтов академических изданий[21][16]. С появлением всемирной паутины портал стал известен по URL-адресу xxx.lanl.gov[10]. Создание подобной системы стало возможно благодаря распространению недорогих дисковых накопителей — чтобы хранить статью среднего размера, требовалось всего 50 килобайт пространства. Гигабайтный диск в то время вмещал около 20 000 статей, средняя стоимость хранения статьи составляла 10 центов[9].

Спустя полтора года после создания на портале зарегистрировалось 2000 пользователей. В феврале 1992 года были добавлены восемь других разделов физики: от экспериментальной ядерной физики до нелинейной динамики и материаловедения. Уже в 1993 году на хранилище было подписано больше 8000 человек, ежемесячное количество новых препринтов составляло 600[9]. В 2003 году на портал был добавлен раздел биологии[22][23].

В 1997 году в результате совместного сотрудничества портала с Астрофизической информационной системы НАСА (ADS) был создан индекс электронных печатных изданий по астрофизике, делающий их доступными через службу рефератов ADS[19].

В конце 1998 года Гинспарг переименовал xxx.lanl.gov в arXiv[19] — к этому моменту портал в общей сложности обработал около 500 000 заявок[24] и рассматривался большинством учёных-физиков как основное место для обмена новейшими результатами исследований[9].

В 2001 году Гинспарг перешёл работать на факультет физики Корнеллского университета и перевёз серверы arXiv’а с собой, а в 2011 году он полностью передал права на администрирование arXiv’а университетской библиотеке[2]. Исследователь остался в научно-консультативном совете, а также продолжил принимать участие в проектах по обработке данных и автоматизированному поиску для улучшения работы хранилища[21] и консультировать по вопросам политики в отношении контента[15]. В 2002 году за создание arXiv Гинспарг стал стипендиатом премии Макартура, получив в качестве награды грант в размере $500 000[25].

Финансирование

[править | править код]

До переезда в Корнеллский университет бремя администрирования портала лежало на плечах Лос-Аламосской национальной лаборатории. В 2001 году Библиотека Корнеллского университета взяла на себя расходы по содержанию хранилища и администрирование, чтобы Гинспарг мог больше времени уделять своим исследованиям — будучи физиком-теоретиком, он внёс существенный вклад в квантовую теорию поля, теорию струн, конформную теорию поля и квантовую гравитацию[17]. Помимо своих исследований в области физики, Гинспарг работал с группой цифровых библиотек над усовершенствованием возможностей arXiv[15][18].

В 2021 году на постоянной основе портал поддерживали 123 университета, библиотеки, исследовательских лабораторий и фонда, каждый из которых вносит от $2300 до $4000 в год. По состоянию на 2012-й годовой бюджет библиотеки оценивался в $500 000[15]. В 2014 году прогнозируемые годовые расходы на персонал и серверы составили $885 987 — менее $10 на обработку одной статьи[26]. В 2016 году к 25-летней годовщине arXiv группа учёных и библиотекарей Корнеллского университета предприняла попытку привлечь от 2,5 до 3 миллионов долларов на модернизацию платформы[27]. В 2021-м хранилище поддерживали 240 организаций из 30 стран. Главными спонсорами стали Фонд Саймонса[англ.], Allen Institute for AI[англ.] и Google[28]. Общий годовой бюджет на 2021-й составил $2 423 994, а источниками доходов arXiv являлись спонсорская поддержка, предоставляемая Корнеллским университетом на покрытие всех косвенных затрат (около 37 % от всех операционных затрат), Фонд Саймонса, а также отдельные пожертвования членских организаций и гранты от фондов и агентств[29].

Статистика

[править | править код]

Первая статья была загружена в arXiv 14 августа 1991 года. Спустя двадцать лет портал насчитывал около 700 тысяч статей, среднее количество публикуемых материалов составляло 75 000 в год, а ежегодное количество загрузок — около 1 млн. При этом количество пользователей достигало 400 000[17][30][21][21]. Уже на декабрь 2014 года портал обработал более 10 млн запросов на скачивание[26]. Спустя пять лет, в декабре 2019-го, arXiv насчитывал более 1,6 млн статей. Для сравнения, на других крупных репозиториях SSRN и RePEc числилось 770 000 и 800 000 соответственно[31]. В 2021 году на портал было загружено более 181 тысячи работ, а общее количество загрузок составило 2,3 млрд[28].

Программное обеспечение

[править | править код]

Первоначально arXiv функционировал через интерфейс электронной почты, а в 1992 году был добавлен протокол передачи файлов по сети. В декабре 1993-го arXiv перешёл на веб-интерфейс, а уже спустя год основная коллекция arXiv’а была продублирована на зеркальных сайтах. В 2001 году код приложения arXiv состоял примерно из 30 000 строк Perl, которые работали в системе Linux с использованием других программ, включая TeX, Ghostscript, tar, gzip. Поддержанием деятельности портала и зеркальных сайтов, корректировкой аннотаций и переписыванием модульного кода Perl занималась команда из четырёх человек[18].

В 2012 году было создано приложение для iOS !ArXiv, предоставляющее доступ к репозиторию с мобильного устройства. Через приложение пользователи могут осуществлять поиск по каталогу через ключевые слова или фильтры по заголовкам, автору, аннотациям и цифровому идентификатору[32]. Для смартфонов на системе Android существует приложение ArXiv Mobile[33].

В 2017 году arXiv запустил проект Next Generation (arXiv NG), в рамках которого была осуществлена модернизация технической инфраструктуры. Среди прочего, был осуществлён переход с Perl на микросервисы на Python (Flask). Весь исходный код arXiv NG был выложен в свободном доступе на GitHub по лицензии открытого и свободного программного обеспечения MIT[34][35].

Пользователи могут добавить препринты в arXiv до, одновременно или после публикации в научных журналах[36]. Все работы модерируются администраторами, которые оценивают препринты на предмет их соответствия основным требованиям выбранной дисциплины. В отличие от научных журналов, для публикации на arXiv работы не рецензируются, однако все модераторы обладают высокой квалификацией и следуют принятым рекомендациям по приёму материалов. Выбором модераторов занимаются специально созданные консультативные комитеты, в которых состоят сотрудники библиотеки Корнеллского университета[2]. С 2009 по 2019 год административной деятельностью портала руководила сотрудник библиотеки Ойя Ригер[37][15], которую сменила Элеонора Презани[38].

Подать работы на размещение в хранилище могут только авторы, имеющие академическую аффилиацию, — таким образом модераторы проверяют насколько публикуемые материалы имеют «рецензируемое качество» и удовлетворяют минимальным критериям для размещения в научном журнале[36]. С января 2004 года было введено дополнительное правило, согласно которому все новые авторы перед публикацией должны быть одобрены уже зарегистрированными пользователями[2]. Согласно Гинспаргу, подобная система позволяет гарантировать статус arXiv как платформы для общения профессиональных исследователей[36].

Система подачи работ полностью автоматизирована — алгоритм считывает не только материал, но и индексирует названия, имена авторов, аннотации. Поскольку все статьи arXiv’а разделены на категории и подкатегории, авторы могут самостоятельно указывать один или несколько перекрёстных разделов, к которым относится их работа[2][39]. Во время модерации администратор рассматривает целесообразность размещения статьи в каждый предметный класс перекрёстного списка[2].

В разные годы пользователи и модераторы платформы сталкивались с плагиатом в статьях. Так, в июне 2002 года с физиком-энергетиком Токийского технологического института Ясуши Ватанабе связался Рами Набулси — физик-математик без аффилиации. Набулси попросил Ватанабе разместить его научные статьи в arXiv — он не мог этого сделать самостоятельно из-за отсутствия аффилиации. Ватанабе впечатлили препринты Набулси и он согласился разместить в хранилище 22 статьи. Однако вскоре пользователи портала обнаружили, что статьи Набулси содержат плагиат. После этого препринты были удалены с сайта[40].

В 2007 году около 70 статей 15 авторов из четырёх университетов Турции были удалены с портала из-за обвинений в плагиате. Скандал начался в ноябре 2006 года, когда два аспиранта Салти и Октай Айдогду сдавали устные экзамены для получения степени доктора философии. По словам члена экзаменационной комиссии Озгюра Сариогла, несмотря на список обширных публикаций по гравитационной физике, оба аспиранта не смогли ответить на базовые вопросы по классической механике. По этой причине сотрудники кафедры начали анализировать список публикаций аспирантов и обнаружили плагиат десятков работ с arXiv. Впоследствии Пол Гинспарг начал собственное расследование и обнаружил 67 статей с плагиатом[41][42]. Несмотря на то, что все финальные версии статей были удалены, варианты некоторых черновых статей сохранились на сайте[43]. После инцидента портал ввёл встроенную систему антиплагиата, которая автоматически проверяет загруженные работы[44].

Предлагаемая для публикации статья должна быть подготовлена в одном из принимаемых arXiv форматах[8]. Первое время после создания хранилища пользователей обязывали использовать TeX или LaTex для оформления публикации, поскольку обе программы позволяют создать высококачественный формат PDF и выводить сложные расчётные формулы. arXiv начал принимать статьи в PDF, сгенерированные через другие текстовые процессоры, такие как Microsoft Word[2]. Графические вложения и расчёты могут быть поданы в нескольких форматах — PostScript для рисунков и сюжетов, JPEG для фотографических изображений, PNG и GIF для не фотографических изображений[16].

Скриншот основной страницы сайта arXiv.org, 6 июля 2014 года
Скриншот страницы с аннотацией одной из статей на сайте arXiv.org

Все коллекции arXiv имеют крупные подколлекции, каждой из которых присвоена соответствующая идентификационная категория. Так, в Физике имеются такие подколлекции как Астрофизика , Общая теория относительности и Квантовая космология, Ядерная теория и Квантовая физика. Выбранные подколлекции также включают соответствующие подклассы (Предметные классы). Существует возможность поиска или извлечения записей по одному или нескольким предметным классам[16].Для пользователей доступны подразделы «электронная печать», «авторы», «комментарии», «формат документа» и связанные ссылки — альтернативные платформы, где статьи могли быть также опубликованы. Недавно добавленные препринты распределены между двумя категориями — новые (добавлены в текущий день недели) или недавние (добавлены, обработаны и приняты в течение последних пяти рабочих дней)[16].

Каждый новой работе автоматически присваивают стандартный буквенно-цифровой идентификатор. Изначально он состоял из кода конкретной подколлекции (например, astro-ph), за которым следовала косая черта (/) и семизначное число (например, 0003425). Первые две цифры номера означают последние две цифры года, в котором статья обработана (например, 17 для 2017 ), следующие две — месяц обработки заявки (03 — март), а оставшиеся составляют произвольные инвентарный номер, присвоенный каждой работе для отдельной подколлекции. Когда для работы доступен предметный класс, её аббревиатуру или код ставили после названия кода подколлекции и перед косой чертой (например, math.AT/9910001 или Physics.acc-ph / 9911027)[16]. C 2007 года arXiv стал присваивать всем новым работам идентификаторы следующего вида: arXiv:YYMM.number (arXiv:0706.0001). Изменения были необходимы из-за возросшей популярности портала — новая система увеличила возможное ежемесячное количество генерируемых идентификаторов с 999 до 9999. Также была удалена информация о предметной классификации, что позволило порталу корректировать отдельные статьи и классификации статей по мере необходимости. В январе 2015 года идентификатор изменили на пятизначный (arXiv:0706.00001)[45]. В феврале 2022 года всем новым статьям, отправленным в arXiv, в дополнении к постоянному идентификатору arXiv стали автоматически присваивать цифровой идентификатор объекта[46].

Внесение любых изменений приводит к созданию новой версии, при этом arXiv предоставляет доступ и к предыдущим, даже если текущая версия препринта помечена как «отозванная»[18]. Пользователи могут осуществлять поиск по каталогу как коллекции, так и подколлекции. Помимо этого, доступен поиск по временному показателю (Прошлый год , Все годы, 2000)[16]. На апрель 2021 года arXiv принимал работы по физике, математике, компьютерным наукам, биологической статистике, финансовой математике, статистике, электротехнике, экономике[47][2].

ArXiv не предоставляет библиометрическую информацию, такую как цитируемость, однако интегрирован со многими библиографическими базами данных — SPIRES, NASA ADS и Citebase[48]. Так, SPIRES подсчитывает цитирование препринтов и перенаправляет исследователей на arXiv. Опрос работающих в этой сфере учёных показал, что почти 90 % физиков полагаются на SPIRES и arXiv как отправную точку для поиска нужной литературы[19].

После публикации работы на портале другие пользователи узнают о новой работе либо через систему оповещения по электронной почте (если они подписали на рассылку по теме коллекции или подколлекции), либо через обновление сайта. Автор также может отредактировать статью в ответ на полученные комментарии или обновить препринт после рецензирования и публикации в журнале. Некоторые издатели журналов разрешают подавать документы в виде номера документа arXiv — для доступа к ней рецензенты переходят по ссылке, ведущей на портал[8].

Публикация в arXiv не требует передачи имущественных прав. Однако для распространения материалов через портал необходимо предоставить хранилищу лицензию на распространение статьи и подтвердить, что автор имеет право на предоставление этой лицензии. Для этого работа должна соответствовать одной из следующих лицензий Creative Commons[49][50][51]:

  • CC BY: Creative Commons Attribution — лицензия позволяет пользователям распространять, адаптировать и изменять материал на любом носителе и в любом формате, при указании авторства первоначальной работы. Лицензия разрешает коммерческое использование.
  • CC BY-SA: Creative Commons Attribution-ShareAlike — лицензия позволяет пользователям распространять, адаптировать и развивать материал на любом носителе или в любом формате, при условии указания авторства первоначальной работы. Лицензия разрешает коммерческое использование. При этом полученный вторичным автором результат должен распространяться по идентичной лицензии.
  • CC BY-NC-ND: Creative Commons Attribution-Noncommercial-NoDerivatives — лицензия разрешает вторичным пользователям копировать и распространять материал на любом носителе или формате только в неадаптированной форме, только для некоммерческих целей и только при условии указания авторства на имя создателя.
  • Бессрочная неисключительная лицензия arXiv.org — лицензия дает arXiv ограниченные права на распространение статьи, а также ограничивает повторное использование любого типа другими организациями или частными лицами.
  • CC Zero — позволяет авторам отказаться от имущественных прав и сделать свою работу общественным достоянием. CC0 позволяет вторичным пользователям распространять, адаптировать и развивать материал на любом носителе или в любом формате без каких-либо ограничений.

Открытый доступ

[править | править код]

Создание arXiv в 1991 году считается отправной точкой движения за открытый доступ, продвигающего бесплатный, оперативный, постоянный и полнотекстовый онлайн-доступ к научным публикациям[52]. Благодаря arXiv практики открытого доступа в физике и астрономии стали нормой гораздо раньше других отраслей наук[53]. В 2002 году была выпущена Будапештская инициатива открытого доступа, основанная на результатах проведённой Институтом открытого общества конференции. Инициатива предложила два основных пути достижения ОД — «золотой» и «зелёный». Пример arXiv, сделавший статьи до рецензирования и публикации в журналах такими же востребованными, как и опубликованные, лёг в пример «зелёного» пути или самоархивирования в открытых репозиториях[54][55]. Согласно предложенной стратегии, одновременно с отправкой в журнал исследователи должны размещать свои работы в открытых онлайн-архивах. Таким образом статьи будут доступны общественности до или сразу после публикации в журнале[56]. Многие исследователи и организации рассматривают лежащий в основе arXiv принцип самоархивирования наиболее эффективным и демократичным способом перехода к ОД, поскольку он не подразумевает резкого изменения традиционной модели издательского бизнеса[57]. Авторы могут размещать статьи как в виде препринтов, так и уже опубликованных версий[58][59]. Согласно исследованию 2012 года, пользователи гораздо чаще предпочитали «зелёный путь» (21,4 %) «золотому» (2,4 %) во всех научных дисциплинах, кроме биомедицины, потому что он не требовал от исследователей дополнительных затрат в виде платы за публикацию, как в случае с публикацией в журналах открытого доступа[60]. Размещение препринтов в открытых репозиториях по типу arXiv обладает рядом достоинств по сравнению с другими форматами ОД, главным из которых является скорость публикации — статья становится общедоступной практически немедленно[61]. При этом многие издательства налагают на авторов так называемое «эмбарго» — период, во время которого исследователям запрещено публиковать статьи в альтернативных источниках. Длительность ограничений чаще всего составляет до 12 месяцев, что значительно затрудняет внедрение «зелёного доступа»[62][59][63].

В 2013 году Европейский исследовательский совет объявил о сотрудничестве с arXiv, сформировав международное партнёрство для поддержки репозитория. Несмотря на то, что сумма финансирования была больше символической и в разные годы составляла $1500—$3000, это событие сыграло важную роль в контексте поддержки принципов «зелёного пути» на национальном уровне[64].

Статистика годового прироста статей по разным тематикам на arXiv.org с 1991 по 2020 год

ArXiv помог сделать препринты основным способом обмена и хранения научных данных в таких областях, как астрономия, астрофизика, ядерная физика и физика элементарных частиц[3]. Помимо этого, arXiv помог систематизировать существующую систему распространения препринтов и способствовал преодолению неравенства в доступе к научному знанию — исследователи из развивающихся стран имеют такой же доступ к исследовательским материалам, что и преподаватели из Лиги плюща[15]. Согласно исследованию 2015 года, около 75 % работ физиков по теме конденсированного состояния депонируются в arXiv’е. Опрос профессорского состава Оклахомского университета показал, что 92 % преподавателей математики и 67 % физики использовали препринты arXiv для поддержки и распространения своих исследований[65].

Начиная с 2012 года в arXiv’е начали публиковать работы в сфере биологии. Одним из первых известных препринтов этой области стало микробиологическое исследование, оспаривающее публикации Science 2011 года. Исследование, размещённое в открытом доступе, опровергло возможность штамма бактерий Halomonas titanicae содержать мышьяк в своей ДНК[66].

В arXiv часто публикуются работы, оказывающие существенное влияние на развитие науки. Одним из самых громких случаев произошёл в 2002—2003 годах, когда математик Григорий Перельман опубликовал в arXiv’е три статьи, в которых доказал решение проблемы Пуанкаре — одной из семи задач тысячелетия, сформулированной в 1904 году французским математиком Анри Пуанкаре. В 2006 году решение Перельмана было официально признано верным, и журнал Science назвал доказательство научным «прорывом года»[4][67][65]. В 2010 году математику была присуждена Премия Задачи тысячелетия (Millennium Prize Problems) — для этого Математический институт Клэя впервые нарушил одно из основных правил номинации, согласно которому получение приза возможно только после публикации автором работы в рецензируемых журналах, поскольку в случае Перельмана публикация осталась формально набором препринтов на arXiv.org[68][69][70][71].

Цитирование

[править | править код]

В 2007 году исследователь Саутгемптонского университета Тим Броуди измерил временной промежуток между публикацией статей в arXiv и началом цитирования. Согласно полученным результатам, с каждым годом этот интервал всё больше уменьшался, что свидетельствует о том, что основанная на открытом доступе система публикаций позволяет сокращать цикл исследования и повышает эффективность распространения научного знания[53][72]. Более поздние исследования показали, что в разделах по физике, математике, а также в астрономии и астрофизике версии arXiv цитируют быстрее, чем уже опубликованные в научных журналах статьи[19].

Анализ 2765 статей, опубликованных в четырёх математических журналах с 1997 по 2005 год, показывает, что депонированные в arXiv статьи в среднем получали на 35 % больше цитирований, чем не депонированные, с преимуществом около 1,1 цитирования на статью[73]. При этом на предметном уровне препринты arXiv больше цитируются математиками[65].

Выделяют три основные причины для преимущества в цитировании депонированных в arXiv статей. Первой является так называемое «преимущество открытого доступа» — открытые статьи видят больше пользователей. Кроме того, существует возможная «предвзятость самоотбора» в выборке статей — исследователи публикуют в открытом доступе только свои лучшие работы. ArXiv также индексируется Google, и многими специальными поисковыми инструментами, такие как Scopus, OAIster[англ.], Web of Science, Citebase. Благодаря этому существует так называемое «преимущество arXiv»: размещённые на портале статьи появляются в приоритете в поисковых службах. Помимо этого, хранилище представляет ценный ресурс для исследователей и пользуется большой популярностью[74]. Все эти факторы увеличивают доступность препринтов и влияние их авторов[75].

Другие репозитории

[править | править код]

Опыт и структура arXiv легли в основу других онлайн-репозиториев. В 1994 году было запущено SSRN — хранилище препринтов по социальным и гуманитарным наукам. В 2016 году Elsevier выкупил SSRN, где на тот момент было около 2 млн пользователей. Сделка вызвала неоднозначную общественную реакцию, поскольку исследователи опасались, что издательство ограничит доступ к препринтам и будет препятствовать распространению открытого доступа[5][76][77]. В 2013 году был создан отдельный репозиторий для работ по биологии — bioRxiv[78]. Спустя три года Американское химическое общество (ACS) объявило о создании архива препринтов по химии — ChemRxiv[англ.]. В этом же году был запущен SocArXiv — онлайн сервис статей по социальным наукам, основанный социологом Филипом Коэном[англ.] в партнёрстве с некоммерческим Центром открытой науки (Center for Open Science)[79][80]. Также в 2016 году были созданы архивы для исследователей в областях инженерии engrXiv[англ.] и психологии PsyArXiv[англ.][6].

Крупнейшие научные издательства также участвуют в создании онлайн-репозиториев. Например, сервер In Review был создан при поддержке Springer Nature, а ChemRN спонсировал Elsevier. Ряд национальных серверов, таких как арабский Arabirxiv, французский сервер Frenxiv, индонезийский портал INArxiv, индийский Indiarxiv были созданы при поддержке Центра открытой науки[81].

С увеличением количества размещаемых в электронных архивах препринтов возникла потребность в разработке новых порталов, способных выполнять поиск по нескольким репозиториям одновременно. Созданный в 2002 году при финансировании Andrew W. Mellon Foundation[англ.] и Open Archives Initiative[англ.] портал OAIster[англ.] позволяет осуществлять поиск по каталогу более чем 200 репозиториев[82][83][84]. Это особенно помогало исследователям из развивающихся стран, чьи работы оказались включены во всемирные научные библиотеки[59][63].

Отдельные исследователи отмечают, что, несмотря на свои преимущества, arXiv не является идеальной системой для распространения научных данных. Проблемой является отсутствие системы рецензирования — модераторы не оценивают загруженные материалы с точки зрения достоверности или научной значимости. Таким образом, подобные arXiv-репозитории являются только дополнением, а не замещением традиционных академических журналов[85].

В 2002 году креационист Роберт Джентри из Теннесси подал в суд на операторов сервера препринтов arXiv, утверждая, что они отклонили десять его работ из-за их религиозного содержания. Адвокат, представляющий Корнеллский университет в Итаке, заявил, что претензии не имеют оснований, и что университет имеет право выбирать, какой контент публиковать на сайте. До этого в 1960-х и 1970-х годах Джентри публиковал работы по ядерной геофизике в таких ведущих журналах, как Science и Nature. Впоследствии исследователь выдвинул альтернативную гипотезу Большого взрыва, которую он безуспешно пытался опубликовать в академических журналах. После неудачных попыток Джентри решил выставить свои работы в arXiv, однако модераторы arXiv удалили документы и отозвали его права на публикацию в 2001 году. Джентри подал иск о восстановлении доступа в августе 2002 года[86]. В 2004 году иск был отклонён[87].

В 2009 году физик Филипп Гиббс создал viXra — альтернативный электронный архив для публикации работ, которые не прошли модерацию в arXiv[88]. На сайте публикуются все работы, независимо от качества, количества или соответствия научным стандартам[89][90].

В 2016 году квантовый физик из Женевского университета Николас Гизин[англ.] заявил, что модераторы arXiv ошибочно поместили в чёрный список работу двух его студентов — Тьяго Геррейро и Фернандо Монтейро, в которой они рассматривали теоретическую проблему падения человека в чёрную дыру. В ответ на жалобу Гизина модераторы портала заявили, что они имеют право на неразглашение причины, по которой было принято отрицательное решение. При этом жалоба Гизина вызвала волну критики портала со стороны других физиков, заявивших, что процесс модерации препринтов должен быть более прозрачным. Впоследствии работа Геррейро и Монтейро была опубликована в Physics Letters[англ.][91][92].

Примечания

[править | править код]
  1. 1 2 Boldt, 2011, с. 238—242.
  2. 1 2 3 4 5 6 7 8 Ramlo, 2007, с. 374—375.
  3. 1 2 Macaluso, 2014, с. 1157–1169.
  4. 1 2 Mackenzie, 2006, с. 1848—1849.
  5. 1 2 Robert Cookson. Elsevier buys research sharing website. Financial Times (17 мая 2016). Дата обращения: 3 мая 2021. Архивировано 13 мая 2021 года.
  6. 1 2 У химиков появится свой архив препринтов — ChemRxiv. Научная Россия (12 августа 2016). Дата обращения: 30 апреля 2021. Архивировано 13 мая 2021 года.
  7. Monthly Submissions. Cornell University. Дата обращения: 17 мая 2022. Архивировано 7 мая 2021 года.
  8. 1 2 3 4 5 Pinfield, 2001.
  9. 1 2 3 4 5 Taubes, 1993, с. 1246—1248.
  10. 1 2 3 4 Meyer, 2002.
  11. 1 2 3 Jackson, 2002, с. 23—32.
  12. 1 2 Vivienne Bachelet. What are preprints? Medwave (2017). Дата обращения: 1 мая 2021. Архивировано 11 мая 2021 года.
  13. 1 2 Зельдина, 2020, с. 287—294.
  14. 1 2 O'Connell, 2002, с. 1—12.
  15. 1 2 3 4 5 6 Steele, 2012.
  16. 1 2 3 4 5 6 7 McKiernan, 2000, с. 127—138.
  17. 1 2 3 Ginsparg, 2011, с. 145—147.
  18. 1 2 3 4 Luce, 2001.
  19. 1 2 3 4 5 Macaluso, 2014, с. 1157—1169.
  20. Jacobs, 2006, с. 55.
  21. 1 2 3 4 Создатель хранилища научных статей ArXiv.org покидает проект. РИА Новости (11 августа 2011). Дата обращения: 2 мая 2021. Архивировано 11 мая 2021 года.
  22. Butler, 2003, с. 548.
  23. Charles Choi. Biology's new online archive. The Scientist (29 сентября 2003). Дата обращения: 30 апреля 2021. Архивировано 7 апреля 2022 года.
  24. The global-village pioneers. Physics world (1 октября 2008). Дата обращения: 29 апреля 2021. Архивировано 26 апреля 2021 года.
  25. Bill Steele. Cornell professor Paul Ginsparg, science communication rebel, named a MacArthur Foundation fellow; three other alumni also receive 'genius award' fellowships. Cornell University Press (24 сентября 2002). Дата обращения: 3 мая 2021. Архивировано 6 мая 2021 года.
  26. 1 2 Richard Van Noorden. The arXiv preprint server hits 1 million articles. Nature (30 декабря 2014). Дата обращения: 29 апреля 2021. Архивировано 7 мая 2021 года.
  27. Richard Van Noorden. ArXiv preprint server plans multimillion-dollar overhaul. Nature (29 июня 2016). Дата обращения: 1 мая 2021. Архивировано 12 ноября 2020 года.
  28. 1 2 ArXiv, 2021.
  29. Business Model. Arxiv.org. Дата обращения: 30 апреля 2021. Архивировано 9 мая 2021 года.
  30. Josh Fischman. The First Free Research-Sharing Site, arXiv, Turns 20 With an Uncertain Future. The Crhonicle of Higher Education (10 августа 2011). Дата обращения: 29 апреля 2021. Архивировано 11 мая 2021 года.
  31. Baumann, 2020, с. 2433—2441.
  32. Kamil Mizera. Green Open Access on your iPhone: ArXiv Mobile App. Open Science (22 октября 2013). Дата обращения: 30 апреля 2021. Архивировано 16 января 2021 года.
  33. Kamil Mizera. Green Open Access on your Android device: ArXiv mobile. Open Science (6 ноября 2013). Дата обращения: 30 апреля 2021. Архивировано 16 января 2021 года.
  34. The NG project is modernizing arXiv. arXiv blog. Дата обращения: 26 мая 2022. Архивировано 26 мая 2022 года.
  35. arXiv NG: Classic Renewal. arXiv blog (16 октября 2017). Дата обращения: 26 мая 2022. Архивировано 8 июля 2022 года.
  36. 1 2 3 Ginsparg, 2006, с. 9606—9608.
  37. Oya Y. Rieger. ITHAKA S+R. Дата обращения: 11 мая 2021. Архивировано 9 мая 2021 года.
  38. arXiv Leadership Team. arXiv. Дата обращения: 11 мая 2021. Архивировано 12 мая 2021 года.
  39. Ginsparg, 2014, с. 44.
  40. Giles, 2003, с. 7.
  41. Brumfiel, 2007.
  42. Turkish Professor uncover plagiarisn in papers posted on physics server. The Chronicle of Higher Education (6 сентября 2007). Дата обращения: 3 мая 2021. Архивировано 12 мая 2021 года.
  43. John Timmer. Plagiarism and falsified data slip into the scientific literature: a report. Ars Technica (8 августа 2007). Дата обращения: 3 мая 2021. Архивировано 12 мая 2021 года.
  44. Experimenting with plagiarism detection on the arXiv. Physics Today (1 марта 2007). Дата обращения: 3 мая 2021. Архивировано 27 ноября 2021 года.
  45. Understanding the arXiv identifier. arXiv. Дата обращения: 15 июня 2022. Архивировано 26 апреля 2022 года.
  46. New arXiv articles are now automatically assigned DOIs. ArXiv. Дата обращения: 15 июня 2022. Архивировано 23 февраля 2022 года.
  47. About ArXiv.org. arXiv.org. Дата обращения: 3 мая 2021. Архивировано 26 января 2017 года.
  48. Двадцать лет спустя. Троицкий вариант – Наука (16 августа 2011). Дата обращения: 3 мая 2021. Архивировано 13 мая 2021 года.
  49. Hall, 2008, с. 45—46.
  50. arXiv License Information. Cornell University Library. Дата обращения: 3 мая 2021. Архивировано 26 ноября 2020 года.
  51. arXiv License Information. arXiv. Дата обращения: 3 мая 2021. Архивировано 1 мая 2021 года.
  52. History of Open Access. Open Access. Дата обращения: 28 апреля 2021. Архивировано 14 мая 2020 года.
  53. 1 2 Alma Swan. Open Access and the Progress of Science. American Scientist (2007). Дата обращения: 30 апреля 2021. Архивировано 13 мая 2021 года.
  54. Jacobs, 2006, с. 50—58.
  55. Open Access: пейзаж после битвы за открытый доступ к научным статьям. Новости сибирской науки (Екатерина Мищенко). Дата обращения: 3 мая 2021. Архивировано 24 сентября 2020 года.
  56. Jacobs, 2006, с. 57—59.
  57. Кулаженко, 2019, с. 63.
  58. Liesegang, 2013, с. 425.
  59. 1 2 3 Leslie Chan and Barbara Kirsop and Subbiah Arunachalam. Open access archiving: the fast track to building research capacity in developing countries. Sci Dev Net (27 марта 2008). Дата обращения: 5 апреля 2021. Архивировано 23 апреля 2021 года.
  60. Gargouri, 2012.
  61. Rodríguez, 2019, с. 1—27.
  62. Трищенко, 2017, с. 23.
  63. 1 2 Martin Lochman. Enhancing the visibility of Maltese research. Times Malta (25 декабря 2016). Дата обращения: 5 апреля 2021. Архивировано 23 апреля 2021 года.
  64. Kamil Mizera. ArXiv to receive funds from the European Research Council. Open Science (24 сентября 2013). Дата обращения: 30 апреля 2021. Архивировано 24 января 2021 года.
  65. 1 2 3 Li, 2015, с. 614—635.
  66. Callaway, 2012, с. 19.
  67. Григорий Перельман. Полит.ру (13 июня 2020). Дата обращения: 22 февраля 2021. Архивировано 13 мая 2021 года.
  68. Доказательство длиною в век. Lenta.ru (19 марта 2010). Дата обращения: 22 февраля 2021. Архивировано 11 февраля 2021 года.
  69. Трищенко, 2017, с. 40—44.
  70. Marc Kaufman. Russian mathematician wins $1 million prize, but he appears to be happy with $0. Washington Post (2 июля 2010). Дата обращения: 30 апреля 2021. Архивировано 27 июля 2020 года.
  71. Препринт обгоняет научную статью. Коммерсантъ (23 декабря 2019). Дата обращения: 3 мая 2021. Архивировано 13 мая 2021 года.
  72. Jacobs, 2006, с. 46.
  73. Fromerth, 2007, с. 1—17.
  74. Jacobs, 2006, с. 49.
  75. Jacobs, 2006, с. 50.
  76. George H. Pike. Elsevier Buys SSRN: What It Means for Scholarly Publication. Information Today, Inc. (август 2016). Дата обращения: 3 мая 2021. Архивировано 12 мая 2021 года.
  77. Nature Cancer, 2020, с. 1025—1026.
  78. Ewen Callaway. Preprints come to life. Nature (12 ноября 2013). Дата обращения: 3 мая 2021. Архивировано 6 мая 2021 года.
  79. Ученые создают SocArXiv - открытый архив препринтов и исследований по социальным наукам. Ноосфера (26 июля 2016). Дата обращения: 2 мая 2021. Архивировано 13 мая 2021 года.
  80. Angela Cochran. What Is SocArXiv? The Scholarly Kitchen (25 июля 2016). Дата обращения: 3 мая 2021. Архивировано 13 мая 2021 года.
  81. Александр Кузнецов. Препринт обгоняет научную статью. Коммерсантъ (23 декабря 2019). Дата обращения: 23 февраля 2021. Архивировано 23 февраля 2021 года.
  82. Gaines, 2015, с. 5—11.
  83. Prosser, 2003.
  84. Bailey, 2005, с. 1—19.
  85. Nature Photonics, 2012.
  86. Geoff Brumfiel. Ousted creationist sues over website (2002). Дата обращения: 3 мая 2021. Архивировано 14 декабря 2021 года.
  87. News in brief. Nature (2004). Дата обращения: 3 мая 2021. Архивировано 14 декабря 2021 года.
  88. Geoffrey Brumfiel. What's arXiv spelled backwards? A new place to publish. Nature (16 июля 2009). Дата обращения: 30 апреля 2021. Архивировано 1 декабря 2011 года.
  89. What's arXiv spelled backwards? A new place to publish. Nature News blog (16 июля 2009). Дата обращения: 3 мая 2021. Архивировано 1 декабря 2011 года.
  90. Kate Becker. What Counts as Science? Nautilus (27 октября 2016). Дата обращения: 3 мая 2021. Архивировано 13 мая 2021 года.
  91. Zeeya Merali. ArXiv rejections lead to spat over screening process. Nature (29 января 2016). Дата обращения: 30 апреля 2021. Архивировано 28 февраля 2021 года.
  92. arXiv screening process called into question. Physics Today (1 февраля 2016). Дата обращения: 3 мая 2021. Архивировано 13 мая 2021 года.

Литература

[править | править код]
На русском языке
  • Зельдина М. Препринты: история развития и современное состояние // Наука и научная информация. — 2020. — Т. 3, вып. 4. — doi:10.24108/2658-3143-2020-3-4-287-294.
  • Кулаженко В.Г. "Зелёная революция" в науке и её последствия // XIX Международная научно-практическая конференция "Менеджмент вузовских библиотек». «Открытая наука: практики и модели сотрудничества». — Минск, 2019. — С. 60—75.
  • Трищенко Н. Открытый доступ к науке. Анализ преимуществ и пути перехода к новой модели обмена знаниями. — Ассоциация интернет-издателей Издательство «Кабинетный учёный». — 2017. — 200 с. — ISBN 978-5-7584-0154-5.
На английском языке
  • Bailey C. Open Access Bibliography (англ.) // Association of Research Libraries. — 2005.
  • Baumann A, Wohlrabe K. Where have all the working papers gone? Evidence from four major economics working paper series // Scientometrics. — 2020. — Вып. 124. — С. 2433—2441. — doi:10.1007/s11192-020-03570-x.
  • Boldt A. Extending ArXiv.org to Achieve Open Peer Review and Publishing (англ.) // Journal of Scholarly Publishing. — 2011. — doi:10.3138/jsp.42.2.238.
  • Brumfiel, G. Turkish physicists face accusations of plagiarism // Nature. — 2007. — Т. 449, вып. 8. — doi:10.1038/449008b.
  • Butler D. Biologists join physics preprint club (англ.) // Nature. — 2003. — Vol. 425. — P. 548.
  • Callaway E. Geneticists eye the potential of arXiv (англ.) // Nature. — 2012. — Vol. 488. — P. 19.
  • Gargouri Y., Larivière V., Gingras Y., Carr L., Harnad S. Green and Gold Open Access Percentages and Growth, by Discipline // ArXiv. — 2012.
  • Davis P., Fromerth M. Does the arXiv lead to higher citations and reduced publisher downloads for mathematics articles? (англ.) // Scientometrics. — 2007. — Vol. 71, no. 2.
  • Eve P. M. Open Access ad the Humanities. Contexts, Controversies and the Future (англ.). — Cambridge University Press. — 2014. — 210 p. — doi:10.1017/CBO9781316161012.
  • Hall S. Digitize This Book! The Politics of New Media, or Why We Need Open Access Now (англ.). — University of Minnesota Press. — Minneapolis, London, 2008. — 312 p. — ISBN 978-0-8166-4871-9.
  • Galbán Rodríguez E. Preprints and preprint servers as academic communication tools (англ.) // Revista Cubana de Información en Ciencias de la Salud. — 2019. — Vol. 30, iss. 1. — P. 1—27.
  • Gaines D., Fagan J. OAIster on EBSCO Discovery Service, FirstSearch, and OAIster.worldcat.org // Libraries. — 2015. — Вып. 54. — С. 5—12.
  • Giles J. Preprint server seeks way to halt plagiarists (англ.) // Nature. — 2003. — Vol. 426, iss. 6. — doi:10.1038/426007a.
  • Ginsparg P. ArXiv screens spot fake papers // Nature. — 2014. — Т. 508, вып. 44. — doi:10.1038/508044a.
  • Ginsparg P. ArXiv at 20 (англ.) // Nature. — 2011. — P. 145—147.
  • Ginsparg P. As we may read (англ.). — 2006. — Vol. 26, iss. 38. — P. 9606—9608. — doi:10.1523/JNEUROSCI.3161-06.2006.
  • Jacobs N. Open Access: Key Strategic, Technical and Economic Aspects (англ.). — Chandos Publishing. — 2006. — 239 p.
  • Jackson A. From Preprints to E-prints: The Rise of Electronic Preprint Servers in Mathematics // Notices of the AMS. — 2002. — Т. 49, вып. 1. — С. 23—32.
  • Larivière V., Sugimoto C., Macaluso B., Milojevic S., Cronin B., Thelwall M. arXiv E-Prints and the Journal of Record: An Analysis ofRoles and Relationships (англ.) // Journal of the Association for Information Science and Technology. — 2014. — Vol. 65, iss. 6. — P. 1157—1169. — doi:10.1002/asi.23044.
  • Li X., Thelwall M., Kousha K. The role of arXiv, RePEc, SSRN and PMC in formal scholarly communication (англ.) // Aslib Journal of Information Management. — 2015. — Vol. 67, no. 6. — doi:10.1108/AJIM-03-2015-0049.
  • Liesegang T. Perspectives. The continued movement for open access to peer-reviewed literature // American Journal of Ophthalmology. — 2013. — Т. 156, вып. 3. — С. 423—432. — doi:10.1016/j.ajo.2013.04.033.
  • Luce R. E-prints Intersect the Digital Library: Inside the Los (англ.) // ACRL Science & Technology Section. — 2001.
  • Mackenzie D. Breakthrough of the year: The Poincaré Conjecture-Proved (англ.) // Science. — 2006. — Vol. 314, no. 5807. — P. 1848—1849. — doi:10.1126/science.314.5807.1848.
  • Meyer E., Kling R. Leveling the playing field, or expanding the bleachers? Socio-Technical Interaction Networks and arXiv.org (англ.) // CSI Working Paper No. WP-02-10. — 2002.
  • McKiernan G. arXiv.org: the Los Alamos National Laboratory e-print server // International Journal on Grey Literature. — 2000. — Т. 1, вып. 3. — С. 127—138. — doi:10.1108/14666180010345564.
  • O'Connell H. Physicists Thriving with Paperless Publishing (англ.) // High Energy Physics Libraries Webzine. — 2002. — Iss. 6.
  • Pinfield S. How Do Physicists Use an E-Print Archive? (англ.) // D-lib magazine. — 2001. — Vol. 7, iss. 12. — ISSN 1082-9873.
  • Prosser, D. The Next Information Revolution - How Open Access repositories and Journals will Transform Scholarly Communications // LIBER Quarterly. — 2003. — Т. 14, вып. 1. — doi:10.18352/lq.7755.
  • Ramlo S. ArXiv.org and Physics Education (англ.) // The Physics Teacher. — 2007. — Vol. 45, iss. 374. — doi:10.1119/1.2768698.
  • Steele B. Library-managed 'arXiv' spreads scientific advances rapidly and worldwide (англ.) // Cornell's quarterly magazine. — 2012. — Vol. V, iss. 1.
  • Taubes G. Publication by Electronic Mail Takes Physics by Storm // Science. — 1993. — Т. 259. — С. 1246—1248.
  • ArXiv Annual Report 2021 // ArXiv. — 2021.
  • Rise of the preprints (англ.) // Nature Cancer. — 2020. — Iss. 1. — P. 1025—1026. — doi:10.1038/s43018-020-00151-y.
  • Celebrating the arXiv (англ.) // Nature Photonics. — 2012. — Vol. 6, iss. 1.