CEMI contribution to formation of Runet. Information projects
Table of contents
Share
QR
Metrics
CEMI contribution to formation of Runet. Information projects
Annotation
PII
S265838870019963-2-1
Publication type
Review
Status
Published
Authors
Anatoly Akinshin 
Occupation: Senior Researcher, Acting Head of Local Networks Laboratory
Affiliation: CEMI RAS
Address: Russian Federation, Moscow, Nakhimovsky pr., 47
Yuri Polak
Occupation: Leading Researcher
Affiliation: CEMI RAS
Address: Russian Federation, Moscow, Nakhimovsky pr., 47
Abstract

This review is a continuation of the text «CEMI contribution to formation of Runet. Infrastructure projects» where important infrastructure telecommunications projects by employees of the Central Economics and Mathematics Institute of the USSR Academy of Sciences (since 1992 - RAS) were described. CEMI scientists not only improved the technological infrastructure of the Runet, but also created its software and information tools. The present paper describes their unique developments: «AU!» rubricator, the most important information resource for that time, as well as Socionet information system, which has fully retained its significance to the present day. In addition, the joint work with the ISC RAS on the project «Electronic Library Scientific Heritage of Russia», which used the Institute's developments, is mentioned.

Keywords
Runet, information resources, CEMI contribution, «AU!» rubricator, Socionet, open science
Received
02.06.2022
Date of publication
05.07.2022
Number of purchasers
11
Views
418
Readers community rating
0.0 (0 votes)
Cite Download pdf
Additional services access
Additional services for the article
1 В первой части этого материала [1] описывались важные инфраструктурные телекоммуникационные проекты, над которыми работали сотрудники Центрального экономико-математического института АН СССР (с 1992 года – РАН). В частности, речь там шла о подключении ЦЭМИ к IIASA1 и ЮМОС2. Нельзя утверждать, что оно стало решающим вкладом в работу этих сетей, которые успешно функционировали и ранее. Иная ситуация с EARN/BITNet3: российский сегмент SUEARN смог заработать только при создании узла SUCEMI в дополнение к существовавшему в ИОХе4. Наконец, РОЦИТ5 смог успешно стартовать в стране благодаря тому, что ЦЭМИ «приютил» его, предоставив офис на 3-м этаже и зал заседаний для проведения семинаров. А база данных «Интернет в России, Россия в интернете», разработанная в институте, легла в основу одного из первых проектов РОЦИТа.
1. International Institute for Applied Systems Analysis (Лаксенбург, Австрия)

2. Южная московская опорная сеть

3. European Academic & Research Network, Because It’s Time Network

4. Институт органической химии имени Н.Д.Зелинского РАН

5. Российский (региональный) общественный центр интернет-технологий
2 Сотрудники ЦЭМИ не только совершенствовали технологическую инфраструктуру Рунета, но и создавали его программно-информационный инструментарий. Ниже описаны их уникальные разработки: такой важнейший для своего времени информационный ресурс как каталог «АУ!», и система Соционет, полностью сохранившая своё значение до сих пор. Кроме того, упомянуты совместные работы с МСЦ РАН над проектом «Электронная библиотека Научное наследие России», в котором использовались разработки института.
3

Каталоги сетевых информационных ресурсов

4 В 1993 г. в ЦЭМИ РАН на базе лаборатории методов механизации экономико-математических расчетов возникло новое подразделение, получившее название лаборатории баз данных и первичной обработки информации [2]. Возглавивший его Ю. Е. Поляк предложил новое научное направление – исследование информационных ресурсов зарождающегося отечественного интернета, что впоследствии нашло отражение в новом названии: лаборатория сетевых информационных ресурсов. И в 1995 г. коллектив приступил к каталогизации отечественных ресурсов интернета. Вначале этой работой занимались три сотрудника лаборатории, вскоре их число выросло до 20 благодаря привлечению студентов МГУ им. М. В. Ломоносова, которым Ю. Е. Поляк читал лекции по информатике. Весной 1996 г. собранная информация легла в основу базы данных «Интернет в России, Россия в интернете», разработанной А. Н. Дыбенко, а ещё через полгода стала доступной в онлайновом режиме в виде веб-каталога «Русский интернет». Компьютерную технику предоставила корпорация Intel. В [1] цитируются воспоминания В. В. Куликова о семинаре РОЦИТа 25-летней давности [3], где каталог был представлен общественности. Там указан его тогдашний адрес на сервере «Русский клуб У Агамы» >>>> впоследствии сайт перенесли в РОЦИТ, что повлекло смену адреса на http:// www.rocit.ru/au, а затем появилось собственное доменное имя http:// www.au.ru .
5

Из справочника А.В.Сигалова «Жёлтые страницы Internet'97: Русские ресурсы» (СПб, Питер-пресс, 1997, 575 с.)

6

Проект «Русский интернет» имеет целью создание единой поисково-рубрикационной информационной системы, предназначенной для поиска в Сети ресурсов российских серверов, а также зарубежных материалов, имеющих отношение к России. Данный проект, предусматривающий интеграцию информационных источников и учет особенностей русской морфологии технологий поиска, является результатом сотрудничества РОЦИТ, ЦЭМИ РАН и фирмы «Агама». На начальной стадии своего развития проект включает каталог-рубрикатор «АУ!» и поисковую систему «Апорт!». Каталог «АУ!» представляет собой трехуровневую иерархическую структуру: два верхних уровня - каталоги, третий - собственно ресурсы. Тематический каталог, претендующий на роль русского «Yahoo», включает разделы: Дом и семья, Досуг, Интернет, Компьютеры и др.

7

В отсутствие развитых средств сетевой навигации каталог стремительно сделался популярным. Этому способствовали особенности «АУ!», отмеченные в 1997 году руководителями РОЦИТ А. Ю. Зотовым и В. Э. Соркиным: это «полнота и качество представленных в нем описаний. Качество описаний определяется сформированной и выверенной методикой работы аналитической группы, тщательно отработанными рубрикаторами, сочетающими полноту и сбалансированность. По мнению РОЦИТа, качество описаний делает каталог «АУ!» уникальным даже в сравнении с таким известным и близким аналогом, как поисковая система Yahoo!»6. Подобные оценки каталога – далеко не редкость. Ежедневно к нему обращались десятки тысяч посетителей. Многие называли его «русским Yahoo!»; газета «Магнитогорские вести» в связи с этим вспоминала, что Au – это ещё и обозначение золота, и делала вывод о высоком качестве пробы7. Профессор МГУКИ В. К. Степанов указывал, что «это самый полный перечень ресурсов российского блока всемирной компьютерной паутины»8. Интернет-центр в Санкт-Петербурге в серии методических материалов выпустил брошюру с инструкцией о работе с каталогом.

6. Из предисловия к печатному справочнику интернет-ресурсов, подготовленному для издательства «Открытые системы» в 1998 году (выпуск не состоялся из-за известных событий на финансовом рынке)

7. >>>>

8. >>>>
8

Скриншоты «АУ!» (1998) и его новой ипостаси @Rus (1999)

9 Каталог «АУ!» - самый известный, но не единственный информационный продукт, созданный на основе базы данных «Интернет в России, Россия в интернете». В лаборатории подготовлено впечатляющее количество печатных изданий, среди которых – одна из первых книг по интернету на русском языке [4], первый в стране печатный каталог интернет-ресурсов [5], фундаментальный справочник [6], два издания самого полного в России каталога [7]. В периодических изданиях начали публиковаться аннотированные тематические подборки веб-адресов; в отсутствие поисковых машин это было актуально. Так в 1996 г. в русском издании еженедельника PC Week появился цикл «Избранными маршрутами». В 1999 г. был начат выпуск серии справочников «Навигатор российского интернета» (редактор Ю. Е. Поляк, свидетельство о регистрации средства массовой информации ПИ №77-15996). Каждая книжка была посвящена определённой теме и содержала около 1 000 аннотаций. НТЦ «Информрегистр» включил базу в Государственный регистр баз данных (№ госрегистрации 0229905944, свидетельство №5613 от 16 февраля 2000 г.). База демонстрировалась на международных конференциях и выставках «Телематика», «Ломоносовские чтения», «WindowsExpo», «Online Information» в Лондоне.
10

Труды лаборатории (фото 1999 г.)

11

В это время параллельно происходили совсем другие процессы. Начало им было положено в 1992 году, когда возникло АОЗТ «Агама» (основатель и генеральный директор Е. В. Киреев). Оно располагалось в Научном парке МГУ и занималось разработкой программного обеспечения на базе собственных лингвистических технологий. В первые годы ими был созданы такие проекты как MailReader, Пропись, Русский Филолог и другие. Адаптируя продукты Microsoft к работе с русским языком, «Агама» разработала программу проверки русской орфографии для MS Word. Однако Microsoft выбрал другое решение, и в феврале 1996 года «Агама» стала использовать новый код как поисковую систему, в которой учитывалась морфология слов и могла выполняться проверка орфографии запроса. Так появился Апорт, который стал первой российской поисковой системой: Рамблер появился через полгода, Яндекс – через полтора. К моменту официальной презентации, 11 ноября 1997 года, в поисковой системе Апорт был проиндексирован первый миллион документов, расположенных на 10 тысячах серверов9. Версия Апорт-2000, представленная на российской выставке Internetcom’99 и американской Fall Internet World’99 , технологически опережала этих обоих конкурентов; в частности, была реализована кластеризация результатов поиска и рейтингование сайтов по ссылочной популярности (нечто подобное делали американские Northern Light и Google в технологии Page Rank).

9. >>>>
12

С помощью РОЦИТа удалось привлечь спонсоров. 11 ноября 1997 года всемирно известная корпорация Intel объявила на пресс-конференции о полномасштабной поддержке поисковика Апорт, а также каталога «АУ!» (они всегда рассматривались как две части одного глобального проекта). РОЦИТ организовал регистрацию «АУ!» в Российском агентстве по правовой охране программ для ЭВМ, баз данных и топологий интегральных микросхем (свидетельство № 970718 от 30 декабря 1997 г.). Правообладателем каталога стало ЗАО «Ви-6» (А. Ю. Зотов и В. Э. Соркин). В 1998 году гражданин Израиля, торговец посудой Иосиф (американский вариант – Джозеф) Авчук (Joseph Avchuk) приобрёл компанию «Агама» вместе с поисковой машиной Апорт за $45 000 и интернет-каталог «АУ!», примерно за такую же сумму10. Другие источники говорят о 55 тысячах11 и даже миллионе12. Впрочем, последнее утверждение, видимо, связано с тем, что Авчук в течение года вложил миллион долларов в развитие Апорта и AtRus (так стал именоваться каталог «АУ!»; при этом значительно изменился и дизайн каталога). Эти инвестиции позволили разработать упоминавшуюся поисковую машину Апорт-2000, полностью интегрированную с Atrus (который получил название «Каталог-Апорт»)13. Суточная аудитория каталога «АУ!» превышала 20 000 человек [3, 8], он содержал более 60 тысяч записей (причём ежедневно добавлялась сотня новых), количество рубрик за два месяца выросло с 200 до 500. Открылась англоязычная часть каталога14.

10. >>>> >>>>

11. >>>> >>>>

12. >>>>

13. >>>> >>>> >>>>

14. >>>>
13 30 июля 2000 года Авчук продал провайдеру Golden Telecom за $25 миллионов поисковую систему Апорт, интернет-каталог Atrus и развлекательный портал Omen.ru15. В последующее время происходило резкое падение индекса биржевого фонда NASDAQ (крах «пузыря доткомов»16). Расходы на поддержку интернет-проектов сокращались, развитие Апорта, ставшего частью портала «Россия онлайн», было прекращено. Затем новым владельцем Golden Telecom стал Альфа-Банк. Данные из каталога были экспортированы на «Россию онлайн». Впоследствии «от этой прекрасной базы данных ничего не осталось»17. Апорт в 2011 г. перешёл на поиск Яндекса. Закончил он бесславно: летом 2012 г. его приобрёл за $150 тысяч директор сайта знакомств А. Бронецкий18. Сайт ещё существует, им владеют торговцы19.
15. >>>>

16. >>>>

17. >>>>

18. >>>> >>>>

19. >>>>
14

Е. В. Киреев, А. Ю. Зотов, И. Авчук

15 Разумеется, ко всей этой коммерческой деятельности разработчики каталога не имели никакого отношения. В [1] отмечалось, что учёные ЦЭМИ создавали свою базу, руководствуясь научными интересами, и не заботясь об её прагматической ценности. Обо всём этом они узнали много лет спустя. А тогда их занимал новый проект. В институт обратились руководители компании «Яндекс», с которыми у нашего коллектива были давние дружеские отношения. Они решили для повышения релевантности при поиске в интернете создать каталог ресурсов совершенно нового типа.
16 На рубеже веков стало окончательно ясно, что появившиеся к тому времени поисковые машины нового поколения с их миллионами индексированных документов и постоянной актуализацией баз данных выиграли заочное соревнование в скорости и объемах с живыми редакторами. Из-за колоссального роста объёмов сетевой информации стало невозможно продолжать актуализацию универсального каталога на прежнем высоком уровне. Началась конвергенция каталогов и поисковых систем, позволившая им приобрести лучшие черты друг друга [9]. Ограничение области поиска определённой тематической категорией экономит время поиска и в то же время повышает релевантность его результатов. Тщательный ручной мониторинг встроенного каталога в сочетании с быстрым автоматическим обходом сайтов, выполняемым поисковыми роботами, обеспечивает высокую степень соответствия запроса и результата.
17 Примеров немало и в Рунете и за рубежом. Интеграция Апорта и «АУ!» обсуждалась выше. Популярность поисковой системы Рамблер во многом связана с системой рейтингов Рамблер Top100, фактически представляющей собой каталог ресурсов. Упоминавшийся каталог Yahoo! тоже обзавёлся системой поиска, при этом последовательно приобретались лицензии таких известных поисковых систем как AltaVista, позже HotBot и Google – лучших для своего времени. В свою очередь, Hotbot и AltaVista включили в состав услуг поиск по Yahoo-подобным каталогам (directories). Решил пойти по этому пути и «Яндекс».
18 Работа началась в конце 1999 года. Наш коллектив совместно со специалистами «Яндекса» разработал концепцию каталога и принципы классификации, выполнил первоначальное наполнение базы данных и обучение редакторов. В основу был положен ряд новых решений; одно из основных – применение многомерной рубрикации. В каталоге поиск можно было вести не только по теме, но и по другим признакам – географическому региону, источнику и адресату информации, сектору экономики. Во многих ситуациях важно отличать официальные данные от публикаций прессы, частных суждений. Точно так же различны материалы, предназначенные коллегам и единомышленникам, либо инвесторам и спонсорам, либо произвольной аудитории (как товары в магазине). Новый каталог позволял уточнять поиск в соответствии с этими и многими другими критериями. Сходные принципы положены в основу фасетной классификации [10, 11], но в интернете они ранее не применялись. Тематическое дерево каталога было максимально простым: на верхнем уровне всего 12 тематических рубрик, число уровней в глубину не более четырёх. На любом уровне можно сузить список сайтов по любому из признаков. Сайты в каталоге были отсортированы по индексу цитирования – числу упоминаний в интернете.
19 Новый каталог был естественно интегрирован с поиском Яндекса. Каталог и поиск рассматривались как равноправные и дополнительные объекты. К лету 2000 года в каталоге Яндекса было уже более 40 000 российских интернет-ресурсов, что соответствует примерно 300 тысячам единиц описания в обычном каталоге [12].
20 Лаборатория сетевых информационных ресурсов ЦЭМИ работала над концепцией и пополнением каталога Яндекса несколько лет. Специалисты высоко оценили новую разработку, в частности, многие пользовались каталогом для определения «тематического индекса цитирования» (тИЦ), своеобразного показателя качества веб-сайтов20. После ряда модернизаций каталог продолжал действовать до 2018 года (адрес >>>> позднее сменился на >>>> к этому времени он содержал 108 тысяч сайтов21. Затем тИЦ был заменён другой метрикой – индексом качества сайта, а каталог перестал существовать.
21 Как известно, в начале нового века поисковый рынок России был почти поровну поделён между системами Апорт, Яндекс и Рамблер. Для полноты изложения надо упомянуть, что и третья из них (пусть и с некоторым запозданием) не обошлась без участия нашего коллектива. Речь идёт о системе рейтингов Рамблер Top10022. В 2008 году компания изменила концепцию этого проекта23, и новый руководитель Д. А. Харитонов пригласил А. Б. Антопольского (ИНИОН) и Ю. Е. Поляка для консультаций. Была разработана новая структура рубрикатора, создана система словарей, проведён анализ поисковых запросов и посещаемости разделов. Но экономическая ситуация в стране (и в Рамблере) не позволила реализовать всё задуманное.
22. >>>>

23. >>>>
22

Электронная библиотека «Научное наследие России»

23 В 2006 г. Российская академия наук приняла целевую научную программу «Создание электронной библиотеки «Научное наследие России»» (далее – ЭБ). Работы по созданию ЭБ возглавил Межведомственный суперкомпьютерный центр РАН, разработчиками технологии и программного обеспечения стали также специалисты Вычислительного центра РАН им. А. А. Дородницына и Библиотеки по естественным наукам (БЕН) РАН.
24 Основной целью создания ЭБ является предоставление пользователям интернета многоаспектной информации о выдающихся российских учёных (начиная с XVIII века), внёсших значительный вклад в развитие фундаментальных естественных и гуманитарных наук, с возможностью ознакомления с полными текстами их основных работ. Для этого библиотека должна аккумулировать цифровые копии книг, статей, документов, хранящихся в библиотеках, архивах и музеях РАН. Помимо электронных текстов, она содержит развёрнутые сведения о российских учёных: биографические данные, основные этапы их научной деятельности, библиографию, разнородную архивную и музейную информацию, оцифрованные портреты, аудио- и видеозаписи, относящиеся к теме научного наследия [13].
25 Другой целью создания ЭБ является обеспечение сохранности оригиналов материалов, представляющих историческую ценность. В первую очередь акцент сделан на перевод в цифровую форму редких и уникальных изданий, важнейших документов, экспозиционных материалов. Оцифровка уникальных архивных и библиотечных фондов позволяет читателям работать с электронными копиями, снижая потребность в оригиналах, и тем самым продлевает срок жизни раритетных материалов.
26 Сведения об учёных и основных результатах их научной деятельности, собранные в библиотеке, включаются в Единое научное информационное пространство РАН. Информационный ресурс ЭБ представляет собой часть общего электронного информационного пространства, формируемого другими держателями информационных фондов (Российская государственная библиотека, Научная библиотека МГУ им. М. В. Ломоносова, Президентская библиотека им. Б. Н. Ельцина, Российская национальная библиотека и др.), что предполагает активное взаимное сотрудничество при пополнении информационных ресурсов ЭБ из различных российских и зарубежных источников.
27 Источниками комплектования библиотеки являются библиотечные, архивные, музейные фонды. Подготовкой электронных изданий и сопровождающей информации занимаются центральные академические библиотеки (БАН и БЕН РАН с их отделами в институтах и научных центрах), ИНИОН, Центральная научная библиотека Уральского отделения РАН, Центральный архив РАН с его филиалами, ведущие академические институты и музеи. Поставщиками информации для ЭБ также являются библиотеки других государственных академий.
28

Скриншот титульной страницы ЭБ (http://e-heritage.ru)

29 В 2010 г. к проекту присоединился ЦЭМИ РАН, перед коллективом которого была поставлена задача разработки и реализации сервиса для мониторинга российских электронных библиотек в сфере научного наследия.
30 Выбор исполнителей был обусловлен наличием у специалистов института многолетнего опыта в области каталогизации сетевых информационных ресурсов, подготовки печатных и электронных справочников. Так, ими были подготовлены база информационных ресурсов Рунета «Internet Stock» (ЦЭМИ РАН, 1996-2012); Навигационная система по информационным ресурсам в сфере науки и инноваций (ЦЭМИ и ГНИИ ИТТ «Информика», 2004-2007). Отметим также «Реестр электронных коллекций», содержащий описания (метаданные) более 5 000 ресурсов (ЦЭМИ и Российская ассоциация электронных библиотек, 2006-2009, руководитель работы – проф. А. Б. Антопольский). Наряду с материалами указанных систем, реестр интегрировал данные из Государственного регистра баз и банков данных, Федерального депозитария электронных изданий НТЦ «Информрегистр», аналитических материалов фонда «ФЭБ». Эти разработки и инструментарий позволяли снабдить ЭБ «Научное наследие России» качественным справочным аппаратом по интернет-ресурсам [14].
31

Из плана работ на 2011 год

32

План 2012 года для ЦЭМИ предусматривал также пополнение имевшихся на портале записей ссылками на релевантные сетевые ресурсы (раздел ЭБ «Внешние источники»). В качестве основных источников информации рассматривались персональные страницы учёных (сайты, посвященные учёным), «мемориальные кабинеты», официальные сайты научных организаций, авторитетные библиотеки (в том числе из стран ближнего зарубежья), а также тематические подборки ссылок. Как правило, научные интернет-ресурсы удовлетворяют следующим естественным критериям:

  • объективность и точность опубликованной информации, внятные и чёткие формулировки;
  • грамотное изложение материала, отсутствие орфографических и стилистических ошибок, а также резких и безапелляционных высказываний, аргументированность;
  • указание на использованные источники информации, актуальные гиперссылки;
  • устойчивое и информативное доменное имя (не бесплатный хостинг)25;
  • отсутствие анонимности, наличие контактной информации создателей (адрес, телефон, email);
  • информация о дате публикации и последнем обновлении информации [15].
24. На примере первого отечественного справочника интернет-ресурсов [5] легко убедиться, что подавляющее большинство сайтов научных и учебных организаций на протяжении десятков лет сохраняют свои доменные имена (возможно, «переехав» с .su на .ru), в то время как адреса, например, из раздела «СМИ» почти полностью потеряли актуальность.
33 В результате нашей работы десятки записей были снабжены ссылками на интернет-ресурсы, содержащие полные тексты работ, включённых в Программу учёных и материалы к их биографиям.
34 Для уточнения ряда ссылок потребовалась переписка с владельцами соответствующих ресурсов. Их ответы способствовали актуализации ссылок. Выяснилось также, что некоторые информационные источники (в частности, базы Научно-технической библиотеки ИрГТУ) прекратили существование в режиме открытого доступа.
35 Работа с разделом библиотеки «Внешние источники», естественно, потребовала организации доступа к существующим записям. Совместно с руководством БЕН РАН был определен порядок корректировки технологической базы данных, получены пароли доступа к базе, поддерживаемой на сервере http://meta.e - heritage.ru. В ходе совместной работы сотрудников ЦЭМИ и БЕН с технологической базой выявились некоторые недоработки программного обеспечения. В частности, обнаружилось, что в процессе коррекции в некоторых случаях дублируются записи. Диалог с разработчиками позволил разобраться в механизме такого «клонирования». Кроме того, обнаружилась ситуация, когда правка одной записи вызывала некорректные изменения в другой. Ошибки были исправлены, а инструкция по работе с базой уточнена. Ещё одно замечание связано с тем, что в нескольких сотнях записей даты жизни учёных были введены в формате, не допускавшим сортировку по году. Эти записи также подверглись правке.
36 Большинство проанализированных внешних источников содержали полные тексты трудов классиков науки, биографические материалы, мемуары современников и другую информацию, хорошо дополнившую основной корпус ЭБ «Научное наследие России». Помимо изложенного, сотрудники ЦЭМИ занимались подготовкой к предоставлению в ЭБ информации о выдающихся отечественных учёных в области экономики (определение кандидатур; согласование с правообладателями условий и сроков передачи материалов).
37 Реформа РАН [16] и связанное с ней изменение условий финансирования, кадровые перемены в БЕН, Архиве, ряде институтов РАН существенно затруднили выполнение проекта. Ряд организаций, и среди них ЦЭМИ, были вынуждены прекратить своё участие. Тем не менее, пополнение ЭБ продолжается. В ней хранятся сведения о 6 000 учёных; загружены на сайт порядка 25 тысяч изданий (более 4 миллионов страниц). 15 % публикаций относятся к XVIII веку, 24 % – к XIX, 60 % – к XX. Резкое сокращение размещённых в фондах библиотеки работ последних 70 лет обусловлено нормами законодательства об авторском праве. На русском языке представлены 88 % текстов; по 3.5 % – на латинском и французском, которые преимущественно являлись языками научного общения прошлых лет [17].
38

Соционет

39

В этом разделе мы рассмотрим поддерживаемую в ЦЭМИ информационную систему Соционет26 – агрегатор коллекций научных материалов, а также инструмент для создания собственного рабочего пространства. Её идея состоит в том, чтобы сделать науку и взаимодействие учёного с академическим сообществом более доступной для широкого круга исследователей. Соционет основан на парадигме открытой науки, и представляет собой автоматически пополняемую базу статей. Материалы загружаются с таких ресурсов как CyberLeninka.ru, из редакций научных журналов и т.д. Отличительная особенность ресурса заключается в возможности непосредственного взаимодействия автора и читателя.

25. >>>>
40

Система позволяет увидеть мнения читателей с помощью комментариев, а также зафиксировать наиболее интересные и полезные фрагменты статей. Пользователям предлагается также давать заинтересовавшим публикациям профессиональную оценку. Авторы могут отслеживать количество просмотров описания их статей, число прочтений и комментарии, а также добавлять пояснения к вышедшим статьям. Многие функции ресурса Соционет уникальны как для российского, так и для международного научного пространства27.

41 В [18] авторы описывают функции «идеальной» глобальной системы научных коммуникаций, основанной на современных информационных технологиях и обеспечивающей циркуляцию в научном сообществе создаваемых результатов исследований (РИ) и их доведение до потребителя:
  • доводить РИ до потребителя, отличая потребителей РИ от простых читателей научных текстов;
  • предоставлять потребителю разнообразные инструменты для использования всех доступных РИ в своих исследованиях и для создания собственных РИ, т.е. поддерживать достаточно полный набор режимов использования РИ;
  • автоматически фиксировать факты и качественные характеристики использования РИ для создания нового научного знания, т.е. переводить максимально возможный набор качественных и количественных параметров процесса научного использования РИ в автоматически регистрируемые и статистически фиксируемые показатели;
  • автоматически уведомлять авторов обо всех фактах использования их РИ, включая сведения о качественных параметрах использования, предоставлять авторам возможности обратной связи, в общем случае – средства научных коммуникаций с потребителями их РИ;
  • накапливать и публиковать в открытом доступе все генерируемые системой данные о фактах использования РИ, а также данные о характере реакции авторов на факты использования – для создания конкуренции между различными авторами за право наилучшего удовлетворения спроса потребителя на необходимые для его исследования РИ;
  • устанавливать и поддерживать научную кооперацию между авторами и потребителями РИ.
42

Этим требованиям удовлетворяет система Соционет. Её разработка началась более 20 лет назад [19]. Руководитель рабочей группы – сотрудник Института экономики и организации промышленного производства Сибирского отделения Российской академии наук (ИЭОПП СО РАН)28 Сергей Иванович Паринов (в настоящее время – главный научный сотрудник Центрального экономико-математического института РАН). Соционет предоставляет свободный доступ к большому массиву научных публикаций по различным дисциплинам, среди которых наибольшую долю занимают публикации социально-экономического характера. Количество публикаций исчисляется миллионами. Зарегистрированные пользователи могут публиковать в системе свои материалы и информационные объекты, а также пользоваться её разнообразными бесплатными сервисами.

43 Система позволяет публиковать и предоставляет пользователям доступ к электронным объектам различного рода (монографии и статьи из периодики, научные отчеты, тексты и презентации докладов, авторефераты диссертаций и полные их тексты, рабочие записки и многое другое). Кроме того, доступны сведения о персонах – авторах публикаций, а также об организациях, с которыми ученые аффилированы. Большую часть данных система Соционет получает из внешних источников как агрегатор научных метаданных.
44

Следуя тексту разработчиков29, приведём описание системы.

28. >>>>
45 Система Соционет – один из первых примеров российского участия в разработке международной онлайновой научной инфраструктуры (research e-infrastructure), обеспечивающей информационную поддержку научно-образовательной деятельности первоначально в области общественных наук, а в настоящее время – во всех научных дисциплинах.
46

Скриншот от 27.06.2001

47

Скриншот от 03.01.2022

48

Соционет – самостоятельная разработка российских специалистов из институтов Российской академии наук, выполненная с использованием результатов и рекомендаций международных инициатив RePEc30, а также Open Archives Initiative31, CRIS-CERIF32, Web Annotation33 и др. Обеспечение текущей работы и развитие системы Соционет осуществляет группа разработчиков из ЦЭМИ РАН, ИЭОПП СО РАН, ИВММГ СО РАН и ИПР РАН.

29. >>>>

30. >>>> >>>>

31. >>>>

32. >>>>
49 Здесь уместно напомнить, что RePEc (Research Papers in Economics) – объединение добровольцев-волонтёров из 102 стран, занимающихся распространением исследований в области экономики и смежных наук. Создана и поддерживается децентрализованная библиографическая база данных рабочих документов, журнальных статей, книг и программных компонентов. Собранные метаданные предоставляются пользователям.
50 Система Соционет свободно доступна пользователям с 2000 г. Она формирует виртуальную научную среду в духе Открытой Науки для создания и использования информационных ресурсов и сервисов, адресованных профессиональным научным сообществам. Все ресурсы и сервисы научной информационной системы Соционет бесплатны для пользователей.
51 Разработка системы Соционет финансируется различными фондами и организациями. С 2000 по 2007 год это были гранты Фонда Форда и Европейской комиссии, затем – гранты и помощь от российских организаций. До 2006 г. хостинг для системы Соционет предоставлял ИЭОПП СО РАН. После этого хостинг осуществляет ЦЭМИ РАН.
52 Опираясь на работы С. И. Паринова, рассмотрим краткую историю эволюции Соционет.
53 В статье [20] автор обращает внимание, что в конце прошлого столетия сложилась ситуация, когда нужная информация в сети теоретически доступна всем пользователям, но практически часто ей сложно было воспользоваться из-за увеличения объёма технической работы для контроля содержания расширяющегося множества полезных сайтов. Интернет-технологии того времени (Yahoo, Altavista и др.) эту проблему не решали, потому что они не гарантировали индексирование содержания всех важных для пользователя сайтов с нужной оперативностью. Появляющиеся технологии «2-го поколения информационного пространства» позволили создавать сервисы, гарантирующие пользователям более высокий уровень информированности о сетевых событиях, на которые им необходимо реагировать. Помочь профессионалам, работающим в различных областях общественных наук (экономика, социология, политология, история и т.д.), сформировать персональное информационное пространство призвана система Соционет. В информационное пространство (ИП) интегрируются такие локальные сообщества как исследовательские коллективы, учебные кафедры и другие структуры, создающие онлайновые ресурсы на своих сайтах. «В текущей версии системы Соционет персональный сетевой робот-ассистент позволяет пользователю организовать непрерывный мониторинг входного информационного потока в ИП и доставку результатов своему хозяину. Робот отбирает «хозяину» для просмотра только то, что соответствует спецификации, заданной профилем интересов, и таким образом уменьшает опасность информационной перегрузки пользователя. Наряду с этим робот может взаимодействовать с аналогичными роботами других пользователей для поиска полезных контактов, проведения подготовительной работы для организации прямых взаимодействий между людьми, координации деятельности «хозяина» с остальными членами сообщества и т.п.». Автор предполагает, что «в ближайшие годы большая часть членов профессионального сообщества будет иметь персональных информационных роботов так же, как сейчас они имеют собственные сайты». Такое сообщество взаимодействующих между собой персональных роботов возьмёт на себя существенную часть технической работы по организации и поддержанию взаимодействий между людьми, а также для координации деятельности в рамках общей системы распределения труда. И долгосрочная цель проекта Соционет представляется ему как конструирование и построение инфраструктуры сообщества персональных информационных роботов, обслуживающих специалистов по общественным наукам.
54

В публикации 2003 года34 автор характеризует Соционет как механизм виртуальной интеграции существующих в интернете разнородных информационных ресурсов, по общественным наукам, децентрализованных как по их расположению на серверах различных организаций, так и по форме ответственности за их содержание. В ежедневно пополняемой и обновляемой базе данных системы из описаний различных типов информационных ресурсов, создаваемых специалистами по общественным наукам в разных странах мира, более 90 % относятся к экономике. Помимо полного доступа к архиву RePEс, Соционет представляет собственную базу данных с описаниями электронных публикаций на русском языке по общественным наукам. Среди оригинальных сервисов для работы с этой базой имеются средства навигации и поиска по имени автора и ключевым словам. В Соционет встроен открытый архив для свободной публикации электронных версий научных материалов: исследователи могут получать из него материалы, создавать на их основе свои и помещать их обратно в это же ИП. Личная зона позволяет пользователю создать персонального информационного робота, предназначенного для уменьшения информационной перегрузки пользователя в случае большого потока новых поступлений.

55

Ещё через несколько лет старый образ системы Соционет – «информационное пространство + личная зона» – эволюционирует в новый: социальная сеть участников профессиональной деятельности в областях науки и образования. Одно из следствий этого – система Соционет вышла за пределы общественных наук. В ней появилась дисциплина «Информатика»35. Наиболее активными пользователями Соционет стали 29 институтов Отделения общественных наук РАН (ООН РАН), для которых система Соционет в том числе играет роль шлюза для передачи данных в Единое научное информационное пространство (ЕНИП) РАН. В межинститутскую группу Соционет вошли представители всех институтов ООН РАН в рамках реализации программы «Открытый доступ к результатам исследований» (ОДРИ), инициированной в 2006 г.36 Институты ООН РАН активно участвуют в программе «Информатизация» Президиума РАН, цели которого характеризуются следующим образом: «…инициатива по организации ЕНИП РАН призвана помочь научным коллективам сделать ряд шагов в направлении интеграции разнородных научных информационных и программных ресурсов отдельных научных учреждений, предоставления пользователям более эффективных средств интеграции и поиска информации, научной коммуникации, сотрудничества и совместной работы». Основным проектом, на котором основывается реализация программы ОДРИ, является Соционет. К февралю 2007 г. институты ООН РАН создали свои онлайновые репозитории и выложили в открытый доступ в рамках профессионального информационного пространства Соционет около 30 тысяч материалов, включая 41 профиль 32 организаций (подразделений), 466 профилей учёных. Практически все институты ведут ленты новостей, коллекции статей своих сотрудников, описания значимых опубликованных материалов (книги и монографии), авторефераты защищаемых диссертаций и т. п.

56

Вернёмся к тексту 2015 года37. В 2008-2009 годах начал активно использоваться термин «открытая наука» (Open Science). Это стало следствием осмысления научным сообществом важных изменений, происходящих в практике научной работы и в научных коммуникациях под влиянием новых информационных технологий. При этом цели Открытой Науки определялись следующим образом:

  • прозрачность в методологии экспериментов, наблюдений и сбора данных;
  • публичная доступность и повторное использование научных данных;
  • публичная доступность и прозрачность научных коммуникаций;
  • использование онлайновых средств для поддержки научного сотрудничества.
57 Это означает, что научные исследования должны проводиться таким образом, чтобы все желающие могли способствовать им или участвовать в них; при этом создаваемые исследовательские данные, лабораторные заметки и т.п. должны быть свободно доступны для использования, распространения и воспроизведения. Научные работы должны быть свободно доступны, как только автор сочтёт, что они готовы; оценка работы должна начинаться с момента, когда она становится доступной, и продолжаться, пока это имеет смысл; процесс оценки должен быть полностью открытым, и каждый должен иметь возможность в этом участвовать; оценка работы должна быть комплексной и включать такие факторы, как обоснованность, важность, направленность, этика и многие другие; и т. п.
58 По состоянию на май 2015 г. общедоступная научная информационная система Соционет была единственной, предлагающей пользователям функциональность, основанную на реализации всех пяти требований Открытой Науки:
  • авторы могут без ограничений самоархивировать свои научные выводы и выполнять таким образом требование открытого доступа к результатам исследований;
  • учёные могут выражать свое профессиональное мнение о доступных в Соционет материалах, заслуживающих внимания;
  • авторы могут для всех своих публикаций указать, в каком качестве ими были использованы (процитированы) источники из списка литературы;
  • авторы могут получать email-уведомления обо всех случаях создания отношений (профессиональное мнение или использование) с их публикациями и публично реагировать на эти действия, при этом система Соционет информирует читателей о содержании этих открытых коммуникаций;
  • система Соционет собирает разнообразную статистику о действиях учёных и генерирует статистический портрет для каждого из них с использованием актуальных данных о текущей научной результативности и научной репутации учёного.
59 В Соционет поддерживаются бинарные ориентированные связи двух видов между информационными объектами [18]:
  • предопределённые, которые исходно включены в метаданные информационных объектов (например, связи между организацией и ее сотрудниками – авторами представленных в системе информационных объектов, между информационными объектами и их авторами и т.д.);
  • созданные пользователями системы независимо друг от друга интерактивно в онлайновом режиме (например, связи между родственными публикациями, комментарии или оценки публикаций и т.д.).
60 Автор связей второго вида явным образом декларирует их семантику. Он использует для этого встроенную в систему таксономию научных отношений. В системе Соционет она включает классы, которые характеризуют отношения между объектами – участниками связи, свойственные научной деятельности. Накапливание таких данных позволяет получить более содержательную статистику об использовании результатов исследований по сравнению с традиционным подходом, основанном на данных о цитированиях. Описанные средства позволяют исследователям представить научному сообществу:
  • свои мнения об отношениях между научными результатами, обсуждаемыми в некоторых публикациях, и результатами собственных работ или работ других авторов;
  • оценки содержания публикаций, доступных в среде системы;
  • информацию о характере использования источников, указанных в списках литературы своих публикаций;
  • информацию о взаимосвязях между версиями собственных публикаций и/или их компонентами;
  • мнения об оценках других исследователей относительно представленных в системе публикаций;
  • рекомендации авторам прочитанных публикаций, представленных в системе, направленные на развитие и/или улучшение этих публикаций;
  • оценки своего вклада в создание коллективных публикаций;
  • комментарии, аннотирующие фрагменты собственных публикаций или публикаций других авторов.
61 Соционет автоматически генерирует и ежедневно обновляет публичные статистические показатели, характеризующие отдельные публикации, каждого из зарегистрированных авторов, а также организаций, с которыми авторы аффилированы. Для каждой публикации генерируется статистика, характеризующая количество ее скачиваний и просмотров, а также всех её входящих и исходящих связей, в том числе оценочных и описывающих способы использования в других работах, дифференцированно по классам таксономии связей. Для каждого автора генерируются показатели его публикационной активности: количество публикаций, количество исходящих связей его профиля для каждого класса таксономии, агрегированная статистика входящих и исходящих связей его публикаций и т.п.
62

Как указано на сайте системы38, Соционет адресована трём категориям пользователей:

  • читатели - учёные, преподаватели и студенты, собирающие информацию по своей тематике и отслеживающие появление новых публикаций, соответствующих их научным интересам;
  • авторы, желающие ознакомить коллег со своими научными результатами;
  • разработчики - создатели научных информационных ресурсов и онлайновых сервисов для научно-образовательного сообщества.
37. >>>>
63 Читатели имеют неограниченный доступ к информационным ресурсам системы: всё, что создают в ней авторы и разработчики, становится частью общего информационного пространства. Соционет предлагает читателям географически распредёленную базу данных научных публикаций по различным дисциплинам, уникальную по размеру, составу и механизмам формирования и обновления. В дополнение к таким обычным навигационным средствам, как оглавления и поиск в базе данных, в Соционет есть «персональный информационный робот», автоматически отслеживающий новые поступления в соответствии с интересами пользователя. Авторы могут использовать средства Соционет для публикации отдельных материалов в коллекциях открытого архива Соционет, а также для создания разнообразных коллекций научных материалов. Разработчикам система Соционет предлагает открытую платформу для конструирования новых систем. Платформа включает инструментальные средства для разработки информационных ресурсов (коллекций), интегрированных с RePEc/Соционет и международной инфраструктурой Открытых Архивов, а также некоторые средства для разработки онлайновых сервисов, распространяющихся на всю базу данных системы Соционет. Платформа для разработки сервисов находится в процессе постоянного развития и формирования. Использование платформы Соционет при создании коллекций научных материалов имеет ряд преимуществ. Например, после того, как коллекция включена автором в состав системы Соционет, для её пользователей автоматически начинают работать многообразные сервисы RePEc и Соционет, что избавляет авторов коллекций от необходимости разработки собственных поисковых, навигационных и прочих сервисов.
64 Система Соционет исходно состоит из трёх основных компонент:
  • Механизм виртуальной интеграции разнородных информационных ресурсов, расположенных на различных серверах и принадлежащих разным владельцам. Его работа скрыта от глаз, наиболее заметным для пользователей проявлением работы данного механизма является ежедневная смена данных о количестве новых поступлений в систему.
  • Средства навигации по информационному пространству, возникшему в результате виртуальной интеграции ресурсов и ежедневно актуализируемому при помощи соответствующего механизма.
  • Личная зона Соционет – персональное рабочее место учёного, преподавателя и студента, интегрированное в профессиональное информационное пространство. Здесь собраны персональные инструменты, позволяющие «хозяевам личной зоны» публиковать отдельные документы, создавать коллекции, конструировать личные сайты (на основе доступных в Соционет материалов и сервисов), а также создавать и пополнять тематические подборки публикаций. Здесь же находится меню настройки персонального информационного робота.
65 В последние годы в систему была добавлена четвёртая компонента – средства создания авторизованными пользователями семантических связей между информационными объектами научного информационного пространства Соционет.
66

Открытый доступ к научным знаниям

67

Выше отмечалось, что система Соционет удовлетворяет требованиям Открытой науки. Рассмотрим это подробнее. С. И. Паринов перечисляет основные требования к открытой науке39:

  • открытый доступ к результатам исследований;
  • публичное обсуждение результатов исследований;
  • открытое использование результатов исследований;
  • открытые научные коммуникации;
  • открытые данные.
38. >>>>
68 В Соционете авторы могут предоставлять открытый доступ к своим научным результатам, а коллеги – выражать своё мнение о работе. Для всех своих публикаций авторы могут указать, в каком качестве ими были использованы процитированные источники. Система собирает статистику о действиях учёных, генерируя для каждого статистический портрет, включающий данные о текущей научной результативности и репутации.
69

Открытый доступ или Open Access (OA) понимается как система научной коммуникации, обеспечивающая свободный, непрерывный и онлайновый доступ к научному произведению, размещённому автором или организацией для общего доступа. Это подразумевает возможность не только бесплатно прочитать статью, но также в дальнейшем распространять её и перерабатывать без каких-либо ограничений. Открытыми архивами считаются базы данных, доступные в интернете. Из движения за открытый доступ к научным публикациям и к данным, на которых они основаны, а также за открытое обсуждение процесса исследования возникло такое явление как Открытая наука40, являющаяся логическим продолжением идеи открытого доступа. Это также стало реакцией на высокие подписные цены научных журналов.

70 Традиционная издательская индустрия значительно ограничивает возможности учёных по обмену информацией в интернете, но исследователи находят пути для обмена результатами исследований (для этого служат, например, такие сервисы, как Academia.edu или репозитории типа ArXiv.org, см. ниже).
71

Заметим, что первый закон, защищающий права автора и издателя («Статут королевы Анны»41) появился в 1710 году [21], в то время как научные журналы начали издаваться раньше появления копирайта. Французский «Journal des savants»42 и английские «Философские труды Королевского общества» (Philosophical Transactions of the Royal Society)43 выходят с 1665 года44. В настоящее время в разных странах действуют законы, увеличивающие сроки охраны авторских прав до 70 лет, а в некоторых и на более длительные периоды (95 лет в США для служебных произведений, 99 лет в Мексике, 75 лет в Гондурасе и Кот-д’Ивуаре). Такие сроки ставят под угрозу свободный доступ к объектам общего культурного наследия, лишают граждан возможности пополнить свой культурный багаж и познакомить детей с историей. Между тем, согласно статистике, книги дают больше прибыли, когда переходят в общественное достояние [22].

72

Открытый доступ к научной информации – давняя мечта учёных. Из множества высказываний на эту тему приведём два. Джон Десмонд Бернал (1901-1974), книга «Социальная функция науки» (Social Function of Science, 1939, MIT Press, p.249): «Мы мечтаем о таком типе организации, когда вся имеющая отношение к делу информация будет доступна каждому научному работнику, причем количество и состав такой информации окажутся в прямой зависимости от темы исследования»45. Фредерик Жолио-Кюри (1900-1958), лекция «Наука и благоденствие человечества», 1946: «Всякая попытка ограничения или остановки распространения научной информации представляет исключительно серьёзную опасность для прогресса науки и для цивилизации»46.

44. >>>>

45. >>>>
73

Мечты стали реализовываться, когда появился интернет, и научные статьи появились в сети. Старая модель издательского бизнеса, основанного на доходах от подписки, постепенно переставала работать, зато набирала силу модель, основанная на открытом доступе. Теперь за статью платил не читатель, а автор, заинтересованный в том, чтобы с его работами ознакомилось как можно больше людей. Редакция журнала обеспечивала рецензирование, а читатель получал статьи бесплатно. Развитию открытого доступа способствовали и власти: многие правительства требовали публиковать в открытом доступе результаты исследований, выполненных на средства налогоплательщиков47. Так, в Великобритании действует проект в поддержку репозиториев Repositories Support Project48, а также государственная программа Research Assessment Exercise49, в которой в числе прочих показателей научной результативности используются элементы онлайновой наукометрии. В Австралии есть государственная программа поддержки университетов в создании репозиториев открытого доступа Australian Scheme for Higher Education Repositories, по которой выделяется 25.5 миллиона долларов на три года для поддержки создания и обновления цифровых репозиториев50.

46. >>>>

47. >>>>

48. >>>>

49. >>>>
74

Официально термин «открытый доступ» был введён в феврале 2002 года на Будапештской конференции по открытому доступу и закреплён в соответствующей Инициативе (Budapest Open Access Initiative)51. Суть понятия сводится к следующему: бесплатный (free), немедленный (immediate), постоянный (permanent), полнотекстовый (fulltext), онлайновый (online) доступ к научным публикациям. Таким образом, модель предполагает такой доступ к материалам, который не ограничен ничем, кроме технологических возможностей пользователя: есть выход в интернет – есть доступ52.

75 Открытый доступ – это технология предоставления полных текстов изданий через интернет, дающая беспрепятственный, свободный доступ к научным публикациям, это среда научно-образовательных коммуникаций. У пользователей должна быть возможность копировать, использовать, распространять, передавать и публично демонстрировать произведение и создавать производные работы в любой цифровой среде при надлежащем упоминании автора.
76

В развитии открытого доступа есть разные тенденции. Депонирование, или самоархивирование (так называемый «зелёный путь» или green OA), заключается в том, что авторы публикуют свои статьи в традиционных журналах, одновременно с этим размещая их в открытом доступе в каком-либо открытом источнике в интернете (на сайте своей организации, личном сайте, в социальных сетях или централизованном репозитории). Первый открытый репозиторий arXiv53 был основан в 1991 году Полом Гинспаргом (Paul Ginsparg) на базе Лос-Аламосской национальной лаборатории. Сейчас он содержит порядка двух миллионов статей по восьми предметным областям, количество загрузок с сайта исчисляется миллиардами. Отметим: именно в «Архиве» в 2002-2003 гг. Г. Я. Перельман опубликовал54 доказательство сформулированной ещё в 1904 г. гипотезы А. Пуанкаре и более общей гипотезы геометризации У. Тёрстона. ArXiv – товарный знак Корнельского университета.

77

Первая публикация Г. Я. Перельмана на сайте arxiv.org

78

Экономический раздел «Архива» Economics55 с подразделами Эконометрика, Общая экономика и Теоретическая экономика действует с сентября 2017 года и содержит более 3 000 статей.

54. >>>>
79

В библиотеке по экономике RePEc56 (Research Papers in Economics) представлено около 3.5 миллионов исследовательских материалов из 3 600 журналов, издающихся в более чем 100 странах.

55. >>>>
80 Принципы RePEc, предусматривающие набор правил для публикации и обмена документами в интернете, были предложены Томасом Кричелом (Thomas Krichel) в мае 1997 г.
81

С 2004 года существует PubChem57база данных химических соединений и смесей, являющаяся общественным достояние м. Она обслуживается Национальным центром биотехнологической информации США (NCBI). Более 80 баз данных вносят вклад в рост PubChem. База данных PubChem в разделе «Соединения» (PubChem Compounds) содержит более 111 миллионов записей – описаний уникальных химических структур; в разделе «Вещества» (PubChem Substance) – свыше 277 миллионов описаний образцов смесей из различных источников. К этому добавляется информация о 33 миллионах научных публикаций и 28 миллионах патентов58.

56. >>>>

57. >>>>
82

Архив CogPrints59 по психологии, лингвистике и нейронаукам поддерживается сотрудниками университета Саутгемптона. Он был запущен в 1997 г. и содержит более 2 000 свободно загружаемых статей.

58. >>>>
83 Сетевая справочная библиотека по компьютерным наукам (Networked computer science technical reference library, NCSTRL) в настоящее время не поддерживается.
84

Основанный в 2016 году в Университете Мэриленда открытый архив социальных наук SocArXiv60 предоставляет социологам бесплатную некоммерческую платформу открытого доступа для загрузки рабочих документов, препринтов и опубликованных работ. По состоянию на апрель 2021 года в хранилище хранится почти 8 000 статей по всем областям социальных и поведенческих наук, гуманитарных наук, искусств, образования и права61. В том же 2016 году открыт PsyArXiv62 – репозиторий препринтов по психологическим наукам, созданный под влиянием arXiv. Служба позволяет загружать рукописи до их рецензирования. С 2017 г. PsyArXiv индексируется в Google Scholar, он содержит порядка 20 000 препринтов.

59. >>>>

60. >>>>

61. >>>>
85

Технологическим партнером обоих проектов является Центр открытой науки, Center for Open Science (COS). Эта некоммерческая технологическая организация начала работу в январе 2013 года с целью «повысить открытость, целостность и воспроизводимость научных исследований». Начиналась она как два лабораторных проекта для исследований в области биологии рака и психологии. Стартап-грант предоставил фонд Лауры и Джона Арнольдов, LJAF. Подводя итоги первых лет работы Центра, его исполнительный директор пишет63: «То, что начиналось как небольшой проект, превратилось в команду из более 50 сотрудников; у нас есть набор бесплатных открытых продуктов и услуг для поддержки исследователей, журналов, спонсоров и учреждений; мы установили десятки вариантов сотрудничества с представителями разных дисциплин и сообществ. Среди конкретных достижений – более 4 800 журналов, подписавших руководство по продвижению прозрачности и открытости. Open Science Framework имеет базу из 45 000 пользователей с приростом 150 в день и поддерживает более 86 000 проектов и 9 700 регистраций. С помощью сообщества мы создали интерфейсы OSF для препринтов, институциональных репозиториев и собраний, чтобы облегчить самоуправление и общую инфраструктуру». Упомянутая платформа Open Science Framework (OSF) – это флагманский продукт COS, веб-приложение с открытым исходным кодом для поддержки открытого сотрудничества в научных исследованиях на протяжении всего жизненного цикла проекта. Этот бесплатный инструмент управления проектами изначально использовался для работы над проектом воспроизводимости психологических исследований, затем стал междисциплинарным. Он позволяет ученым повышать эффективность и результативность исследований64.

62. >>>>

63. >>>> >>>>
86

Заявленный как открытый депозитарий препринтов и научных статей по юриспруденции LawArXiv (ещё один проект OSF), по словам создателей, «больше не может принимать новые заявки. Существующий контент в LawArXiv останется доступным»65.

87

PubMed66, англоязычная текстовая база данных медицинских и биологических публикаций, создана в январе 1996 г. Национальным центром биотехнологической информации (NCBI) США на основе раздела « биотехнология » Национальной медицинской библиотеки США (NLM). Ключевой составляющей PubMed является Medline . PubMed содержит более 33 миллионов ссылок на биомедицинскую литературу из Medline, полнотекстовые статьи из журналов по естественным наукам и онлайн-книг. Документировано около 3 800 биомедицинских изданий. Ежегодно база данных PubMed увеличивается на 500 000 документов.

65. >>>>
88

В 2019 году специалистами из лаборатории Колд - Спринг - Харбор (CSHL), медицинского издательства BMJ и Йельского университета был основан сайт medRxiv67. Бесплатный онлайн-архив и сервер принадлежит и управляется CSHL. Он предназначен для распространения полных, но неопубликованных рукописей (препринтов) о медицинских исследованиях, в том числе клинических испытаниях, а также в области смежных наук о здоровье. С февраля 2020 года medRxiv индексируется в PubMed; сейчас он стал одним из основных источником распространения исследований по COVID - 19 : из 20 тысяч статей по COVID три четверти относятся к medRxiv. Ещё 4 тысячи содержит bioRxiv , бесплатный электронный архив научных статей и препринтов по биологии, созданный в 2013 г. в той же нью-йоркской лаборатории CSHL. Авторы публикуют на bioRxiv ранее не публиковавшиеся работы, чтобы утвердить приоритет. Перед публикацией рукописи не рецензируются, однако проходят первичную проверку на плагиат. Большинство представленных рукописей в итоге публикуются в рецензируемых журналах. На ноябрь 2021 года на портале размещено более 140 000 работ.

66. >>>>
89

На основе студенческих и аспирантских работ в 1996 г. была создана Сетевая библиотека авторефератов и диссертаций (Networked Digital Library of Theses and Dissertations, NDLTD)68. В архиве NDLTD уже более 6 миллионов электронных диссертаций.

67. >>>>
90

Национальный центр обмена информацией по науке, технологиям и праву при Юридическом колледже Университета Стетсона (National Clearinghouse for Science, Technology & the Law)69 в 2005 г. представил библиографическую базу данных судебных исследований, которая «поможет найти тысячи ресурсов о судебной науке и технологиях, праве научных доказательств и свидетелях-экспертах и многом другом». Полных текстов документов в базе нет.

68. >>>>
91 Основные проблемы «зелёного пути» — децентрализованность научных архивов, которая сокращает шансы исследователей найти нужный материал, и неосведомлённость авторов о возможностях открытой публикации.
92

Альтернатива «зелёному пути» – «золотой путь», gold OA. Он состоит в публикации авторами своих работ в журналах открытого доступа. Модель финансируется, как правило, самими авторами, которые платят за публикацию статей. Наиболее распространённый способ монетизации открытого журнала - «плата за публикацию» (Article-processing charges или APC). В этой связи назовём проект, запущенный в 2012 г., – блок рецензируемых журналов открытого доступа в области биологических, медицинских и экологических наук PeerJ70. С недавних пор там появились журналы по химии и компьютерным наукам. Они индексируется в международных базах. Стоимость публикации $1 195 (по химии – бесплатно). По другой модели учёный вносит единовременный платёж за пожизненную возможность публиковаться (Lifetime Membership). Взнос в $499 даёт право на публикацию 5 статей в течение каждого года. Первый вариант удобнее, если у статьи много авторов.

93

Журналы открытого доступа семейства PLoS71 (Public Library of Science) выпускаются уже более 20 лет (с 2001 г.), и за это время стали очень популярны среди учёных, публикующихся в области медицины и биологии. Все материалы этих журналов распространяются по открытой лицензии CC-BY, представлены в формате HTML и индексируются внешними поисковыми системами. Журналы включены в наукометрические базы Scopus, Web of Science, PubMed Central, имеют высокий импакт-фактор, а также развитые инструменты для управления цитированием, социального продвижения научных работ и их публичной оценки. Стоимость публикации исследовательской статьи начинается с $2 100.

94

Одно из самых известных и крупных издательств открытого доступа – BioMed Central72 (Великобритания), созданное в 1999 году и выпускающее около 300 рецензируемых журналов, публикующих статьи в области науки, техники, инженерии и медицины. В октябре 2008 года BioMed Central был приобретен Springer Science + Business Media. Среди ведущих журналов BioMed Central - BMC Biology , BMC Medicine , Genome Biology, Genome Medicine.

71. >>>>
95

Ещё один тип платформ для размещения научных материалов – специализированные социальные сети. В сфере научной коммуникации одной из крупнейших является социальная сеть сотрудничества учёных Academia.edu73. Она была запущена в сентябре 2008 г. и насчитывает более 170 миллионов пользователей, которые добавили на сайт свыше 29 миллионов документов. Academia.edu участвует в движениях «открытая наука» и «открытый доступ», обеспечивая рецензирование статей в процессе их создания. От конкурентов среди научных сетей (например, ResearchGate) данный сайт отличается тем, что на нём можно регистрироваться не только студентам и сотрудникам вузов, но и независимым исследователям74.

72. >>>>

73. >>>>
96

Сайт www.academia.edu

97 Руководитель проекта «КиберЛенинка» Д. А. Семячкин приводит (и развенчивает) распространённые мифы об открытом доступе [23]. Среди них, например, такие: «Доступ к научным знаниям не является проблемой»; «Журналы открытого доступа не рецензируются»; «Журналы открытого доступа имеют низкий импакт-фактор»; «Статьи в открытом доступе не защищены авторским правом»; «Открытый доступ с моделью оплаты автором за свою публикацию угрожает целостности научной системы». Автор полагает, что государству необходимо менять схему финансирования публикации научных исследований и переходить от дотаций журналам к дотациям учёным, чтобы они сами выбирали площадку для публикации. Ссылаясь на свой опыт, он утверждает, что интерес со стороны издательств к практике открытого доступа растёт.
98

Перечисленные Д. А. Семячкиным мифы дополняются в [24]. «Если статья будет открыто опубликована в интернете, это увеличит риск плагиата»; «Публикация в открытом доступе стоит слишком дорого, и обычному учёному никогда не найти таких денег». Значительно раньше список из 25 различных заблуждений, связанных с открытым доступом75, опубликовал Питер Субер76 – директор Гарвардского проекта открытого доступа, директор Гарвардского офиса по научным коммуникациям. Другой его текст «Open Access Overview»77 описывает основные аспекты, проблемы и противоречия открытого доступа. Имеется русский перевод78.

74. >>>>

75. >>>>

76. >>>>

77. >>>>
99

Вернёмся к программе «Открытый доступ к результатам исследований» (ОДРИ) в ООН РАН. Ещё в 2008 году на семинаре «Научное знание в цифровую эпоху: открытый доступ и открытые электронные архивы» С. И. Паринов сформулировал её цели и задачи:

  • формирование e-Science в институтах отделения как способ повышения эффективности научной деятельности;
  • обучение людей в институтах методам электронных публикаций;
  • создание открытых архивов во всех институтах и их интеграция с онлайновой инфраструктурой (Соционет, ЕНИП и др);
  • внедрение в институтах практики обязательного электронного депонирования результатов исследований, применения онлайновой наукометрии в стимулировании сотрудников и др.79
78.
100 В выигрыше оказываются все стороны процесса. Это даёт учёному
  • лучшие возможности профессиональной самореализации,
  • оперативную сигнальную систему об отношении научного сообщества к результатам его исследований;
исследовательской организации
  • усиление правильных мотиваций для сотрудников,
  • реалистичные показатели результативности работы подразделений и отдельных учёных;
научному сообществу
  • повышение эффективности и «прозрачности» расходования общественных фондов,
  • детальную наукометрическую картину структурных и динамических изменений в науке.
101 Соционет позволяет создавать персональное организационно независимое онлайновое рабочее место (ОРМ), дающее учёным ряд полезных возможностей, среди которых
  • самоархивирование статей и других материалов в существующие коллекции (информационные каналы и др.);
  • создание и пополнение коллекций статей и других материалов;
  • профессиональная самопрезентация (организации и/или учёного);
  • создание новостных каналов;
  • продвижение результатов исследований (электронное цитирование, визуализация профессионального влияния и др.);
  • создание различных тематических связей между материалами разных авторов и из разных открытых архивов;
  • развитие профессиональной социальной сети.
102 Открытый архив организации формируется автоматически на основе сведений об организации, указанных в её профиле; заполнения стандартных полей ОА; коллекций, указанных в связях от профиля организации. Он обновляется автоматически по мере обновления коллекций и данных об организации.
103

В последние годы С. И. Паринов активно занимается проблемами информационных технологий открытой науки как части цифровой экономики. Так, в 2020 г. им разработана методика анализа отношений научной кооперации на базе содержания контекстов цитирований научных публикаций. При традиционном подходе возможны ситуации, когда статья с грубыми ошибками или заблуждениями вызывает активный отклик и получает высокий индекс цитирования, а, следовательно, видимость высокой научной значимости. Дело в том, что сложившиеся методы наукометрии опираются на библиографические ссылки, которые не несут информации о целях цитирования, мотивах цитирующего автора и его мнении. Онтологическое аннотирование связей цитирования в текстах научных публикаций и использование определённой с их помощью семантики связей создаёт качественно новые возможности для наукометрических исследований и позволяет получать новые результаты, полезные для научного сообщества80. В качестве нового источника наукометрических данных рассматриваются коллекции семантических связей между информационными объектами из контента системы.

79. >>>>
104 В системе Соционет реализован экспертный «ручной» метод создания семантических связей как самостоятельных информационных объектов. Пользователи получают представление о структуре мнений ученых по поводу объектов системы; вместе с тем обеспечивается семантическая навигация по контенту, которая создаёт условия для доступа пользователей к информационным ресурсам системы. Ещё одна особенность такого подхода: он открывает возможности для новых форм научной деятельности в виртуальной среде онлайновой системы. Электронная библиотека, в которой реализован обсуждаемый подход, фактически представляет собой социальную сеть, в которой совместно действуют представители научного сообщества. Результат их деятельности – явно высказанные мнения о научных публикациях, а также развивающаяся семантическая структура контента системы, позволяющая использовать новые методы наукометрических исследований. Представление семантических связей в системе как самостоятельных информационных объектов позволяет декларировать мнения о них точно так же, как и относительно других информационных объектов. Такая поддержка мнений о мнениях образует своеобразный дискуссионный форум в среде системы [25].
105 Одним из направлений развития Открытой науки является совершенствование инструментов научного цитирования. Это подразумевает превращение цитирований в текстах научных публикаций в интерактивные элементы, которые бы обеспечивали прямые коммуникации между двумя группами ученых: цитирующими и цитируемыми авторами [26].
106 Улучшение методов оценки научной результативности ученых и исследовательских организаций позволит изменить мотивации ученых, созданные традиционными методами оценки, основанными на индексах цитирования. Вместо действующей мотивации к росту количества публикаций и их цитирований учёные будут заинтересованы развивать научную кооперацию и стремиться к лучшему использованию их научной продукции.
107 Выражаем признательность С. И. Паринову, прочитавшему этот текст и сделавшему ряд полезных замечаний.

References

1. Akinshin A.A., Il'menskij M.D., Lyapicheva N.G., Polyak Yu.E. Vklad TsEhMI v stanovlenie runeta. Infrastrukturnye proekty. DOI 10.33276/S265838870018846-3

2. Il'menskij M.D., Polyak Yu.E., Stavchikov A.I. Traditsii M.G.Rappoporta v rabote laboratorii setevykh informatsionnykh resursov TsEhMI // Ehkonomika i matematicheskie metody. –2013. –T. 49. –Vypusk № 3. C. 123-126 . URL: https://emm.jes.su/s042473880000616-6-1-ru-82

3. Kulikov V.V. Kak my delali «AU!» // Komp'yuterra №28 (257), 1998

4. Mirovaya set' Internet: primenenie v nauke i biznese (pod red. Yu.M.Gornostaeva i Yu.E.Polyaka) // «Tekhnologii ehlektronnykh kommunikatsij», t.59. M.: Ehko-Trendz, 1994

5. Vovchenko T.O., Kuz'min S.K., Polyak Yu.E. Informatsionnye resursy interneta (kratkij spravochnik) // Tekhnologii ehlektronnykh kommunikatsij, tom 68. M.: Ehko-Trendz, 1996

6. Polyak Yu.E., Sigalov A.V. Zhyoltye stranitsy Internet’ 98. Russkie resursy. SPb: «Piter», 1998. 75 p.l.

7. Russian Internet Directory. 2nd ed. (Editors: Yuri Polak, Yuri Gornostaev). ICSTI, Moscow, 1998

8. Polyak Yu.E. «AU!» - pervyj million poseschenij // Komp'yuter v shkole №4, 1998

9. Polak Yuri. Information search in Russian Internet on the eve of 2000 // Internet: Technologies and Services. The 1st IEEE International Conference and Exhibition, 1999

10. Ranganatan Sh .R . Klassifikatsiya dvoetochiem. Osnovnaya klassifikatsiya. Per. s angl. pod. red. T.S .Gomolitskoj i dr. - M .: GPNTB SSSR, 1970.

11. Foskett A.C. The future of faceted classification // The future of classification, ed.by R.Marcella and A.Maltby, Aldershot: Gower, 2000, 69-80.

12. Parakhina O.V. Katalogi internet-resursov i ikh mesto sredi poiskovykh instrumentov // Materialy konferentsii predstavitelej regional'nykh nauchno-obrazovatel'nykh setej «RELARN-2001». SPb, 2001. S. 93-96. http://www.relarn.ru/conf/conf2001/report_34.html

13. Kalyonov N.E., Pogorelko K.P., Serebryakov V.A., Sotnikov A.N. Ehlektronnaya biblioteka «Nauchnoe nasledie Rossii»: sostoyanie i perspektivy razvitiya // Nauchnyj servis v seti Internet: trudy XVIII Vserossijskoj nauchnoj konferentsii (19-24 sentyabrya 2016 g., g. Novorossijsk). –M.: IPM im. M.V.Keldysha, 2016. –S. 148-151. – doi:10.20948/abrau-2016-27 https://keldysh.ru/abrau/2016/27.pdf

14. Polyak Yu.E. Osobennosti monitoringa setevykh nauchnykh resursov (EhB «Nauch¬noe nasledie Rossii») // XIX konferentsiya predstavitelej regional'nykh nauch¬no-obrazovatel'nykh setej «RELARN-2012». Nizhnij Novgorod, 2012. S.19-21.

15. Polyak Yu.E. Setevoe nauchnoe nasledie kak obrazovatel'nyj resurs. // Komp'yuternye tekhnologii v bibliotechno-informatsionnykh sistemakh. Vserossijskaya konferentsiya. Sbornik trudov. Moskva, 2011

16. Gubarev V.S. Ubijstvo RAN: novejshaya istoriya nauki v Rossii. M.: Algoritm; 2014. 208 s.

17. Kalyonov N.E., Kirillov S.A., Sobolevskaya I.N., Sotnikov A.N. Sovremennoe sostoyanie ehlektronnoj biblioteki «Nauchnoe nasledie Rossii» // Trudy NIISI RAN. Matematicheskoe i komp'yuternoe modelirovanie slozhnykh sistem: teoreticheskie i prikladnye aspekty, 2018. T. 8. № 6. S. 166– 169

18. Kogalovskij M.R., Nevolin I.V., Parinov S.I. Razvitie nauchnykh kommunikatsij kak uslovie modernizatsii otsenki nauchnoj rezul'tativnosti // Ehpistemologiya i filosofiya nauki 2017. T. 51. № 1. S. 188– 205

19. Parinov S., Lyapunov V., Puzyrev R. Sistema Sotsionet kak platforma dlya razrabotki nauchnykh informatsionnykh resursov i onlajnovykh servisov // Ehlektronnye biblioteki, Tom 6 № 1 (2003). https://elbib.ru/article/view/222

20. Parinov S.I. Sotsionet.ru kak model' informatsionnogo prostranstva 2-go pokoleniya // Informatsionnoe obschestvo, 2001, vyp. 1, s. 43-45. http://emag.iis.ru/arc/infosoc/emag.nsf/BPA/709c3727bab54cf4c3256c01002d2e6e

21. Polyak Yu.E. Zametki o pervykh ehlektronnykh bibliotekakh. // Ehlektronnye biblioteki, 2021, 24 (5), 944-982. https://elbib.ru/article/view/709/791

22. Zasurskij I.I. Obschestvennoe dostoyanie i avtorskoe pravo. rol' gosudarstva i interesy obschestva v informatsionnuyu ehpokhu // Observatoriya kul'tury, 2015 № 5, s. 32-36. https://observatoria.rsl.ru/jour/article/download/205/358

23. Semyachkin D. A. Otkrytyj dostup k nauke: mify i real'nost'. // Universitetskaya kniga. 2014. Vyp.3. S.66-68. http://www.unkniga.ru/vishee/2905-otkrytiy-dostup-k-nauke-mify-i-realnost.html

24. Trischenko N.D. Otkrytyj dostup k nauke: analiz preimuschestv i puti perekhoda k novoj modeli obmena znaniyami / pod red. I. Zasurskogo. —M.: Assotsiatsiya internet-izdatelej; Kabinetnyj uchyonyj, 2017.200 s. ISBN 978-5-7584-0154-5. https://nauchkor.ru/uploads/documents/583e06b75f1be77312a3fd66.pdf

25. Kogalovskij M.R., Parinov S.I. Novyj istochnik dannykh dlya naukometricheskikh issledovanij // Trudy 15-j Vserossijskoj nauchnoj konferentsii «Ehlektronnye biblioteki: perspektivnye metody i tekhnologii, ehlektronnye kollektsii» —RCDL2013, Yaroslavl'. C.21-31.

26. Kogalovskij M.R. Ontologicheskoe annotirovanie bibliograficheskikh ssylok v nauchnykh publikatsiyakh i ego ispol'zovanie v naukometrii // «Informatsionnye resursy Rossii» №5, 2013. http://www.aselibrary.ru/press_center/journal/irr/irr4925/irr49255567/irr492555675569/irr4925556755695574/

Comments

No posts found

Write a review
Translate