В 2023 году российские ученые впервые останутся без доступа к Scopus и Web of Science. РЦНИ подготовил краткий сравнительный анализ открытых сервисов для научного поиска. Нижеперечисленные сервисы используют контент не только из открытых и общедоступных источников (таких как Crossref, MEDLINE, и т.д.), но также стремятся наладить прямую индексацию издательских платформ и репозиториев.


https://openalex.org

Новый сервис компании OurResearch, которая также известна благодаря запущенным ранее онлайн-сервисам ImpactStory и Unpaywall. Сервис пополняется сведениями из открытых источников и ведет базу данных с 5 типами объектов: публикации (works), авторы (authors), организации (institutions), издания (venues) и понятия (concepts).

В настоящий момент сервис доступен в виде превосходно документированного набора API-сервисов, для которых уже доступны удобные пакеты на языках R и Python.

Уникальные особенности:

Информационные материалы:


https://semanticscholar.org

Активно развивающийся сервис Института искусственного интеллекта Аллена. База данных наполняется метаданными из открытых источников, и получаемыми напрямую от правообладателей.

Исследователям доступны:

Уникальные особенности:

Информационные материалы:


https://www.lens.org

Австралийская открытая база данных, содержащая сведения о публикациях и патентах.

Возможности The Lens:

Информационные материалы:


https://app.dimensions.ai/

Онлайн-ресурс компании Digital Science, предлагающий бесплатную версию для персонального использования.

Уникальные особенности:

Информационные материалы:


https://app.scilit.net/

Бесплатный сервис MDPI, который сочетает в себе функционал индекса научного цитирования и поисковой системы. База данных пополняется сведениями из открытых источников, а также информацией, которую напрямую предоставляют издатели журналов. Сервис Scilit, развивающийся при консультативной поддержке авторитетных экспертов, уже сегодня предлагает широкий выбор инструментов для анализа мировой науки и может представлять интерес для российских исследователей.

Возможности:


Сравнение открытых БД

Уникальный функционал вышеперечисленных баз данных заслуживает особого внимания.

OpenAlex Semantic Scholar (S2) The Lens Dimensions (free) Scilit
Количество публикаций 245 M 208 M 252 M 132 M 152 М
Метаданные из открытых БД (CrossRef, DOAJ, MEDLINE) да да да да да
Метаданные от издателей - да да да да
Индексация препринтов да да да да да
Поиск по DOI да (API) да да да да
Поиск по тексту аннотации или ключевым словам да (API) да да да+ да
Идентификаторы автора ORCID, OpenAlex S2, ORCID ORCID Digital Science, ORCID, ResearcherID, Scopus Author ID ORCID
Поиск по авторам да (API) да да да да
Идентификаторы организации ROR, OpenAlex - ROR ROR ROR
Поиск по названию организации да (API) - да - да
Бесплатный API да да - Dimensions Badge, Metrics API -
Экспорт результатов поиска (формат) JSON из коллекций CSV, JSON XLSX, CSV, VosViewer XLSX
Лицензия для результатов экспорта СС0 (c) и CC BY-NC 4.0   CC BY-NC-SA (c) (c)
Персональные коллекции - да да да -
Функции уведомления (RSS, email, feeds) - emails, feeds email email SciFeed
Экспорт списка процитированной литературы да да да - -
Экспорт списка цитирующих статей да да - - да
Экспорт списка цитирующих патентов - - да - -

Все эти ресурсы отличаются от Scopus и Web of Science отсутствием строгих процедур отбора и, как следствие, более широким охватом научных изданий.

Сравнительный анализ качества метаданных в Lens, Semantic Scholar и OpenAlex показал, что некоторые поля метаданных в открытых источниках заполнены лишь частично, что ограничивает возможность их использования для наукометрических исследований. Вместе с тем, поля содержащие название статьи, аннотацию, имена авторов, идентификаторы и ключевые слова, заполнены в достаточной степени, чтобы рекомендовать эти базы данных в качестве замены Scopus и Web of Science для поиска научных публикаций. Не случайно популярный наукометрический инструмент VosViewer включил Dimensions, Lens, Semantic Scholar и OpenAlex в перечень ресурсов, которые можно использовать в качестве источника метаданных.

Каждый из перечесленных выше онлайн-ресурсов предлагает достаточно уникальный набор функций и удобств, поэтому вопрос «Кто лучший?» мы оставим без ответа.

А какой инструмент самый быстрый?

Скорость индексации

Для ответа на этот вопрос мы собрали 5 наборов статей с участием российских авторов, которые были проиндексированы в Scopus с начала сентября 2022 года в указанные ниже диапазоны дней, между которыми было около 2 недель:

В исследование включили 8917 статей, вышедших в 2020 году или позднее. В период с 16 по 17 декабря в базах данных Dimensions, Lens, Semantic Scholar и OpenAlex был выполнен поиск всех статей.

На иллюстрациях ниже показаны (1) доля публикаций из групп А-Д, присутствующая в открытых базах и (2) суммарное количество цитирований для найденных статей.

Для большей наглядности результаты представлены для следующих подгрупп публикаций:

Количество статей в каждой группе показано в квадратных скобках над соответствующей диаграммой.

Иллюстрация 1

Иллюстрация 1

Иллюстрация 2

Иллюстрация 2

Результаты выполненного экспресс-анализа свидетельствуют о том, что по скорости индексации открытые базы данных вполне сравнимы со Scopus, однако, этот показатель, очевидно, зависит от издателя (издательской платформы).

Совокупная цитируемость статей в исследуемых подгруппах в БД Dimensions и Semantic Scholar выше, чем в остальных базах данных, в т.ч. и в Scopus.

Благодарности

Авторы выражают признательность разработчикам открытого ПО R v4.1.2, RStudio и программных пакетов:


© Российский центр научной информации, текст, дизайн, иллюстрации, 2022.

РЦНИ не несет ответственности за любые последствия, связанные с использованием приведенной выше информации.

Для обратной связи: написать письмо.

Информация для цитирования:

Лутай А.В. Открытые сервисы для поиска научных публикаций./ А.В. Лутай, О.В. Черченко; Российский центр научной информации. – Текст : электронный // РЦНИ : [сайт]. – URL: https://podpiska.rfbr.ru/materials/2022_open_search_solutions/. – Дата публикации: 28.12.2022.