Google Scholar

Сайт: https://scholar.google.com/

Владелец: корпорация Alphabet (Google)

Режим доступа: Бесплатный, открытый, дополнительные платные сервисы отсутствуют

Охват и селективность: По числу индексируемых документов Google Scholar (GS) с большим запасом опережает традиционные WoS и Scopus, что связано с несколькими особенностями. Во-первых, система работает не на основе данных, которые ей отправляют издатели, а путем обхода сайтов поисковым роботом (аналогично обычному Google), который сам собирает и парсит (размечает) метаданные. Никаких требований к качеству контента, помимо того, что он должен быть “научным”, система не предъявляет, никакие эксперты не оценивают журналы перед включением. Более того, включаются не только уже вышедшие научные публикации, но и препринты, постпринты, техническая документация и даже блоги. Например, университет может подключить к GS репозиторий (базу публикаций) своих сотрудников, а отдельные ученые - свои отдельные публикации в PDF.

Такой всеохватный подход помимо очевидных достоинств в плане богатства информации несет и ряд недостатков: в системе есть масса публикаций, не прошедших рецензирование, а нередко и вовсе не научных, что означает, что и метрики (число публикаций, число цитирований) по этой базе очень трудно трактовать содержательно. Кроме того, многоканальная индексация приводит к появлению дублей, когда одна и та же работа представлена в 5-10 разных версиях (препринты, репозитории, выступления на конференциях и семинарах, полноценная статья в журнале, постпринты). GS автоматически группирует такие версии, но этот процесс не всегда проходит удачно, и число публикаций и цитирований в итоге иногда оказывается завышенным.

В целом GS предназначен прежде всего не для наукометрических изысканий, а для поиска научной литературы, и в этом качестве за счет охвата, скорости и удобства работы распространен максимально широко, больше всех других баз мира. Однако эта популярность несет и популярность наукометрических расчетов по GS, которые крайне неоднозначны из-за его всеохватности и непрозрачности.

Возможности выгрузки данных

Веб-интерфейс GS не дает возможность выгружать ни метаданные публикаций, ни аналитику, а API-доступ к системе отсутствует. В результате даже возник рынок платных (и дорогих) “сторонних” API с непонятным юридическим статусом, которые, впрочем, не пользуются популярностью у ученых. Для них больше подойдут бесплатные Publish or Perish (заслуженный десктопный клиент с несколько устаревшим интерфейсом, в последнее время также использует данные Microsoft Academic) и scholarly (модуль python с достаточно подробной документацией). Оба они работают через ваш IP-адрес, так что если грузить через них сразу очень много данных, GS может временно забанить ваш IP.

Тематические классификаторы

Фактически отсутствуют как инструмент поиска и фильтрации, есть только в рейтингах журналов (двухуровневые, вида Chemical & Material Sciences \ Polymers and Plastics) .

Встроенные аналитические инструменты

Таких инструментов фактически всего два: рейтинги источников и метрики для авторов. Первые доступны в разрезах языка публикации и тематик (тематики - только для английского).

Метрики, используемые GS - их собственные разработки на основе индекса Хирша: H5-индекс (индекс Хирша, рассчитанный только по последним пяти годам выхода публикаций) и H5-медиана (медианное число цитирований статей, попавших в расчет H5-индекса). Обе эти метрики не учитывают не только различия по областям науки, но и размер журналов, а также не исключают самоцитирования. В результате российский топ (на 2021 г.) оказался заполнен преимущественно псевдонаучными изданиями, публикующими огромное число статей, цитируемых преимущественно такими же изданиями. Не рекомендуем использовать его.

Метрики для авторов в GS похожи - это индекс Хирша, H5-индекс, а также число цитирований и еще одна собственная разработка Google - индекс i10, показывающий число публикаций, имеющих более 10 цитирований. Других метрик нет, самоцитирования убрать нельзя.

Как показывают исследования (doi), во всех научных дисциплинах GS дает существенно большие значения числа публикаций, цитирований и индекса Хирша, чем Web of Science и Scopus.

Полезные ссылки:

Очень лаконичное официальное описание системы и процесса ее наполнения

Back to top