Skip to content

Тематические и отраслевые базы

Кроме общенаучных баз типа WoS или РИНЦ в мире живет и развивается множество отраслевых, посвященных публикациям одной дисциплины или их группы. В этом разделе мы кратко описываем наиболее важные из них. Рекомендуем обращать на них внимание при проведении наукометрических исследований соответствующих областей.

NEW! видео нашего вебинара про открытые и отраслевые базы.

Как правило, отраслевые базы предназначены не для наукометристов, а для самих ученых, и нередко лишены продвинутых инструментов для анализа цитирований, зато у них лучше и точнее охват профильной литературы, и в целом они позволяют взглянуть на предметную область глазами ее представителей. Среди отраслевых баз есть как платные (например, MathSciNet), так и бесплатные, но последние преобладают, на них и остановимся.

Мы рассмотрим следующие:

  • Биология и медицина: MEDLINE (PubMed)
  • Физика высоких энергий: INSPIRE
  • Компьютерные науки: DBLP

MEDLINE (PubMed)

Сайт: https://pubmed.ncbi.nlm.nih.gov/

Разработчик и владелец: Национальная библиотека медицины США

Тематики: Медицина и здравоохранение + существенная часть биологии и других смежных областей

База MEDLINE - ключевая часть поискового инструмента Pubmed, она является крайне популярной среди ученых в своих областях. Обычный сценарий ее использования - изучение темы, поиск и подготовка обзора литературы по любым направлениям медицины и многим - биологии (особенно молекулярной и клеточной, генетики и т.д.). Основной формат публикации - научные журналы, их индексируется порядка 5 тысяч, причем на 40 языках мира (каталог, на русском около 30 изданий). В базе хранятся основные метаданные порядка 28 миллионов публикаций: название, аннотация (как правило), авторы, год выхода. Корректные аффилиации (места работы) есть далеко не во всех публикациях, что затрудняет использование Pubmed для анализа организаций и стран. Цитирования также не отображаются (для их анализа есть специальный инструмент iCite). Зато в MEDLINE есть уникальный инструмент MESH - Medical Subject Headings - система присвоения всем публикациям стандартизированных медицинских тематик и описаний, позволяющая проводить поиск по симптомам, синдромам, названиям веществ, органов, патогенов, записям о регистрации клинических исследований и т.д.

Все публикации MEDLINE имеют уникальный идентификатор PMID, состоящий только из цифр и формирующий URL-адрес публикации, например: https://pubmed.ncbi.nlm.nih.gov/33545094/

Отбор журналов для индексации подробно описан: библиотека опирается на мнение специального комитета ученых и библиографов, а финальное решение принимает ее директор. Ежегодно рассматривают около 300-400 журналов и принимают порядка 40-50. Тем не менее, утверждать, что среди журналов в MEDLINE нет недобросовестных, мы не беремся.

Важно различать PubMed (MEDLINE) и PubMed Central (PMC). Последний представляет собой базу уже не метаданных, а полных текстов открытого доступа. Их уже более 5 миллионов, поэтому PMC всё чаще выступает источником данных для полнотекстовых науковедческих изысканий.

INSPIRE

Сайт: https://inspirehep.net/

Разработчик и владелец: Объединение крупнейших центров физики высоких энергий (ЦЕРН, Фермилаб, DESY, IHEP, IN2P3, SLAC)

Тематики: Физика высоких энергий и смежные области.

INSPIRE, ранее известная как SPIRES-HEP - основная информационная система в физике высоких энергий. Эта область науки очень специфическая и фокусируется вокруг огромных установок типа Большого адронного коллайдера в ЦЕРН, продуцирующих работы с сотнями и тысячами (рекорд - более 5к) соавторов.

Задача INSPIRE - дать авторам в данной области полноценный инструмент не только для поиска научной литературы, но и для самопрезентации, анализа сети организаций, установок, и даже поиска работы. Соответственно, сущности, по которым можно проводить поиск - публикации, авторы, организации, вакансии, семинары, конференции и эксперименты. Задача сведения публикаций в профиль автора решается с помощью ORCID и ручной корректировки самими учеными. Примечательно, что система фиксирует смену мест работы и статусов авторов, от студента до профессора. Кроме того, за счет индексации диссертаций имеется информация о научном руководстве, помогающая изучать научные родословные. Организации связаны с авторами, так что по каждому научному центру можно получить список работающих (публикующихся) специалистов по физике высоких энергий.

INSPIRE также индексирует и анализирует цитирования, хотя нужно представлять, что это цитирования в одной искусственно замкнутой предметной области (список источников для индексации определяется консорциумом и подавать в него извне журналы нельзя). Есть стандартные индикаторы (число публикаций, цитирований и авторских самоцитирований, индекс Хирша), фильтры по числу авторов и по крупным коллаборациям\экспериментам. Система обладает полноценным API для выгрузки данных.

Для России физика высоких энергий традиционно одна из ведущих областей, именно на работы про коллайдеры с тысячами соавторов приходится основная доля цитирований у ряда ведущих российских вузов и НИИ, а важность "мегасайнс" постоянно подчеркивается на высшем уровне. Тем не менее, Россия формально не участвует в INSPIRE, хотя, конечно, отечественные авторы присутствуют в базе наравне со всеми.

Похожая и тоже очень интересная и открытая система существует в астрофизике, она называется Astrophysics Data System.

DBLP

Сайт: https://dblp.org/

Разработчик и владелец: Изначально - университет Трира, ныне Schloss Dagstuhl - Leibniz Center for Informatics

Тематики: Компьютерные науки

DBLP - основной сайт для составления библиографий и списков литературы в компьютерных науках. Он разработан немецкими энтузиастами в 1990-е и превратился в стандартный источник в своей области - пусть и несколько сдавший позиции Google Scholar, но непревзойденный в полноте и качестве индексации. Особенно важный пласт литературы в DBLP - конференции, которые индексируются в общенаучных базах существенно хуже. Не случайно именно DBLP выступает базой основного рейтинга университетов в Computer Science - CSRankings.

Система не индексирует цитирования и аффилиации, поэтому ее применение для прикладной наукометрии ограничено. Тем не менее, в DBLP наукометрия есть, и довольно необычная: у каждого автора (их объединяет в профили алгоритм) есть сеть соавторов, которые собираются в кластеры. Доступна выгрузка по API, кроме того, можно связать данные из DBLP (авторов, публикации, источники) c другими системами через различные идентификаторы.

Back to top