Индекс Хирша и аналоги
Индекс Хирша (h-индекс) - один из наиболее известных наукометрических показателей. Как и импакт-фактор, этот индикатор очень простой и наглядный, что отчасти и объясняет его популярность. По задумке автора - американского физика Хорхе Хирша (doi), это ценный и объективный инструмент для оценки важности, значимости и широкого научного влияния ученого:
I have proposed an easily computable index, h, which gives an estimate of the importance, significance and broad impact of a scientist’s cumulative research contributions. I suggest that this index may provide a useful yardstick to compare different individuals competing for the same resource when an important evaluation criterion is scientific achievement, in an unbiased way.
Индекс Хирша в его статье 2005 г. определяется так: у ученого он равен h, если из его(её) N публикаций каждая имеет не меньше h цитирований, а остальные N минус h публикаций каждая имеют не больше h цитирований.
Графически это можно представить так (источник картинки):
Совокупность публикаций, которые имеют не менее h цитирований, называется ядром (h-core).
Хирш - физик-теоретик из США, и свои расчеты, а также выводы о том, что они объективны и хорошо отражают реальность, он делал для физиков-теоретиков "нормального американского" типа: регулярно выдающих новые результаты в формате хорошо индексируемых стандартных публикаций в мейнстримных англоязычных журналах. На основе своих наблюдений он высчитал примерные значения h для получения постоянной профессорской позиции (tenure), почетного членства в Американском физическом обществе и американских академиях наук, и заявил:
High h is a reliable indicator of high accomplishment
Примечательно, что Хирш сделал такой сильный вывод, никак не опираясь на наукометрическую или науковедческую литературу. В качестве авторских ключевых слов он выбрал для своей статьи всего три: "сitations", "impact" и "unbiased". По иронии, именно его метрику теперь чаще всего приводят в пример biased-показателей. Но это науковеды, а у широких народных академических масс отношение к ней другое, так как идея объединить в одной метрике продуктивность (число публикаций) и влиятельность (число цитирований) в эпоху publish or perish очень востребована. Так, еще до выхода оригинальной статьи метрика была встроена в основную базу по физике высоких энергий SPIRES (ныне INSPIRE), вскоре появилась в WoS, Scopus и прочих базах (в т.ч. в РИНЦ не менее пяти вариантов), нередко ее можно встретить в CV. Постепенно она стала применяться не только для авторов, но и для любых массивов публикаций, в т.ч. для журналов и организаций.
Важное достоинство индекса - его слабая чувствительность к низкоцитируемым публикациям, с которыми чаще связаны проблемы с индексаций в наукометрических базах. По сути, однако, стоящая за h идеология упрощения - сведение всех объектов к одной цифре - не только его главное достоинство, но и главный недостаток. Оно является антитезой ответственному применению наукометрии, в рамках которого подчеркивается необходимость использования набора разных метрик, характеризующих ученых с разных сторон.
Индекс Хирша допустимо использовать на практике только как часть такой корзины, при этом принимая во внимание ключевые из его многочисленных недостатков. Они очевидны, и многие отметил еще сам Хирш в своей первой статье:
- Не учитываются различия в цитируемости по областям науки. Индекс ни в коем случае не должен использоваться для сравнения представителей разных дисциплин.
- Не учитываются различия в относительном авторском вкладе. Так, у участника крупных коллабораций индекс зачастую будет выше, чем у автора, работающего в малом коллективе.
- Не учитываются различия в возрасте ученых. Сравнивать авторов разного возраста по нему недопустимо (вариант решения - m-индекс, о котором ниже)
- Недостаточно учитывается фактическое число цитирований публикаций, особенно отдельных высокоцитируемых работ. У ученого, имеющего три статьи с тремя цитированиями каждая, и у ученого, имеющего три статьи с тремя тысячами цитирований, индекс будет один и тот же.
- Не исключаются авторские самоцитирования и цитирования сети соавторов.
Вслед за h-индексом хлынула целая лавина аналогичных показателей, разработанных как профессиональными наукометристами, так и разнообразными учеными из других областей. Уже к 2011 г. таких вариантов было минимум 37, но проведенный корреляционный метаанализ показал (doi), что на практике для большинства из них корреляция с h-индексом в районе 0.8-0.9, поэтому они "hardly provide added information to the h index".
Одно из важных исключений - m-индекс, введенный самим Хиршем для решения проблемы сопоставимости ученых разного возраста - отметим, не биологического, а академического. M-индекс (m parameter в статье Хирша) равен h/n, где n - число лет с момента выхода первой учтенной публикации ученого. Если h-индекс может только расти, то m, наоборот, с годами неминуемо стремится к нулю. Рейтинги ученых по показателям h и m существенно отличаются: так, из двух нобелевских лауреатов h выше у Андрея Гейма, а m - у Константина Новоселова.
Еще одна значимая модификация индекса была предложена в 2006 г. известным наукометристом Лео Эгге (doi) и направлена на решение проблемы недоучета отдельных высокоцитируемых работ стандартным h-индексом. G-индекс определяется так: возьмем список публикаций исследуемого автора (журнала, организации) и ранжируем его по убыванию цитирований. G в таком случае - такое наибольшее целое число, что верхние g публикаций в сумме имеют g в квадрате цитирований. Из определения следует, что g-индекс не может быть меньше h-индекса, а обычно он больше. На примере ниже (взят из вики) показаны два ученых с одинаковым h-индексом - 6 - и существенно разными g-индексами (10 и 6).
Author 1 | Author 2 | |
---|---|---|
Paper 1 | 30 | 10 |
Paper 2 | 17 | 9 |
Paper 3 | 15 | 9 |
Paper 4 | 13 | 9 |
Paper 5 | 8 | 8 |
Paper 6 | 6 | 6 |
Paper 7 | 5 | 5 |
Paper 8 | 4 | 4 |
Paper 9 | 3 | 2 |
Paper 10 | 1 | 1 |
Общее число цитирований | 102 | 63 |
Цитирований на одну публикацию | 10,2 | 6,3 |
Увы, ни g-индекс, ни m-индекс не пользуются популярностью, хоть сколько-нибудь сравнимой с h-индексом, хотя доступны в т.ч. в аналитической надстройке Scival (Scopus).
Мы рекомендуем использовать все эти показатели только вместе с другими метриками. На практике из таких метрик крайне важны год рождения и год выхода первой публикации, число самоцитирований, долевой подсчет вклада автора. Без знания этих показателей работ в ядре индекса Хирша его использование может быть очень опасно. И, конечно, ни в коем случае нельзя объединять индексы Хирша - да и любые прочие метрики - полученные по разным базам данных.