Ссылки (цитирования)

Ссылки, которые на русском повелось называть "цитированиями" (калька с английского cites\citations) - важнейший объект изучения наукометрии. Они связывают отдельные публикации в сеть науки и обеспечивают поступательное приращение научного знания за счет связи нового знания с уже имеющимся. При этом у ученых отсутствует консенсус о том, как именно трактовать цитирования и что они значат. Основатель прикладной наукометрии Юджин Гарфильд писал (doi), что любые теории цитирования заведомо туманны и неполны, и осторожно относился к различным математическим подходам. Еще один классик наукометрии Блез Кронин в своей монографии о цитированиях (pdf) так охарактеризовал фундаментальную сложность их однозначной трактовки:

Citation is a private process with a public face. Therefore, any attempt to understand the nature of citations is conjecture

Несмотря на эту принципиальную размытость цитирований, работ об их смысле и назначении написано немало. В частности, со стороны социологии и символических характеристик подробно изучил цитирования в своей классической диссертации Пауль Воутерс (pdf). Тем не мене, общепринятой теории цитирования пока не сложилось (сопоставление основных подходов смотрите здесь (doi)). Мы в нашем кратком обзоре остановимся на ключевых аспектах изучения цитирований, важных для интерпретации количественных результатов наукометрии.

Иногда считают, что традиция цитировать и таким образом вставать на плечи гигантов изначально присуща науке. Такая точка зрения ("не цитирует - не ученый"), фактически отождествляющая науку с системой приращения знания с обязательной опорой на имеющееся знание, имеет право на жизнь. На деле практика ссылаться на других авторов начала распространяться в Европе с конца XVI века (до этого их тексты обычно просто копировали без указания источника). Примечательно, что практика учета и изучения цитирований изначально развивалась отдельно от науки: в Средние века у иудеев-талмудистов (doi), или в XVIII-XIX веках у англосаксонских юристов с их "цитаторами" (doi).

Отчасти это было связано с трудностью анализа постраничных ссылок, принятых у ученых. Формат концевых списков литературы широко распространился с 1950-60 гг., что совпало с развитием технологий и позволило Юджину Гарфильду придумать и раскрутить свой Science Citation Index, ставший прообразом всех остальных библиометрических инструментов. Стартовав с набора основных журналов по естественным наукам, Гарфильд построил систему индексирования публикаций и их метаданных, изначально фокусирующуюся именно на списках литературы. В результате стало возможным проводить измерение числа ссылок на статьи , которое отождествляется с влиянием (impact) научной публикации. Чем больше работ в той или иной степени опираются на данную статью, ссылаясь на нее, тем важнее она для развития науки - такова логика анализа цитирований.

Естественно, против отождествления цитирований с влиянием есть целый ряд аргументов. На практике часто слышны такие:

  • Ссылка ссылке рознь: где-то речь об опоре на методологию или данные, где-то - просто об упоминании в числе свежих работ по теме, чтобы показать свою осведомленность
  • Где-то речь вообще идет о критике или опровержениях. Стоит ли считать это влиянием?
  • Некоторым иногда приходится сослаться на главреда или начальника, а то и накрутить показатели для формальной оценки.

Действительно, ссылки имеют ряд функций, а их авторы - массу мотивов, и смешивать их в одном показателе может казаться грубым упрощением. Исследование функций и мотивов цитирований можно считать полноценным подразделом науковедения: работы в диапазоне от глубинных интервью авторов до математики распределений ссылок тут исчисляются сотнями.

Наиболее упрощенно типологию цитирований с точки зрения содержательных мотивов можно представить так:

  • Подтверждение ("Полученные нами результаты в целом соответствуют предыдущим наблюдениям (Наблюдатель et al 2011)")
  • Упоминание ("Как известно, наблюдения в основном проводятся наблюдателями (Наблюдателев 1993, Наблюдателева 2019)")
  • Опора на метод\данные ("В своей работе мы использовали алгоритм наблюдения (Наблюдатель 2020)", "Расчеты проведены на датасете наблюдений (Наблюдатель 2021)")
  • Противоречие ("В отличие от (Наблюдатель 2010) мы в своем исследовании не наблюдаем ничего подобного").

Похожая типология недавно реализована в сервисе scite, классифицирующем цитирования на три типа на основе алгоритмов машинного обучения, работающих с контекстами цитирования - извлеченными из полных текстов 25 миллионов публикаций фразами с конкретными цитированиями (технология изложена в научной работе (doi)). К сожалению, цитирования, опирающиеся на методы и данные, scite выделять не умеет, а корректность по остальным типам далеко не идеальна. Важно, что scite подтверждает известные ранее наблюдения о крайне малой распространенности отрицательных цитирований.

Все остальные крупные базы цитирований и инструменты на их основе работают с цитированиями без различения их типов, опираясь на общее отождествление ссылок с влиянием. Аргументы за и против такого отождествления описаны в ряде обзоров, один из которых заключает (попутно цитируя):

There is evidence that the different motivations of citers are “not so different or ‘randomly given’ to such an extent that the phenomenon of citation would lose its role as a reliable measure of impact” (doi).

Мы придерживаемся такой же точки зрения, иначе бы не занимались наукометрией. Важно подчеркнуть: цитирования опосредованно отражают влияние, а не “качество”, “гениальность”, “оригинальность” публикаций. Безусловно, у работы, рассказывающей о прорывном эксперименте или содержащей доказательство важной теоремы, много шансов получить много ссылок. Но для развития науки не менее значимы и другие типы публикаций: так, сотни и тысячи ссылок регулярно собирают научные обзоры, в которых обобщается текущее состояние исследований какой-то темы, или же работы о новых протоколах лабораторных исследований, или научном программном обеспечении, или публикации важных описательных данных.

На практике, однако, чтобы цитирования адекватно отражали влияние, их нужно правильно измерить - нормализовать, оценить вклад самоцитирований и т.д.. Про это читайте в специальном разделе.

Одним только числом цитирований дело не ограничивается: ссылки и списки литературы широко применяются также для выявления взаимосвязей и построения сетей публикаций, авторов и тематик. Например, близость двух публикаций может определяться тем, насколько совпадают у них списки литературы, что в т.ч. позволяет выделять тематические кластеры. Примечательно, что самой цитируемой статьей в профильном журнале Scientometrics является описание программы VOSviewer, предназначенной как раз для этого.

Back to top