Современное научное сообщество сталкивается с новой проблемой – манипуляциями с метаданными, направленными на искусственное повышение числа цитирований. Проблема стала объектом расследования ученых, которые выявили механизм скрытого увеличения цитируемости через так называемые “подставные ссылки”.
Цитирование в научных работах следует строгим стандартам: каждая ссылка включает название, имена авторов, год публикации, название журнала или конференции и номера страниц. Такая информация хранится как метаданные, не видимые в тексте статьи, но присваиваются уникальному цифровому идентификатору (DOI). Ссылки в научных публикациях позволяют авторам обосновывать выбор методологии или представлять результаты предыдущих исследований, подчеркивая итеративный и совместный характер науки.
Однако в процессе исследования было обнаружено, что некоторые недобросовестные авторы добавляют дополнительные ссылки, невидимые в тексте, но присутствующие в метаданных статей. В результате число цитирований для некоторых исследователей или журналов резко возрастает, хотя ссылки фактически не цитируются в самих статьях.
Расследованиеначалось с постана сайте PubPeer, где ученые обсуждают и анализируют публикации. Автор публикации заметил несоответствие: статья в журнале Hindawi, которую он подозревал в мошенничестве из-за неестественных фраз, имела гораздо больше цитирований, чем загрузок, что является крайне необычным.
Авторы статьи отошли от устоявшихся терминов, что смутило ученых. Обычно такое происходит из-за попытки избежать антиплагиата с помощью ПО для перефразирования.
Образец статьи, которая приводится в посте PubPeer
Пост привлек внимание нескольких исследователей. С помощью научных поисковых систем ученые нашли статьи, цитирующие исходную статью. Google Scholar не нашел ни одной ссылки, а Crossref и Dimensions их обнаружили. Разница заключается в том, что Google Scholar в основном полагается на текст статьи для извлечения ссылок, тогда как Crossref и Dimensions используют метаданные, предоставленные издателями.
Для понимания масштабов манипуляций исследователи изучили три научных журнала, издаваемых Technoscience Academy, которые были ответственны за статьи с сомнительными ссылками. Исследование состояло из трех этапов:
- Составление списка ссылок, явно присутствующих в HTML или PDF версиях статьи;
- Сравнение списков с метаданными, записанными Crossref, и выявление дополнительных ссылок, добавленных в метаданные, но не появляющихся в статьях;
- Проверка платформы Dimensions, которая использует Crossref в качестве источника метаданных, и обнаружение дальнейших несоответствий.
В журналах, издаваемых Technoscience Academy, как минимум 9% записанных ссылок оказались подставными. Дополнительные ссылки присутствовали только в метаданных, искажая количество цитирований и давая некоторым авторам несправедливое преимущество. Были также утрачены некоторые легитимные ссылки, не присутствующие в метаданных.
Кроме того, скрытые ссылки принесли большую пользу некоторым исследователям. Например, один ученый, связанный с Technoscience Academy, получил более 3 000 дополнительных незаконных ссылок. Некоторые журналы того же издателя получили выгоду от пары сотен дополнительных скрытых ссылок.
Crossref (слева) предоставляет список из 47 ссылок (показаны от 0 до 9). Ссылки с 6 по 46 являются скрытыми. Dimensions (справа) перечисляет 13 ссылок, ни одна из них не появляется в оригинальной статье.
Важность открытия и пути решения проблемы
Количество цитирований сильно влияет на финансирование исследований, академические продвижения и рейтинги учреждений. Манипуляции с цитированием могут привести к несправедливости на основе ложных данных. Более того, открытие ставит под вопрос целостность систем измерения научного воздействия, что уже давно вызывает беспокойство среди исследователей.
Чтобы бороться с такой практикой, исследователи предлагают несколько мер:
- Строгая проверка метаданных издателями и агентствами, такими как Crossref;
- Независимые аудиты для обеспечения надежности данных;
- Повышение прозрачности в управлении ссылками и цитатами.
Исследование впервые выявило манипуляции с метаданными и обсуждает их влияние на оценку исследователей. Подчеркивается, что чрезмерное доверие к метрикам для оценки ученых, их работы и влияния может быть в корне ошибочным. Подобное доверие способствует сомнительным исследовательским практикам, включая гипотезирование (выдвижение гипотезы) после того, как результаты уже известны, салями-слайсинг (salami slicing), манипуляции данными и плагиат.
Хотя проблемные метаданные и подставные ссылки были исправлены, возможно, как это часто бывает в научных исправлениях, меры были предприняты слишком поздно.