Исследователи из Детского исследовательского госпиталя Святого Иуды разработали алгоритмический инструмент ReDeconv, который помогает ученым глубже анализировать транскриптомные данные, устраняя ошибки традиционных методов обработки RNA-seq.
Современные технологии секвенирования РНК, такие как массовый и одно-клеточный RNA-seq, позволяют изучать экспрессию генов на детальном уровне. Однако используемые для их анализа вычислительные методы нередко упрощают обработку данных, упуская важные биологические нюансы. Это может приводить к искажению результатов, особенно при сравнении разных типов клеток.
ReDeconv , описание которого опубликовано в Nature Communications, устраняет ключевые ошибки в расчетах, учитывая различия в размерах транскриптома. Например, количество экспрессируемых генов в разных клетках варьируется: эритроциты почти полностью сосредоточены на синтезе гемоглобина, тогда как стволовые клетки экспрессируют тысячи генов. Традиционные алгоритмы часто не учитывают такие различия, что ведет к неверной интерпретации данных.
“ReDeconv позволяет учитывать размер транскриптома, что значительно улучшает точность анализа RNA-seq”, – объясняет автор исследования Цзиян Юй, и.о. заведующего кафедрой вычислительной биологии в госпитале Святого Иуды.
Использование ReDeconv позволяет более точно определять клеточные типы в образце и уменьшает погрешности, возникающие из-за различий в общей экспрессии генов и их длине. По словам первого автора статьи, Сонгцзяня Лу, новая методика улучшает точность нормализации данных и раскрывает дополнительные слои информации, которые ранее могли оставаться незамеченными.