Профилирование экспрессии генов и кластеризация сигнатур опухоли
Геномика уже оказывает большие влияние на диагностическую точность и оптимизацию терапии при раке. В этой секции мы опишем, как для диагностики и лечения опухолей используют один из видов геномной технологии — профилирование экспрессии.
Предположим, у нас есть множество образцов тканей из разных опухолей и мы хотим разработать чувствительный метод, чтобы различать эти типы опухолей в будущих образцах. Для одновременного измерения уровней экспрессии мРНК некоторых или всех из приблизительно 25 000 генов человека в любом образце ткани относительно стандартного образца может использоваться метод CGH.
Измерение экспрессии мРНК в образце создает профиль экспрессии генов, специфичный для этого образца. На рисунке изображена гипотетическая идеализированная ситуация для восьми образцов, по четыре на каждый из двух типов рака, А и В, профилированных по 100 разным генам. Профиль экспрессии, полученный из массивов экспрессии в этом простом примере, достаточно достоверен, так как содержит 800 показателей экспрессии.
В реальном эксперименте по профилированию экспрессии могут анализироваться сотни образцов по экспрессии всех генов человека, что быстро создает огромные массивы данных, содержащих миллионы значений величины экспрессии. Необходимость организации и анализа данных для получения ключевой информации вызвало проблемы, потребовавшие развития сложных статистических и биоинформационных инструментальных средств. Используя эти средства, можно так организовать данные, чтобы найти группы генов с согласованной экспрессией. Группировку генов по их экспрессии в образцах называют кластеризацией.
Кластеры экспрессии генов затем могут тестироваться для нахождения корреляции с конкретными характеристиками интересующих образцов. Например, профилирование может указать, что группа генов с коррелирующими профилями экспрессии чаще выявляется в образцах из опухоли А, но не из опухоли В, тогда как другая группа генов с коррелирующими профилями, наоборот, чаще присутствует в образцах опухоли В, но не А.
Гены, экспрессия которых согласуется друг с другом и с конкретным набором образцов, составляют сигнатуру экспрессии этих образцов.
Профилирование экспрессии генов для описания опухолей может оказаться полезным по нескольким причинам.
• Во-первых, это резко увеличивает возможности различать опухоли, дополняя стандартные критерии, применяемые патологами, например гистологическую картину, цитогенетические маркеры и экспрессию специфических маркерных белков.
Если различные сигнатуры для разных типов опухолей (например, опухоль А по сравнению с опухолью В) определяются известным образом, образец экспрессии неизвестной опухоли затем можно сравнить с сигнатурами экспрессии опухолей А и В и классифицировать его как А-подобный, В-подобный или никакой, в зависимости от того, насколько хорошо его профиль экспрессии соответствует сигнатурам опухолей А и В.
• Во-вторых, разные сигнатуры могут коррелировать с разными клиническими результатами, например прогнозом, ответом на терапию или любыми другими интересующими результатами. Если это подтвердится, такие сигнатуры могли бы быть использованы для помощи в выборе лечения у вновь диагностированных пациентов.
• В-третьих, кластеризация может выявить прежде не предполагаемые функциональные взаимосвязи генов, включенных в процесс болезни, что окажется немаловажным для теоретических исследований.