Наиболее широко используемый метод для ДНК-анализа — секвенирование по Сангеру (по фамилии Фредерика Сангера, получившего вместе с Вальтером Гилбертом Нобелевскую премию 1980 г. за разработку метода секвенирования ДНК). В настоящее время может быть определена последовательность фактически любого сегмента очищенной ДНК, независимо от того, что это — клонированный фрагмент или искомая последовательность, амплифицированная методом ПЦР.
Метод секвенирования Сангера основан на свойстве химических аналогов четырех нуклеотидов, известных как дидезоксинуклеотиды (ddA, ddC, ddG и ddT), не имеющих 3'-гидроксильной группы в дезоксирибозе (у них имеется 2'-гидроксильная группа, в норме отсутствующая в ДНК). Включаясь в растущую нить ДНК, дидезоксинуклеотиды не позволяют ДНК-полимеразе подключать следующее основание и, следовательно, продолжить рост цепи ДНК.
При секвенировании по Сангеру фрагмент ДНК служит шаблоном для синтеза, начинающегося с короткого олигонуклеотида. ДНК-полимераза следует вдоль последовательности шаблона, присоединяя последующие нуклеотиды. Для того чтобы получить информацию о последовательности нуклеотидов, в реакцию вместе с четырьмя нормальными нуклеотидами добавляют их дидезокси-аналоги.
Каждый дидезокси-аналог помечают определенным флюоресцентным красителем со своим спектром излучения. Полимераза включает или нормальный нуклеотид и продолжает синтез нити, или дидезоксинуклеотид, при этом завершая синтез. Разорванные нити разделяют электрофорезом, а конкретный дидезоксинуклеотид, вызвавший остановку синтеза, выявляется по цвету флюоресценции включенной метки.
Для автоматизации процедуры секвенирования разработаны специальные приборы.
Без информации о последовательности ДНК невозможно предсказать аминокислотную последовательность, закодированную геном, обнаружить конкретную мутацию при генетической болезни; она очень важна при создании АСО-зондов и ПЦР-праймеров, используемых в процедурах молекулярной диагностики.
Автоматизированное секвенирование внесло огромный вклад в реализацию проекта «Геном человека», в ходе которого исследована нуклеотидная последовательность всех 3 млрд пар оснований генома человека, а также полная последовательность геномов других организмов, имеющих медицинское и научное значение, включая Е. coli и другие патогенные бактерии, дрожжи Saccharomyces cerevisiae, малярийного плазмодия и комара анофелеса — переносчика малярии, червя Caenorhabditis elegans, фруктовую мушку Drosophila melanogaster, различные виды рыб и птиц, крыс и мышей, шимпанзе и массу других организмов, занимающих много ветвей генеалогического древа.
В быстром темпе создаются каталоги сходства в последовательностях этих организмов, кодирующих и некодирующих белок. Последовательность всего генома с исчерпывающим каталогом генов организма, предоставляемая секвенированием, — критически важный источник информации для понимания метаболических систем клеток и обнаружения уязвимых мест патогенных микроорганизмов, пригодных для воздействия вакцинами и антибиотиками.
Кроме того, при сравнении 99% некодирующих последовательностей генома человека с такими же последовательностями у других видов было установлено сходство в ДНК, сохраняющееся в течение сотен миллионов лет эволюции. Это дало важный инструмент для идентификации функциональных элементов генома человека.