История изучения генетического кода. Генетический код: описание, характеристики, история исследования

Генетический код, выраженный в кодонах, это система кодирования информации о строении белков, присущая всем живым организмам планеты. Его расшифровка заняла десятилетие, а вот то, что он существует, наука понимала почти столетие. Универсальность, специфичность, однонаправленность, а особенно вырожденность генетического кода имеют важное биологическое значение.

История открытий

Проблема кодирования всегда была ключевой в биологии. К матричному строению генетического кода наука продвигалась довольно неспешно. С момента обнаружения Дж. Уотсоном и Ф. Криком в 1953 году двойной спиральной структуры ДНК начался этап разгадывания самой структуры кода, который побудил веру в величие природы. Линейная структура белков и такая же структура ДНК подразумевала наличие генетического кода как соответствия двух текстов, но записанных при помощи разных алфавитов. И если алфавит белков был известен, то знаки ДНК стали предметом изучения биологов, физиков и математиков.

Нет смысла описывать все шаги в решении этой загадки. Прямой эксперимент, доказавший и подтвердивший, что между кодонами ДНК и аминокислотами белка существует четкая и последовательная соответственность, провели в 1964 году Ч. Яновски и С. Бреннер. А далее - период расшифровки генетического кода in vitro (в пробирке) с использованием техник синтеза белка в бесклеточных структурах.

Полностью расшифрованный код E. Coli был обнародован в 1966 году на симпозиуме биологов в Колд-Спринг-Харборе (США). Тогда и открылась избыточность (вырожденность) генетического кода. Что это значит, объяснилось довольно просто.

Раскодирование продолжается

Получение данных о расшифровке наследственного кода стало одним из самых значительных событий прошлого столетия. Сегодня наука продолжает углубленно исследовать механизмы молекулярных кодировок и его системных особенностей и переизбытка знаков, в чем выражается свойство вырожденности генетического кода. Отдельная отрасль изучения - возникновение и эволюционирование системы кодирования наследственного материала. Доказательства связи полинуклеотидов (ДНК) и полипептидов (белки) дали толчок развитию молекулярной биологии. А та, в свою очередь, биотехнологиям, биоинженерии, открытиям в селекции и растениеводстве.

Догмы и правила

Главная догма молекулярной биологии - информация передается с ДНК на информационную РНК, а после с нее на белок. В обратном направлении передача возможна с РНК на ДНК и с РНК на другую РНК.

Но матрицей или основой всегда остается ДНК. И все остальные фундаментальные особенности передачи информации - это отражение этого матричного характера передачи. А именно передачи путем осуществления синтеза на матрице других молекул, которые и станут структурой воспроизводства наследственной информации.

Генетический код

Линейное кодирование структуры белковых молекул осуществляется с помощью комплементарных кодонов (триплетов) нуклеотидов, которых всего 4 (адеин, гуанин, цитозин, тимин (урацил)), что спонтанно приводит к образованию другой цепочки нуклеотидов. Одинаковое число и химическая комплиментарность нуклеотидов - это главное условие такого синтеза. Но при образовании белковой молекулы качества соответствия количества и качества мономеров нет (ДНК нуклеотиды - аминокислоты белка). Это и есть природный наследственный код - система записи в последовательности нуклеотидов (кодонах) последовательности аминокислот в белке.

Генетический код обладает несколькими свойствами:

  • Триплетность.
  • Однозначность.
  • Направленность.
  • Неперекрываемость.
  • Избыточность (вырожденность) генетического кода.
  • Универсальность.

Приведем краткую характеристику, концентрируя внимание на биологическом значении.

Триплетность, непрерывность и наличие стоп-сигналов

Каждой из 61 аминокислоты соответствует один смысловой триплет (тройка) нуклеотидов. Три триплета не несут информацию об аминокислоте и являются стоп-кодонами. Каждый нуклеотид в цепочке входит в состав триплета, а не существует сам по себе. В конце и в начале цепочки нуклеотидов, отвечающих за один белок, находятся стоп-кодоны. Они запускают или останавливают трансляцию (синтез белковой молекулы).

Специфичность, неперекрываемость и однонаправленность

Каждый кодон (триплет) кодирует только одну аминокислоту. Каждый триплет не зависит от соседнего и не перекрывается. Один нуклеотид может входить только в один триплет в цепочке. Синтез белка идет всегда только в одном направлении, что регулируют стоп-кодоны.

Избыточности генетического кода

Каждый триплет нуклеотидов кодирует одну аминокислоту. Всего 64 нуклеотида, из них 61 - кодируют аминокислоты (смысловые кодоны), а три - бессмысленные, то есть аминокислоту не кодируют (стоп-кодоны). Избыточность (вырожденность) генетического кода заключается в том, что в каждом триплете могут быть произведены замены - радикальные (приводят к замене аминокислоты) и консервативные (не меняют класс аминокислоты). Легко посчитать, что если в триплете можно провести 9 замен (1, 2 и 3 позиция), каждый нуклеотид можно заменить на 4 - 1 = 3 других варианта, то общее количество возможных вариантов замен нуклеотида будет 61 по 9 = 549.

Вырожденность генетического кода проявляется в том, что 549 вариантов - это намного больше, чем необходимо для закодировки информации о 21 аминокислоте. При этом из 549 вариантов 23 замены приведут к образованию стоп-кодонов, 134 + 230 замены - консервативны, и 162 замены - радикальны.

Правило вырожденности и исключения

Если два кодона имеют два одинаковых первых нуклеотида, а оставшиеся представлены нуклеотидами одного класса (пуриновые или пиримидиновые), то они несут информацию об одной и той же аминокислоте. Это и есть правило вырожденности или избыточности генетического кода. Два исключения - АУА и УГА - первый кодирует метионин, хотя должен был бы изолейцин, а второй - стоп-кодон, хотя должен был бы кодировать триптофан.

Значение вырожденности и универсальности

Именно эти два свойства генетического кода имеют наибольшее биологическое значение. Все свойства, перечисленные выше, характерны для наследственной информации всех форм живых организмов на нашей планете.

Вырожденность генетического кода имеет приспособительное значение, как многократное дублирование кода одной аминокислоты. Кроме того, это означает снижение значимости (вырождение) третьего нуклеотида в кодоне. Такой вариант сводит к минимуму мутационные повреждения в ДНК, которые повлекут за собой грубые нарушения в структуре белка. Это защитный механизм живых организмов планеты.

ГЕНЕТИЧЕСКИЙ КОД , способ записи наследственной информации в молекулах нуклеиновых кислот в виде последовательности образующих эти кислоты нуклеотидов. Определённой последовательности нуклеотидов в ДНК и РНК соответствует определённая последовательность аминокислот в полипептидных цепях белков. Код принято записывать с помощью заглавных букв русского или латинского алфавита. Каждый нуклеотид обозначается буквой, с которой начинается название входящего в состав его молекулы азотистого основания: А (А) – аденин, Г (G) – гуанин, Ц (С) – цитозин, Т (Т) – тимин; в РНК вместо тимина урацил – У (U). Каждую кодирует комбинация из трёх нуклеотидов – триплет, или кодон. Кратко путь переноса генетической информации обобщён в т. н. центральной догме молекулярной биологии: ДНК ` РНК f белок.

В особых случаях информация может переноситься от РНК к ДНК, но никогда не переносится от белка к генам.

Реализация генетической информации осуществляется в два этапа. В клеточном ядре на ДНК синтезируется информационная, или матричная, РНК (транскрипция). При этом нуклеотидная последовательность ДНК «переписывается» (перекодируется) в нуклеотидную последовательность мРНК. Затем мРНК переходит в цитоплазму, прикрепляется к рибосоме, и на ней, как на матрице, синтезируется полипептидная цепь белка (трансляция). Аминокислоты с помощью транспортной РНК присоединяются к строящейся цепи в последовательности, определяемой порядком нуклеотидов в мРНК.

Из четырёх «букв» можно составить 64 различных трёхбуквенных «слова» (кодона). Из 64 кодонов 61 кодирует определённые аминокислоты, а три отвечают за окончание синтеза полипептидной цепи. Так как на 20 аминокислот, входящих в состав белков, приходится 61 кодон, некоторые аминокислоты кодируются более чем одним кодоном (т. н. вырождённость кода). Такая избыточность повышает надёжность кода и всего механизма биосинтеза белка. Другое свойство кода – его специфичность (однозначность): один кодон кодирует только одну аминокислоту.

Кроме того, код не перекрывается – информация считывается в одном направлении последовательно, триплет за триплетом. Наиболее удивительное свойство кода – его универсальность: он одинаков у всех живых существ – от бактерий до человека (исключение составляет генетический код митохондрий). Учёные видят в этом подтверждение концепции о происхождении всех организмов от одного общего предка.

Расшифровка генетического кода, т. е. определение «смысла» каждого кодона и тех правил, по которым считывается информация, осуществлена в 1961–1965 гг. и считается одним из наиболее ярких достижений молекулярной биологии.

- единая система записи наследственной ин­формации в молекулах нуклеиновых кислот в виде последова­тельности нуклеотидов. Генетический код основан на использо­вании алфавита, состоящего всего из четырех букв-нуклеотидов, отличающихся азотистыми основаниями: А, Т, Г, Ц.

Основные свойства генетического кода следующие:

1. Генетический код триплетен. Триплет (кодон) - последовательность трех нуклеотидов, кодирующая одну аминокислоту. Поскольку в состав бел­ков входит 20 аминокислот, то очевидно, что каждая из них не может кодироваться одним нуклеотидом (поскольку в ДНК всего четыре типа нуклеотидов, то в этом случае 16 аминокислот оста­ются незакодированными). Двух нуклеотидов для кодирования аминокислот также не хватает, поскольку в этом случае могут быть закодированы только 16 аминокислот. Значит, наименьшее число нуклеотидов, кодирующих одну аминокислоту, оказыва­ется равным трем. (В этом случае число возможных триплетов нуклеотидов составляет 4 3 = 64).

2. Избыточность (вырожденность) кода является следствием его триплетности и означает то, что одна аминокислота может кодироваться несколькими трип­летами (поскольку аминокислот 20, а триплетов - 64). Исключение составляют метионин и триптофан, которые кодируются только одним триплетом. Кроме того, некоторые триплеты вы­полняют специфические функции. Так, в молекуле иРНК три из них УАА, УАГ, УГА - являются терминирующими кодонами, т. е. стоп-сигналами, прекращающими синтез полипептидной цепи. Триплет, соответствующий метионину (АУГ), стоящий в начале цепи ДНК, не кодирует аминокислоту, а выполняет функцию инициирования (возбуждения) считывания.

3. Одно­временно с избыточностью коду присуще свойство однозначнос­ти, которое означает, что каждому кодону соответствует только одна определенная аминокислота.

4. Код коллинеарен, т.е. по­следовательность нуклеотидов в гене точно соответствует после­довательности аминокислот в белке.

5. Генетический код непере­крываем и компактен, т. е. не содержит «знаков препинания». Это значит, что процесс считывания не допускает возможности перекрывания колонов (триплетов), и, начавшись на определенном кодоне, считывание идет непрерывно триплет за триплетом вплоть до стоп-сигналов (терминирующих кодонов). Например, в иРНК следующая последовательность азотистых оснований АУГГУГЦУУААУГУГ будет считываться только такими трип­летами: АУГ, ГУГ, ЦУУ, ААУ, ГУГ, а не АУГ, УГГ, ГГУ, ГУГ и т. Д. или АУГ, ГГУ, УГЦ, ЦУУ и т. д. или еще каким-либо образом (допустим, кодон АУГ, знак препинания Г, кодон УГЦ, знак пре­пинания У и Т. п.).

6. Генетический код универсален, т. е. ядер­ные гены всех организмов одинаковым образом кодируют инфор­мацию о белках вне зависимости от уровня организации и систематического положения этих организмов.

Нуклеотиды ДНК и РНК
  1. Пуриновые: аденин, гуанин
  2. Пиримидиновые: цитозин, тимин (урацил)

Кодон - триплет нуклеотидов, кодирующих определенную аминокислоту.

таб. 1. Аминокислоты, которые обычно встречаются в белках
Название Сокращенное обозначение
1. Аланин Ala
2. Аргинин Arg
3. Аспарагин Asn
4. Аспарагиновая кислота Asp
5. Цистеин Cys
6. Глутаминовая кислота Glu
7. Глутамин Gln
8. Глицин Gly
9. Гистидин His
10. Изолейцин Ile
11. Лейцин Leu
12. Лизин Lys
13. Метионин Met
14. Фенилаланин Phe
15. Пролин Pro
16. Серии Ser
17. Треонин Thr
18. Триптофан Trp
19. Тирозин Tyr
20. Валин Val

Генетический код, который еще называют аминокислотным кодом, - это система записи информации о последовательности расположения аминокислот в белке с помощью последовательности расположения нуклеотидных остатков в ДНК, которые содержат одно из 4-х азотистых оснований: аденин (А), гуанин (G), цитозин (C) и тимин (Т). Однако, поскольку двунитчатая спираль ДНК не принимает непосредственного участия в синтезе белка, который кодируется одной из этих нитей (т.е. РНК), то код записывается на языке РНК, в котором вместо тимина входит урацил (U). По этой же причине принято говорить, что код - это последовательность нуклеотидов, а не пар нуклеотидов.

Генетический код представлен определенными кодовыми словами, - кодонами.

Первое кодовое слово было расшифровано Ниренбергом и Маттеи в 1961 г. Они получили из кишечной палочки экстракт, содержащий рибосомы и прочие факторы, необходимые для синтеза белка. Получилась бесклеточная система для синтеза белка, которая могла бы осуществлять сборку белка из аминокислот, если в среду добавить необходимую мРНК. Добавив в среду синтетическую РНК, состоящую только из урацилов, они обнаружили, что образовался белок, состоящий только из фенилаланина (полифенилаланин). Так было установлено, что триплет нуклеотидов УУУ (кодон) соответствует фенилаланину. В течение последующих 5-6 лет были определены все кодоны генетического кода.

Генетический код - своеобразный словарь, переводящий текст, записанный с помощью четырех нуклеотидов, в белковый текст, записанный с помощью 20 аминокислот. Остальные аминокислоты, встречающиеся в белке, являются модификациями одной из 20 аминокислот.

Свойства генетического кода

Генетический код имеет следующие свойства.

  1. Триплетность - каждой аминокислоте соответствует тройка нуклеотидов. Легко подсчитать, что существуют 4 3 = 64 кодона. Из них 61 является смысловым и 3 - бессмысленными (терминирующими, stop-кодонами).
  2. Непрерывность (нет разделительных знаков между нуклеотидами) - отсутствие внутригенных знаков препинания;

    Внутри гена каждый нуклеотид входит в состав значащего кодона. В 1961г. Сеймур Бензер и Френсис Крик экспериментально доказали триплетность кода и его непрерывность (компактость) [показать]

    Суть эксперимента: "+" мутация - вставка одного нуклеотида. "-" мутация - выпадение одного нуклеотида.

    Одиночная мутация ("+" или "-") в начале гена или двойная мутация ("+" или "-") - портит весь ген.

    Тройная мутация ("+" или "-") в начале гена портит лишь часть гена.

    Четверная "+" или "-" мутация опять портит весь ген.

    Эксперимент был проведен на двух рядом расположенных фаговых генах и показал, что

    1. код триплетен и внутри гена нет знаков препинания
    2. между генами есть знаки препинания
  3. Наличие межгенных знаков препинания - наличие среди триплетов инициирующих кодонов (с них начинается биосинтез белка), кодонов - терминаторов (обозначают конец биосинтеза белка);

    Условно к знакам препинания относится и кодон AUG - первый после лидерной последовательности. Он выполняет функцию заглавной буквы. В этой позиции он кодирует формилметионин (у прокариот).

    В конце каждого гена, кодирующего полипептид, находится, по меньшей мере, один из 3-х терминирующих кодонов, или стоп-сигналов: UAA, UAG, UGA. Они терминируют трансляцию.

  4. Колинеарность - соответствие линейной последовательности кодонов мРНК и аминокислот в белке.
  5. Специфичность - каждой аминокислоте соответствуют только определенные кодоны, которые не могут использоваться для другой аминокислоты.
  6. Однонаправленность - кодоны считываются в одном направлении - от первого нуклеотида к последующим
  7. Вырожденность, или избыточность ,- одну аминокислоту может кодировать несколько триплетов (аминокислот – 20, возможных триплетов – 64, 61 из них смысловой, т. е. в среднем каждой аминокислоте соответствует около 3 кодонов); исключение составляет метионин (Met) и триптофан (Trp).

    Причина вырожденности кода состоит в том, что главную смысловую нагрузку несут два первых нуклеотида в триплете, а третий не так важен. Отсюда правило вырожденности кода : если два кодона имеют два одинаковых первых нуклеотида, а их третьи нуклеотиды принадлежат к одному классу (пуриновому или пиримидиновому), то они кодируют одну и ту же аминокислоту.

    Однако из этого идеального правила есть два исключения. Это кодон АUА, который должен соответствовать не изолейцину, а метионину и кодон UGА, который является терминирующим, тогда как должен соответствовать триптофану. Вырожденность кода имеет, очевидно, приспособительное значение.

  8. Универсальность - все перечисленные выше свойства генетического кода характерны для всех живых организмов.
    Кодон Универсальный код Митохондриальные коды
    Позвоночные Беспозвоночные Дрожжи Растения
    UGA STOP Trp Trp Trp STOP
    AUA Ile Met Met Met Ile
    CUA Leu Leu Leu Thr Leu
    AGA Arg STOP Ser Arg Arg
    AGG Arg STOP Ser Arg Arg

    В последнее время принцип универсальности кода был поколеблен в связи c открытием Береллом в 1979 г. идеального кода митохондрий человека, в котором выполняется правило вырожденности кода. В коде митохондрий кодон UGA соответствует триптофану, а AUA - метионину, как того требует правило вырожденности кода.

    Возможно, в начале эволюции у всех простейших организмов был такой же код, как и у митохондрий, а затем он претерпел небольшие отклонения.

  9. Неперекрываемость - каждый из триплетов генетического текста независим друг от друга, один нуклеотид входит в состав только одного триплета; На рис. показана разница между перекрывающимся и неперекрывающимся кодом.

    В 1976г. была секвенирована ДНК фага φХ174. У него одноцепочечная кольцевая ДНК, состоящая из 5375 нуклеотидов. Было известно, что фаг кодирует 9 белков. Для 6 из них были определены гены, располагающиеся друг за другом.

    Выяснилось, что есть перекрывание. Ген Е полностью находится внутри гена D. Его инициирующий кодон появляется в результате сдвига считывания на один нуклеотид. Ген J начинается там, где кончается ген D. Инициирующий кодон гена J перекрывается с терминирующим кодоном гена D в результате сдвига на два нуклеотида. Конструкция называется "сдвиг рамки считывания" на число нуклеотидов, некратное трем. На сегодняшний день перекрывание показано только для нескольких фагов.

  10. Помехоустойчивость - отношение числа консервативных замен к числу радикальных замен.

    Мутации замен нуклеотидов, не приводящие к смене класса кодируемой аминокислоты, называют консервативными. Мутации замен нуклеотидов, приводящие к смене класса кодируемой аминокислоты, называют радикальными.

    Так как одна и та же аминокислота может кодироваться разными триплетами, то некоторые замены в триплетах не приводят к замене кодируемой аминокислоты (например UUU -> UUC оставляет фенилаланин). Некоторые замены меняют аминокислоту на другую из того же класса (неполярный, полярный, основной, кислотный), остальные замены меняют и класс аминокислоты.

    В каждом триплете можно провести 9 однократных замен, т.е. выбрать, какую из позиций меняем - можно тремя способами (1-я или 2-я или 3-я), причем выбранную букву (нуклеотид) можно поменять на 4-1=3 других буквы (нуклеотида). Общее количество возможных замен нуклеотидов - 61 по 9 = 549.

    Прямым подсчетом по таблице генетического кода можно убедиться, что из них: 23 замены нуклеотидов приводят к появлению кодонов - терминаторов трансляции. 134 замены не меняют кодируемую аминокислоту. 230 замен не меняют класс кодируемой аминокислоты. 162 замены приводят к смене класса аминокислоты, т.е. являются радикальными. Из 183 замен 3-его нуклеотида, 7 приводят к появлению терминаторов трансляции, а 176 - консервативны. Из 183 замен 1-ого нуклеотида, 9 приводят к появлению терминаторов, 114 - консервативны и 60 - радикальны. Из 183 замен 2-го нуклеотида, 7 приводят к появлению терминаторов, 74 - консервативны, 102 - радикальны.


Под генетическим кодом принято понимать такую систему знаков, обозначающих последовательное расположение соединений нуклеотидов в ДНКа и РНКа, которая соответствует другой знаковой системе, отображающей последовательность аминокислотных соединений в молекуле белка.

Это важно!

Когда учёным удалось изучить свойства генетического кода, одним из главных была признана универсальность. Да, как ни странно это звучит, все объединяет один, универсальный, общий генетический код. Формировался он на протяжении большого временного промежутка, и процесс закончился около 3,5 миллиардов лет назад. Следовательно, в структуре кода можно проследить следы его эволюции, от момента зарождения до сегодняшнего дня.

Когда говорится о последовательности расположения элементов в генетическом коде, имеется в виду, что она далеко не хаотична, а имеет строго определённый порядок. И это тоже во многом определяет свойства генетического кода. Это равнозначно расположению букв и слогов в словах. Стоит нарушить привычный порядок, и большинство того, что мы будем читать на книжных или газетных страницах, превратится в нелепую абракадабру.

Основные свойства генетического кода

Обычно код несёт в себе какую-либо информацию, зашифрованную особым образом. Для того чтобы расшифровать кода, необходимо знать отличительные особенности.

Итак, основные свойства генетического кода - это:

  • триплетность;
  • вырожденность или избыточность;
  • однозначность;
  • непрерывность;
  • уже указанная выше универсальность.

Остановимся подробнее на каждом свойстве.

1. Триплетность

Это когда три соединения нуклеотидов образуют последовательную цепочку внутри молекулы (т.е. ДНК или же РНК). В результате создаётся соединение триплета или кодирует одну из аминокислот, место её нахождения в цепи пептидов.

Различают кодоны (они же кодовые слова!) по их последовательности соединения и по типу тех азотистых соединений (нуклеотидов), которые входят в их состав.

В генетике принято выделять 64 кодоновых типа. Они могут образовывать комбинации из четырёх типов нуклеотидов по 3 в каждом. Это равносильно возведению числа 4 в третью степень. Таким образом, возможно образование 64-х нуклеотидных комбинаций.

2. Избыточность генетического кода

Это свойство прослеживается тогда, когда для шифрования одной аминокислоты требуется несколько кодонов, обычно в пределах 2-6. И только и триптофана можно кодировать с помощью одного триплета.

3. Однозначность

Она входит в свойства генетического кода как показатель здоровой генной наследственности. Например, о хорошем состоянии крови, о нормальном гемоглобине может рассказать медикам стоящий на шестом месте в цепочке триплет ГАА. Именно он несёт информацию о гемоглобине, и им же кодируется А если человек болен анемией, один из нуклеотидов заменяется на другую букву кода - У, что и является сигналом заболевания.

4. Непрерывность

При записи этого свойства генетического кода следует помнить, что кодоны, как звенья цепочки, располагаются не на расстоянии, а в прямой близости, друг за другом в нуклеиновой кислотной цепи, и цепь эта не прерывается - в ней нет начала или конца.

5. Универсальность

Никогда не следует забывать, что всё сущее на Земле объединено общим генетическим кодом. И потому у примата и человека, у насекомого и птицы, столетнего баобаба и едва проклюнувшейся из-под земли травинки одинаковыми триплетами кодируются схожие аминокислоты.

Именно в генах заложена основная информация о свойствах того или иного организма, своего рода программа, которую организм получает в наследство от живших ранее и которая существует как генетический код.