Принцип кодирования аминокислотных последовательностей — Гипермаркет знаний. Что такое генетический код: общие сведения Сколько кодонов кодируют 20 видов аминокислот

Генетический код - это способ кодирования последовательности аминокислот в молекуле белка с помощью последовательности нуклеотидов в молекуле нуклеиновой кислоты. Свойства генетического кода вытекают из особенностей этого кодирования.

Каждой аминокислоте белка сопоставляется в соответствие три подряд идущих нуклеотида нуклеиновой кислоты - триплет , или кодон . Каждый из нуклеотидов может содержать одно из четырех азотистых оснований. В РНК это аденин (A), урацил (U), гуанин (G), цитозин (C). По-разному комбинируя азотистые основания (в данном случае содержащие их нуклеотиды) можно получить множество различных триплетов: AAA, GAU, UCC, GCA, AUC и т. д. Общее количество возможных комбинаций - 64, т. е. 4 3 .

В состав белков живых организмов входит около 20 аминокислот. Если бы природа «задумала» кодировать каждую аминокислоту не тремя, а двумя нуклеотидами, то разнообразия таких пар не хватило бы, так как их оказалось бы всего 16, т.е. 4 2 .

Таким образом, основное свойство генетического кода - его триплетность . Каждая аминокислота кодируется тройкой нуклеотидов.

Поскольку возможных разных триплетов существенно больше, чем используемых в биологических молекулах аминокислот, то в живой природе было реализовано такое свойство как избыточность генетического кода. Многие аминокислоты стали кодироваться не одним кодоном, а несколькими. Например, аминокислота глицин кодируется четырьмя различными кодонами: GGU, GGC, GGA, GGG. Избыточность также называют вырожденностью .

Соответствие между аминокислотами и кодонами отражают в виде таблиц. Например, таких:

По отношению к нуклеотидам генетический код обладает таким свойством как однозначность (или специфичность ): каждый кодон соответствует только одной аминокислоте. Например, кодоном GGU можно закодировать только глицин и больше никакую другую аминокислоту.

Еще раз. Избыточность - это про то, что несколько триплетов могут кодировать одну и ту же аминокислоту. Специфичность - каждый конкретный кодон может кодировать только одну аминокислоту.

В генетическом коде нет специальных знаков препинания (если не считать стоп-кодонов, обозначающих окончание синтеза полипептида). Функцию знаков препинания выполняют сами триплеты - окончание одного обозначает, что следом начнется другой. Отсюда следуют следующие два свойства генетического кода: непрерывность и неперекрываемость . Под непрерывность понимают считывание триплетов сразу друг за другом. Под неперекрываемостью - то, что каждый нуклеотид может входить в состав только одного триплета. Так первый нуклеотид следующего триплета всегда стоит после третьего нуклеотида предшествующего триплета. Кодон не может начаться со второго или третьего нуклеотида предшествующего кодона. Другими словами, код не перекрывается.

Генетический код обладает свойством универсальности . Он един для всех организмов на Земле, что говорит о единстве происхождения жизни. При этом встречаются очень редкие исключения. Например, некоторые триплеты митохондрий и хлоропластов кодируют другие, а не обычные для них, аминокислоты. Это может говорить о том, что на заре развития жизни существовали немного различные вариации генетического кода.

Наконец, генетический код обладает помехоустойчивостью , которая является следствием такого его свойства как избыточность. Точечные мутации , иногда происходящие в ДНК , обычно приводят к замене одного азотистого основания на другое. При этом изменяется триплет. Например, было AAA, после мутации стало AAG. Однако подобные изменения не всегда приводят к изменению аминокислоты в синтезируемом полипептиде, так как оба триплета из-за свойства избыточности генетического кода могут соответствовать одной аминокислоте. Учитывая, что мутации чаще вредны, свойство помехоустойчивости полезно.

Каждый живой организм обладает особым набором белков. Определенные соединения нуклеотидов и их последовательность в молекуле ДНК образуют генетический код. Он передает информацию о строении белка. В генетике была принята определенная концепция. Согласно ей, одному гену соответствовал один фермент (полипептид). Следует сказать, что исследования о нуклеиновых кислотах и белках проводились в течение достаточно продолжительного периода. Далее в статье подробнее рассмотрим генетический код и его свойства. Будет также приведена краткая хронология исследований.

Терминология

Генетический код - это способ зашифровки последовательности белков аминокислот с участием нуклеотидной последовательности. Этот метод формирования сведений характерен для всех живых организмов. Белки - природные органические вещества с высокой молекулярностью. Эти соединения также присутствуют в живых организмах. Они состоят из 20 видов аминокислот, которые называются каноническими. Аминокислоты выстроены в цепочку и соединены в строго установленной последовательности. Она определяет структуру белка и его биологические свойства. Встречается также несколько цепочек аминокислот в белке.

ДНК и РНК

Дезоксирибонуклеиновая кислота - это макромолекула. Она отвечает за передачу, хранение и реализацию наследственной информации. ДНК использует четыре азотистых основания. К ним относятся аденин, гуанин, цитозин, тимин. РНК состоит из тех же нуклеотидов, кроме того из них, в составе которого находится тимин. Вместо него присутствует нуклеотид, содержащий урацил (U). Молекулы РНК и ДНК представляют собой нуклеотидные цепочки. Благодаря такой структуре образовываются последовательности - "генетический алфавит".

Реализация информации

Синтез белка, который кодируется геном, реализовывается при помощи объединения мРНК на матрице ДНК (транскрипции). Также происходит передача генетического кода в последовательность аминокислот. То есть имеет место синтез полипептидной цепи на мРНК. Для зашифровки всех аминокислот и сигнала окончания белковой последовательности достаточно 3-х нуклеотидов. Эта цепь называется триплетом.

История исследования

Изучение белка и нуклеиновых кислот проводилось длительное время. В середине 20 века, наконец, появились первые идеи о том, какую природу имеет генетический код. В 1953 году выяснили, что некоторые белки состоят из последовательностей аминокислот. Правда, тогда еще не могли определить их точное количество, и по этому поводу велись многочисленные споры. В 1953 году авторами Уотсоном и Криком было опубликовано две работы. Первая заявляла о вторичной структуре ДНК, вторая говорила о ее допустимом копировании при помощи матричного синтеза. Кроме того, был сделан акцент на то, что конкретная последовательность оснований - это код, несущий наследственную информацию. Американский и советский физик Георгий Гамов допустил гипотезу кодирования и нашел метод ее проверки. В 1954 году была опубликована его работа, в ходе которой он выдвинул предложение установить соответствия между боковыми аминокислотными цепями и "дырами", имеющими ромбообразную форму, и использовать это как механизм кодирования. Потом его назвали ромбическим. Разъясняя свою работу, Гамов допустил, что генетический код может являться триплетным. Труд физика стал одним из первых среди тех, которые считались близкими к истине.

Классификация

По истечении нескольких лет предлагались различные модели генетических кодов, представляющие собой два вида: перекрывающиеся и неперекрывающиеся. В основе первой было вхождение одного нуклеотида в состав нескольких кодонов. К ней принадлежит треугольный, последовательный и мажорно-минорный генетический код. Вторая модель предполагает два вида. К неперекрывающимся относятся комбинационный и "код без запятых". В основе первого варианта лежит кодировка аминокислоты триплетами нуклеотидов, и главным является его состав. Согласно "коду без запятых", определенные триплеты соответствуют аминокислотам, а остальные нет. В этом случае считалось, что при расположении любых значащих триплетов последовательно другие, находящиеся в иной рамке считывания, получатся ненужными. Ученые полагали, что существует возможность подбора нуклеотидной последовательности, которая будет удовлетворять этим требованиям, и что триплетов ровно 20.

Хотя Гамов с соавторами ставили под сомнение такую модель, она считалась наиболее правильной на протяжении следующих пяти лет. В начале второй половины 20-го века появились новые данные, которые позволили обнаружить некоторые недочеты в "коде без запятых". Было выявлено, что кодоны способны провоцировать синтез белка в пробирке. Ближе к 1965 году осмыслили принцип всех 64 триплетов. В результате обнаружили избыточность некоторых кодонов. Другими словами, последовательность аминокислот кодируется несколькими триплетами.

Отличительные особенности

К свойствам генетического кода относятся:

Вариации

Впервые отклонение генетического кода от стандартного было обнаружено в 1979 году во время изучения генов митохондрий в организме человека. Далее выявили еще подобные варианты, в том числе множество альтернативных митохондриальных кодов. К ним относятся расшифровка стоп-кодона УГА, используемого в качестве определения триптофана у микоплазм. ГУГ и УУГ у архей и бактерий нередко применяются в роли стартовых вариантов. Иногда гены кодируют белок со старт-кодона, отличающийся от стандартно используемого этим видом. Кроме того, в некоторых белках селеноцистеин и пирролизин, которые являются нестандартными аминокислотами, вставляются рибосомой. Она прочитывает стоп-кодон. Это зависит от последовательностей, находящихся в мРНК. В настоящее время селеноцистеин считается 21-ой, пирролизан - 22-ой аминокислотой, присутствующей в составе белков.

Общие черты генетического кода

Однако все исключения являются редкостью. У живых организмов в основном генетический код имеет ряд общих признаков. К ним относятся состав кодона, в который входят три нуклеотида (два первых принадлежат к определяющим), передача кодонов тРНК и рибосомами в аминокислотную последовательность.

Клеймо создателя Филатов Феликс Петрович

Глава 496. Почему кодируемых аминокислот двадцать? (XII)

Почему кодируемых аминокислот двадцать? (XII)

Неискушенному Читателю может показаться, что элементы машины генетического кодирования описаны в предыдущей главе настолько детально, что к концу чтения он стал даже как-то утомляться, чувствуя, что несколько заинтриговавшее его начало книжки оборачивается страницами из учебника для старших классов, способными привести в уныние любого, кто вспомнит родную школу. Искушенному же Читателю, напротив, все рассказанное хорошо известно, и он, грешным делом, подумывает, не написать ли самому учебник посвежее – для тех же старших классов. Не мысля гордый свет забавить – другими словами, не имея намерения вогнать в скуку того и другого, Автор хотел бы подчеркнуть, что понимает: дьявол скрывается в деталях. Но их так много в молекулярной биологии, что любая формализация кажется возмутительным упрощением. Однако, часто бывает, что соблазн формализации неодолим, и тут Автор не может отказать себе в удовольствии еще раз процитировать испанского философа Хосе Ортегу-и-Гассета:

«Серый цвет аскетичен. Такова его символика в обыденном языке, на этот символ и намекает Гете: „Теория, мой друг, суха, но зеленеет жизни древо“. Самое большее, на что способен цвет, не желающий быть цветом, – стать серым; зато жизнь представляется зеленым деревом – какая экстравагантность!.. Элегантное желание предпочесть серый цвет чудесной и противоречивой цветовой экстравагантности жизни приводит нас к теоретизированию. В теории мы обмениваем реальность на тот ее аспект, каким являются понятия. Вместо того чтобы в ней жить, мы о ней размышляем. Но как знать, не скрывается ли за этим явным аскетизмом и удалением от жизни, каким является чистое мышление, наиболее полная форма жизненности, ее высшая роскошь?»

– Браво, Хосе! Именно так я и думаю – даже убежден в этом.

Формализации, теоретизированию, схемам, дизайну генетического кода посвящена основная, хотя и меньшая по объему, оставшаяся часть книги, к которой Автор сейчас переходит. Первая формальная гипотеза структуры генетического кода представляет собой возможный ответ на вопрос, почему кодируемых аминокислот именно двадцать .

В 1954 году Гамов первым показал, что «при сочетании 4 нуклеотидов тройками получаются 64 комбинации, чего вполне достаточно для записи наследственной информации ». Он был первым, кто предположил кодирование аминокислот триплетами нуклеотидов и выразил надежду, что «кто-нибудь из более молодых уч?ных дожив?т до его [генетического кода] расшифровки» . В 1968 году американцы Роберт Холли, Хар Корана и Маршалл Ниренберг получили Нобелевскую премию за расшифровку генетического кода. Премия была присуждена уже после смерти Георгия Гамова в том же году четырьмя месяцами ранее.

Числа 64 (теоретическая емкость кода) и 20 (фактическая кодирующая емкость, то есть количество кодируемых аминокислот) составляют соотношение правил комбинаторики для размещений и сочетаний с повторами: число А размещений (упорядоченных наборов) с повторами из r (r = 3; размер кодона) элементов множества М, содержащего k (k = 4; число оснований) элементов, равно

A k r = k r = A 4 3 = 64,

а число С сочетаний с повторами из k элементов по r, т. е. любое подмножество из 3 элементов множества, содержащего 4 элемента, равно:

С k r = [(k+r-1)!] : = С 4 3 = 20.

Это немедленно подводит к мысли о том, что эволюция генетического кода могла начаться с этапа «наборного» кодирования, когда продукт кодировался не последовательностью оснований триплета, а их набором, то есть две такие группы кодонов, как например, САА , АСА , ААС или TGC , TCG , GCT , GTC , CTG , CGT были функционально равнозначны (внутри группы) и направляли синтез одной и той же аминокислоты каждый. Подобные соображения приходят в голову при чтении работ Ишигами и Нагано (1975) – с их идеей о том, что каждая первичная аминокислота могла соответствовать широкому набору кодонов, а также Фолсома (1977) и Трейнора (1984) – с их идеей пермутации оснований в рамках триплета. Очевидно, что меньшее число кодонов не обеспечивало необходимого разнообразия продуктов, а бо льшее было избыточно и, по крайней мере, не соответствовало числу известных сегодня аминокислот. В свое время мы также внесли (очень) скромную лепту в эти идеи, отметив, что число сочетаний из 4 по 3 с повторами иллюстрируется числом квантовых состояний Бозе-газа из трех частиц с четырьмя вероятными собственными квантовыми состояниями54.

Позднее Гамов предложил схему реализации генетического кода, которая предусматривала сборку полипептида непосредственно на молекуле ДНК. По этой модели, каждая аминокислота помещается в ромбической выемке между четырьмя нуклеотидами, по два от каждой из комплементарных цепей. Хотя такой ромб состоит из четыр?х нуклеотидов и, следовательно, число сочетаний равно 256, из-за ограничений, связанных с водородными связями нуклеотидных остатков, возможными оказываются как раз 20 вариантов таких ромбов. Эта схема, получившая название бубнового кода , предполагает корреляцию между последовательными аминокислотными остатками, так как два нуклеотида всегда входят в два соседних ромба (перекрывающийся код). Дальнейшие исследования показали, однако, что эта модель Гамова также не согласуется с опытными данными.

Если бы емкость генетического кода использовалась без остатка, то есть каждому триплету соответствовала бы только одна аминокислота, его защищенность была бы весьма сомнительна: любая нуклеотидная мутация могла оказаться катастрофической. В случае же действующей версии треть случайных точечных мутаций приходится на последние буквы кодонов, половина которых (кодоны октета I ) к мутациям не чувствительна вовсе: третья буква кодона может быть любой из четырех – T , C , A или G . Устойчивость к точечным мутациям кодонов октета II в значительной степени определяется двумя факторами – (1) возможностью произвольной замены третьего основания (правда, уже при выборе только из двух – либо пуринов, либо пиримидинов), не меняющей кодируемой аминокислоты вовсе, и (2) возможностью замены пуринов на пиримидины и наоборот, которая сохраняет близкую гидрофильность/гидрофобность продуктов, хотя и не сохраняет их массы. Таким образом, Природа использует чрезвычайно удачный «люфт», называемый вырожденностью кода, когда кодируемому знаку соответствует более, чем один кодирующий.

Эволюция последовательно уточняла функции каждого из трех оснований кодона, что, в конечном счете, привело строгой триплетности только двух кодонов: ATG – для M (метионина) и TTG – для W (триптофана). По способности триплета кодировать только одну аминокислоту отнесем эти два к группе вырожденности I . Когда продукт кодируется фиксированным дублетом оснований, а третье может быть любым из четырех возможных и фактически служит разделителем между функциональными дублетами, говорят об аминокислотах группы вырожденности IV ; таких аминокислот восемь: аланин, A , аргинин, R , валин, V , глицин, G , лейцин, L , пролин, P , серин, S , треонин, T . Обобщенный кодон для каждой аминокислоты этой группы, например, лейцина, записывается так: СТ N (N -произвольное основание).

Двенадцать кодируемых продуктов относятся к группе вырожденности II ; в этой группе третье основание – одно из двух (а не из четырех , как в предыдущем случае): это пурин (R ), то есть, либо аденин, А , либо гуанин, G , – или пиримидин (Y ), то есть, либо цитозин, С , либо тимидин, Т . К этой группе относятся три аминокислоты, знакомые нам по четвертой группе вырожденности, – аргинин, лейцин и серин, но кодируемые здесь другими дублетами, две пары – аспарагин/аспарагиновая кислота (N/D ), и глутамин/глутаминовая кислота (Q/E ), а также гистидин H , лизин K , и тирозин Y . Универсальный генетический код относит к этой группе также цистеин С , с его двумя кодирующими триплетами – TGC и TGT , то есть, с третьим пиримидином, а также три стоп-кодона, TAG , TAA и TGA , которые работают только как пунктуационные знаки, фиксирующие окончание гена, но не кодирующие никакой аминокислоты. Обобщенный кодон для аминокислот этой группы, например, аспарагина, записывается так: AAY , а аспарагиновой кислоты – GAR .

Наконец, группа вырожденности III содержит изолейцин, кодируемый тремя триплетами ATA , ATC и ATT . Основания А , С и Т , третьи в кодонах для I , имеют общий символ Н , поэтому обобщенный изолейциновый кодон записывается так: АТН . Все эти особенности кода хорошо иллюстрирует приведенная выше его таблица.

Любопытно, что молекулярная масса кодируемой аминокислоты находится в обратной зависимости от номера группы вырожденности, к которой она относится (В. Щербак). Это первое, отмечаемое здесь, свидетельство очевидной причастности молекулярной массы компонентов генетического кода к его рациональной организации.

В приведенной табличке упорядоченность по нарастанию молекулярной массы относится к аминокислотам в составе упорядоченных по номерам групп вырожденности (римские цифры), сгруппированным в два октета (арабские цифры). При этом позиция цистеина С скорректирована, о чем речь будет идти в следующей главе; там же мы расскажем и об октетах.

Возвращаясь к выбору именно двадцати аминокислот для кодирования, стоит отметить еще одно интересное обстоятельство: этот выбор мог определяться также квантовой теорией информации, которая предлагает оптимальный алгоритм (алгоритм Гровера) упаковки и чтения информационного содержания ДНК (Апурва Патель, 2001). Такой алгоритм определяет число объектов N , различаемое числом ответов да/нет на вопросы Q , следующим образом:

(2Q +1) sin -1 (1 / ?N) = ? /2 .

Решения этого уравнения для малых значений Q весьма характерны:

Q = 1lnN = 04.0

Q = 2lnN = 10.5

Q = 3lnN = 20.2.

Теоретически эти значения не обязательно должны быть целыми числами. Любопытно, что в первом приближении они соответствуют последовательности тетраэдрических чисел, а также эволюции функционального размера кодона от синглетного к триплетному. Другими словами, тетраэдр также можно построить из десяти и из четырех мономеров; эти числа и отмечены в решениях приведенного уравнения. Позднее мы покажем, что комбинация размерных параметров аминокислот и нуклеотидов, базирующаяся на предложенных нами правилах, приводит к пространственному равновесию тетраэдра из двадцати мономеров, соответствующих этим аминокислотам. Здесь же стоит, пожалуй, вспомнить актуальные до сих пор слова В?зе (1973): «Представляется почти жестокой шуткой, что Природа выбрала такое число [кодируемых ] аминокислот, какое легко получается в результате множества

математических операций ». Но, так или иначе, двадцати альфа-аминокислот (из сотен, встречающихся в природе) оказалось довольно для обеспечения необходимого разнообразия белков.

…………………

Число 496 , которым обозначена эта глава, интересно тем, что оно относится к классу так называемых совершенных чисел , и это единственное трехзначное совершенное число. Совершенным называют натуральное число, равное сумме всех своих собственных делителей (т. е. всех положительных делителей, отличных от самого? числа). Сумма всех делителей числа 496 , то есть, 1+2+4+8+16+31+62+124+248, равна ему самому. Мы вспомнили о совершенных числах и отмечаем уникальность именно этого числа, потому что оно, во-первых, трехзначно – как трехзначны кодирующие элементы, о которых мы говорим, а во-вторых, как и все предыдущие упомянутые здесь числа, оно – случайно или нет – характеризует один из формальных параметров генетического кода, о которых мы будем говорить дальше. Терпение читателя небезгранично, и Автор вспоминает в связи с этим выдержку из письма одного из читателей известному популяризатору математики Мартину Гарднеру: Перестаньте отыскивать интересные числа! Оставьте для интереса хотя бы одно неинтересное число ! Но соблазн велик, и трудно удержаться.

Из книги Новейшая книга фактов. Том 1 [Астрономия и астрофизика. География и другие науки о Земле. Биология и медицина] автора

Из книги Путешествие в прошлое автора Голосницкий Лев Петрович

Двадцать пять миллионов лет назад Жарко в июльский полдень в казахстанской степи. Все залито солнечным блеском: холмистая равнина, расположенные во впадинах и окаймленные камышом озера, желтые участки песков, поросшие саксаулом.Холмы обрываются в сторону озер крутыми

Из книги Фармацевтическая и продовольственная мафия автора Броуэр Луи

Двадцать основных причин освобождения от армейской службы во всех призывных пунктах за 1986 г. №п/п Заболевания и патологические состояния Число лиц, освобожденных от армейской службы Отношение лиц, освобожденных от армейской службы, - к лицам, годным к службе,

Из книги КЛЕЙМО СОЗДАТЕЛЯ. Гипотеза происхождения жизни на Земле. автора Филатов Феликс Петрович

Глава 496. Почему кодируемых аминокислот двадцать? (XII) Неискушенному Читателю может показаться, что элементы машины генетического кодирования описаны в предыдущей главе настолько детально, что к концу чтения он стал даже как-то утомляться, чувствуя, что несколько

Из книги Пароль скрещенных антенн автора Халифман Иосиф Аронович

ДВАДЦАТЬ ПЯТЬ ЛЕТ СПУСТЯ ПРОХОДЯТ годы, и крохотная, величиной с наперсток, затерянная в почве зародышевая камера разрастается, становится заметным холмиком. Он наглухо облицован сверху глиной, песком, цементом, и в этой мертвой снаружи и немой, как камень, глыбе течет

Из книги Новейшая книга фактов. Том 1. Астрономия и астрофизика. География и другие науки о Земле. Биология и медицина автора Кондрашов Анатолий Павлович

Что означает выражение «двадцать пятый кадр»? Впервые этот термин появился в середине минувшего столетия в США и относился к кино. Дело в том, что киносъемочная камера и соответственно проекционный киноаппарат продвигают пленку со скоростью 24 кадра в секунду. Но в 1957

Из книги Биологическая химия автора Лелевич Владимир Валерьянович

Из книги автора

Глава 23. Обмен аминокислот. Динамическое состояние белков организма Значение аминокислот для организма в первую очередь заключается в том, что они используются для синтеза белков, метаболизм которых занимает особое место в процессах обмена веществ между организмом и

Из книги автора

Всасывание аминокислот. Происходит путем активного транспорта с участием переносчиков. Максимальная концентрация аминокислот в крови достигается через 30–50 мин после приема белковой пищи. Перенос через щеточную каемку осуществляется целым рядом переносчиков, многие

Из книги автора

Наследственные нарушения транспорта аминокислот Болезнь Хартнупа – нарушение всасывания триптофана в кишечнике и его реабсорбции в почечных канальцах. Так как триптофан служит исходным продуктом для синтеза витамина РР, то основные проявления болезни Хартнупа –

Из книги автора

Пути обмена аминокислот в тканях Аминокислоты – это бифункциональные соединения, содержащие аминную и карбоксильную группу. Реакции по этим группам являются общими для различных аминокислот. К ним относят:1. по аминной группе – реакции дезаминирования и

Из книги автора

Трансаминирование аминокислот Трансаминирование – реакции переноса a-аминогруппы с аминокислоты на a-кетокислоту, в результате чего образуются новая кетокислота и новая аминонокислота. Реакции катализируют ферменты аминотрансферазы. Это сложные ферменты, коферментом

Из книги автора

Дезаминирование аминокислот Дезаминирование аминокислот – реакция отщепления a-аминогруппы от аминокислоты с выделением аммиака. Различают два типа реакций дезаминирования: прямое и непрямое.Прямое дезаминирование – непосредственное отщепление аминогруппы от

Из книги автора

Непрямое дезаминирование аминокислот Большинство аминокислот не способно дезаминироваться в одну стадию, подобно глутамату. Аминогруппы таких аминокислот перносятся на?-кетоглутарат с образованием глутаминовой кислоты, которая затем подвергается прямому

Из книги автора

Декарбоксилирование аминокислот Некоторые аминокислоты и их производные могут подвергаться декарбоксилированию. Реакции декарбоксилирования необратимы и катализируются ферментами декарбоксилазами, нуждающимися в пиридоксальфосфате в качестве кофермента.

Из книги автора

Глава 25. Метаболизм отдельных аминокислот Метаболизм метионина Метионин – незаменимая аминокислота. Метильная группа метионина – мобильный одноуглеродный фрагмент, используемый для синтеза ряда соединений. Перенос метильной группы метионина на соответствующий

Лекция 5. Генетический код

Определение понятия

Генетический код - это система записи информации о последовательности расположения аминокислот в белках с помощью последовательности расположения нуклеотидов в ДНК.

Поскольку ДНК непосредственного участия в синтезе белка не принимает, то код записывается на языке РНК. В РНК вместо тимина входит урацил.

Свойства генетического кода

1. Триплетность

Каждая аминокислота кодируется последовательностью из 3-х нуклеотидов.

Определение: триплет или кодон - последовательность из трех нуклеотидов, кодирующая одну аминокислоту.

Код не может быть моноплетным, поскольку 4 (число разных нуклеотидов в ДНК) меньше 20. Код не может быть дуплетным, т.к. 16 (число сочетаний и перестановок из 4-х нуклеотидов по 2) меньше 20. Код может быть триплетным, т.к. 64 (число сочетаний и перестановок из 4-х по 3) больше 20.

2. Вырожденность.

Все аминокислоты, за исключением метионина и триптофана, кодируются более чем одним триплетом:

2 АК по 1 триплету = 2.

9 АК по 2 триплета = 18.

1 АК 3 триплета = 3.

5 АК по 4 триплета = 20.

3 АК по 6 триплетов = 18.

Всего 61 триплет кодирует 20 аминокислот.

3. Наличие межгенных знаков препинания.

Определение:

Ген - это участок ДНК, кодирующий одну полипептидную цепь или одну молекулу tPHK , r РНК или sPHK .

Гены tPHK , rPHK , sPHK белки не кодируют.

В конце каждого гена, кодирующего полипептид, находится, по меньшей мере, один из 3-х триплетов, кодирующих терминирующие кодоны РНК, или стоп-сигналы. В мРНК они имеют следующий вид: UAA , UAG , UGA . Они терминируют (оканчивают) трансляцию.

Условно к знакам препинания относится и кодон AUG - первый после лидерной последовательности. (См. лекцию 8) Он выполняет функцию заглавной буквы. В этой позиции он кодирует формилметионин (у прокариот).

4. Однозначность.

Каждый триплет кодирует лишь одну аминокислоту или является терминатором трансляции.

Исключение составляет кодон AUG . У прокариот в первой позиции (заглавная буква) он кодирует формилметионин, а в любой другой - метионин.

5. Компактность, или отсутствие внутригенных знаков препинания.
Внутри гена каждый нуклеотид входит в состав значащего кодона.

В 1961 г. Сеймур Бензер и Френсис Крик экспериментально доказали триплетность кода и его компактность.

Суть эксперимента: "+" мутация - вставка одного нуклеотида. "-" мутация - выпадение одного нуклеотида. Одиночная "+" или "-" мутация в начале гена портит весь ген. Двойная "+" или "-" мутация тоже портит весь ген.

Тройная "+" или "-" мутация в начале гена портит лишь его часть. Четверная "+" или "-" мутация опять портит весь ген.

Эксперимент доказывает, что код тршплетен и внутри гена нет знаков препинания. Эксперимент был проведен на двух рядом расположенных фаговых генах и показал, кроме того, наличие знаков препинания между генами.

6. Универсальность.

Генетический код един для всех живущих на Земле существ.

В 1979 г. Беррел открыл идеальный код митохондрий человека.

Определение:

«Идеальным» называется генетический код, в котором выполняется правило вырожденности квазидублетного кода: Если в двух триплетах совпадают первые два нуклеотида, а третьи нуклеотиды относятся к одному классу (оба - пурины или оба - пиримидины), то эти триплеты кодируют одну и ту же аминокислоту.

Из этого правила в универсальном коде есть два исключения. Оба отклонения от идеального кода в универсальном касаются принципиальных моментов: начала и конца синтеза белка:

Кодон

Универсальный

код

Митохондриальные коды

Позвоночные

Беспозвоночные

Дрожжи

Растения

STOP

STOP

С UA

А G А

STOP

STOP

230 замен не меняют класс кодируемой аминокислоты. к рываемость.

В 1956 г. Георгий Гамов предложил вариант перекрываемого кода. Согласно Гамовскому коду, каждый нуклеотид, начиная с третьего в гене, входит в состав 3-х кодонов. Когда генетический код был расшифрован, оказалось, что он неперекрываем, т.е. каждый нуклеотид входит в состав лишь одного кодона.

Достоинства перекрываемого генетического кода: компактность, меньшая зависимость структуры белка от вставки или делеции нуклеотида.

Недостаток: большая зависимость структуры белка от замены нуклеотида и ограничение на соседей.

В 1976 г. была секвенирована ДНК фага φХ174. У него одноцепочечная кольцевая ДНК, состоящая из 5375 нуклеотидов. Было известно, что фаг кодирует 9 белков. Для 6 из них были определены гены, располагающиеся друг за другом.

Выяснилось, что есть перекрывание. Ген Е полностью находится внутри гена D . Его инициирующий кодон появляется в результате сдвига считывания на один нуклеотид. Ген J начинается там, где кончается ген D . Инициирующий кодон гена J перекрывается с терминирующим кодоном гена D в результате сдвига на два нуклеотида. Конструкция называется "сдвиг рамки считывания" на число нуклеотидов, некратное трем. На сегодняшний день перекрывание показано только для нескольких фагов.

Информационная емкость ДНК

На Земле живет 6 миллиардов человек. Наследственная информация о них
заключена в 6x10 9 сперматозоидах. По разным оценкам у человека от 30 до 50
тысяч генов. У всех людей ~ 30x10 13 генов или 30x10 16 пар нуклеотидов, которые составляют 10 17 кодонов. Средняя книжная страница содержит 25x10 2 знаков. ДНК 6x10 9 сперматозоидов содержит информацию, равную по объему примерно

4x10 13 книжных страниц. Эти страницы заняли бы объем 6-и зданий НГУ. 6x10 9 сперматозоидов занимают половину наперстка. Их ДНК занимает менее четверти наперстка.

Генетический код — свойственный всем живым организмам способ кодирования последовательности аминокислотных остатков в составе белков при помощи последовательности нуклеотидов в составе нуклеиновой кислоты.

В ДНК используется четыре азотистых основания — аденин (А), гуанин (G), цитозин (С), тимин (T), которые в русскоязычной литературе обозначаются буквами А, Г, Ц и Т. Эти буквы составляют алфавит генетического кода. В РНК используются те же нуклеотиды, за исключением нуклеотида, содержащего тимин, который заменён похожим нуклеотидом, содержащим урацил, который обозначается буквой U (У в русскоязычной литературе). В молекулах ДНК и РНК нуклеотиды выстраиваются в цепочки и, таким образом, получаются последовательности генетических букв.

Генетический код

Белки практически всех живых организмов построены из аминокислот всего 20 видов. Эти аминокислоты называют каноническими. Каждый белок представляет собой цепочку или несколько цепочек аминокислот, соединённых в строго определённой последовательности. Эта последовательность определяет строение белка, а следовательно все его биологические свойства.

Реализация генетической информации в живых клетках (то есть синтез белка, кодируемого геном) осуществляется при помощи двух матричных процессов: транскрипции (то есть синтеза мРНК на матрице ДНК) и трансляции генетического кода в аминокислотную последовательность (синтез полипептидной цепи на мРНК). Для кодирования 20 аминокислот, а также сигнала «стоп», означающего конец белковой последовательности, достаточно трёх последовательных нуклеотидов. Набор из трёх нуклеотидов называется триплетом. Принятые сокращения, соответствующие аминокислотам и кодонам, изображены на рисунке. К последовательности триплетов (кодонов) в нуклеиновой кислоте, а, следовательно, и к последовательности аминокислотных остатков в белковой молекуле понятие «генетический код» не имеет отношения. Генетический код — это способ записи, а не содержание записи.

Генетический код, общий для большинства про- и эукариот. В таблице приведены все 64 кодона и указаны соответствующие аминокислоты. Порядок оснований — от 5′ к 3′ концу мРНК.

Стандартный генетический код
1-е
основание
2-е основание 3-е
основание
U C A G
U UUU (Phe/F) Фенилаланин UCU (Ser/S) Серин UAU (Tyr/Y) Тирозин UGU (Cys/C) Цистеин U
UUC UCC UAC UGC C
UUA (Leu/L) Лейцин UCA UAA Стоп (Охра ) UGA Стоп (Опал ) A
UUG UCG UAG Стоп (Янтарь ) UGG (Trp/W) Триптофан G
C CUU CCU (Pro/P) Пролин CAU (His/H) Гистидин CGU (Arg/R) Аргинин U
CUC CCC CAC CGC C
CUA CCA CAA (Gln/Q) Глутамин CGA A
CUG CCG CAG CGG G
A AUU (Ile/I) Изолейцин ACU (Thr/T) Треонин AAU (Asn/N) Аспарагин AGU (Ser/S) Серин U
AUC ACC AAC AGC C
AUA ACA AAA (Lys/K) Лизин AGA (Arg/R) Аргинин A
AUG [A] (Met/M) Метионин ACG AAG AGG G
G GUU (Val/V) Валин GCU (Ala/A) Аланин GAU (Asp/D) Аспарагиновая кислота GGU (Gly/G) Глицин U
GUC GCC GAC GGC C
GUA GCA GAA (Glu/E) Глутаминовая кислота GGA A
GUG GCG GAG GGG G
A Кодон AUG кодирует метионин и одновременно является сайтом инициации трансляции: первый кодон AUG в кодирующей области мРНК служит началом синтеза белка. Секторный вариант записи, внутренний круг — 1-е основание кодона (от 5′-конца) Обратная таблица (указаны кодоны для каждой аминокислоты, а также стоп-кодоны)
Ala/A GCU, GCC, GCA, GCG Leu/L UUA, UUG, CUU, CUC, CUA, CUG
Arg/R CGU, CGC, CGA, CGG, AGA, AGG Lys/K AAA, AAG
Asn/N AAU, AAC Met/M AUG
Asp/D GAU, GAC Phe/F UUU, UUC
Cys/C UGU, UGC Pro/P CCU, CCC, CCA, CCG
Gln/Q CAA, CAG Ser/S UCU, UCC, UCA, UCG, AGU, AGC
Glu/E GAA, GAG Thr/T ACU, ACC, ACA, ACG
Gly/G GGU, GGC, GGA, GGG Trp/W UGG
His/H CAU, CAC Tyr/Y UAU, UAC
Ile/I AUU, AUC, AUA Val/V GUU, GUC, GUA, GUG
START AUG STOP UAG, UGA, UAA
Отклонения от стандартного генетического кода
Пример Кодон Обычное значение Читается как:
Некоторые виды дрожжей рода Candida CUG Лейцин Серин
Митохондрии, в частности у Saccharomyces cerevisiae CU(U, C, A, G) Лейцин Серин
Митохондрии высших растений CGG Аргинин Триптофан
Митохондрии (у всех без исключения исследованных организмов) UGA Стоп Триптофан
Ядерный геном инфузории Euplotes UGA Стоп Цистеин или селеноцистеин
Митохондрии млекопитающих, дрозофилы, S. cerevisiae и многих простейших AUA Изолейцин Метионин = Старт
Прокариоты GUG Валин Старт
Эукариоты (редко) CUG Лейцин Старт
Эукариоты (редко) GUG Валин Старт
Прокариоты (редко) UUG Лейцин Старт
Эукариоты (редко) ACG Треонин Старт
Митохондрии млекопитающих AGC, AGU Серин Стоп
Митохондрии дрозофилы AGA Аргинин Стоп
Митохондрии млекопитающих AG(A, G) Аргинин Стоп
Поделиться