
Bugün öğrendim ki: Dünya üzerindeki neredeyse tüm canlıların kullandığı genetik kod, olası alternatif genetik kodların çoğuna kıyasla mutasyonların etkisini en aza indirgemek için alışılmadık derecede optimize edilmiş görünüyor.
Özet
Genetik kod neredeyse evrenseldir ve standart kodon tablosundaki kodonların düzenlenmesi oldukça rastgele değildir. Kodun kökeni ve evrimi hakkındaki üç ana kavram şunlardır: kodon atamalarının, amino asitler ile ilgili kodonlar (antikodonlar) arasındaki fizikokimyasal afinite tarafından dikte edildiğini öne süren stereokimyasal teori; kodun yapısının amino asit biyosentez yollarıyla birlikte evrimleştiğini varsayan eşevrim teorisi; ve nokta mutasyonlarının ve translasyon hatalarının olumsuz etkisini en aza indirmek için seçilimin kodun evriminde ana faktör olduğu varsayılan hata en aza indirme teorisi. Bu teoriler birbirini dışlamaz ve aynı zamanda donmuş kaza hipoteziyle de uyumludur, yani standart kodun özel özellikleri olmayabileceği, ancak tüm mevcut yaşam formlarının ortak bir ataya sahip olması nedeniyle sabitlendiği ve kodda sonraki değişikliklerin çoğunlukla kodon yeniden atamasının zararlı etkisiyle engellendiği anlamına gelir. Kodun yapısının ve olası evrimsel yörüngelerinin matematiksel analizi, translasyonel yanlış okumaya karşı oldukça sağlam olduğunu göstermektedir ancak çok daha sağlam kodlar vardır, bu nedenle standart kod potansiyel olarak kısa bir kodon serisi yeniden atamaları dizisi yoluyla rastgele bir kodd an evrimleşmiş olabilir. Dolayısıyla, standart koda yol açan evrimin çoğunluğu, metabolik yollarla kodun eşevrimi ve amino asitler ile nükleotid üçlüleri arasındaki zayıf afinitelerin katkıları dışlanamasa da, donmuş kaza ile hata en aza indirme seçimi kombinasyonu olabilir. Bununla birlikte, kod evrimi için bu tür senaryolar, birincil evrime olan ilgilerinin belirsiz olduğu biçimsel şemalar üzerine kuruludur. Kodun kökeni ve evrimi hakkında gerçek bir anlayışa ulaşılması, muhtemelen kodlama ilkesinin kendisinin ve onu barındıran translasyon sisteminin evrimi için güvenilir bir senaryo ile birlikte elde edilecektir.
Giriş
Escherichia coli'nin genetik kodu deşifre edildikten kısa bir süre sonra (1), 64 kodonun 20 amino aside ve iki noktalama işaretine (başlatma ve durdurma sinyalleri) eşlenmesinin, nispeten küçük modifikasyonlarla, dünyadaki tüm bilinen yaşam formları tarafından paylaşıldığı fark edildi (2, 3). Standart genetik kod tablosunun (Şekil 1) üstünkörü bir incelemesi bile, amino asit atamalarının düzenlenmesinin açıkça rastgele olmadığını göstermektedir (4–7). Genel olarak, ilişkili kodonlar (yani, yalnızca bir nükleotitte farklılık gösteren kodonlar) ya aynı ya da iki ilişkili amino asidi kodlama eğilimindedir; yani, fizikokimyasal olarak benzer olan amino asitler (fizikokimyasal benzerliği tanımlamak için net kriterler olmamasına rağmen). Temel soru, her 20 amino asidin ve durdurma sinyalinin en az bir kodona atanması gerektiğinde 10^84'ten fazla alternatif kod tablosu olasılığı göz önüne alındığında, standart kodun bu düzenliliklerinin nasıl ortaya çıktığıdır. Daha spesifik olarak, soru, kimyasal kısıtlamaların, tarihsel kazaların ve evrimsel kuvvetlerin, birçok dikkate değer özelliğe sahip olan standart amino asit atamasını üretmek için ne tür bir etkileşimi olabileceğidir. Kodun, nokta mutasyonlarına, translasyonel yanlış okumaya ve translasyonel çerçeve kaymalarına (8) karşı kodun sağlamlığı için gerekli bir koşul olduğu düşünülen kodun blok yapısı; kodonun ikinci harfi ile kodlanan amino asidin özellikleri arasındaki bağlantı, böylece ikinci pozisyonda U bulunan kodonların hidrofobik amino asitlere karşılık gelmesi (9, 10); ikinci kodon pozisyonu ile aminoasil-tRNA sentetaz sınıfı (11) arasındaki ilişki; bir amino asidin moleküler ağırlığı ile ona ayrılan kodon sayısı arasında negatif korelasyon (12, 13); bir amino asit için eşanlamlı kodon sayısı ile proteinlerdeki amino asit sıklığı arasında pozitif korelasyon (14, 15); yanlış çevirinin ve nokta mutasyonlarının olasılığının belirgin şekilde en aza indirilmesi (16, 17); ve protein kodlama dizilerinde ek bilgi sağlamanın neredeyse optimal olması gibi, özel bir açıklama gerektiren kodun özellikleridir (18).
Genetik kodun evrimini göz önünde bulundururken, belirtilmeye değer birkaç temel varsayım altında ilerliyoruz. Yalnızca 4 nükleotit ve 20 kodlanmış amino asit (organizmarların alt kümeleri için özel kodlama şemaları geliştirdiği selenokistein ve pirolizin hariç (19), bkz. ayrıca aşağıdaki tartışma) olduğu ve her kodonun üç nükleotitten oluşan bir üçlü olduğu varsayılmaktadır. Ribozomda RNA translokasyonunun temel fiziksel özelliğinin üç nükleotitlik artışlarla hareket etmek olduğu savunulmuştur, böylece translasyon sistemi bir üçlü tabanlı makine olarak ortaya çıkmıştır (20–22). Açıkçası, bu, kodonun her bir nükleotitinden yalnızca ikisinin bilgilendirici olduğu olasılığını dışlamaz (örneğin, "çiftli" bir aşama yoluyla kodun evrimi üzerine hipotezler için (23–26) bakınız). Kodda neden dört standart nükleotit olduğu (27, 28) veya standart kodun neden 20 amino asidi kodladığı (29–31) soruları tamamen meşrudur. Muhtemelen, kodun erken evrelerine ilişkin teoriler, kendini kopyalayabilen bir sistem için gereken minimum karmaşıklıkla kısıtlanmalıdır (örneğin, (32)). Ancak, bu büyüleyici araştırma alanı bu incelemenin kapsamı dışındadır ve mevcut tartışma için yukarıdaki temel sayıları varsayım olarak kabul ediyoruz. Bu öncüllerle, kodun doğası, kökeni ve evrimi hakkındaki kanıt ve düşüncenin ana hatlarını eleştirel bir şekilde değerlendirmeye ve sentezlemeye çalışıyoruz.
Kod evrilebilirdir
Crick'in dönüm noktası niteliğindeki makalesinde önerilen kod genişleme teorisi, amino asitlerin kodonlara fiili atamasının çoğunlukla rastlantısal olduğunu ve 'ilgili amino asitlerin ilgili kodonlara sahip olması beklendiğini' öne sürer (6). Bu kavram, Crick'in, ilkel genetik kod tüm 20 modern amino asidi içerecek şekilde genişledikten sonra, kodda herhangi bir değişikliğin protein dizilerinde birden çok, eşzamanlı değişikliğe yol açacağı ve sonuç olarak kodun evrenselliğini öldürücü kılacağı şeklindeki önceki Hinegardner ve Engelberg (2) argümanını takip etmesi nedeniyle 'donmuş kaza teorisi' olarak bilinir. Bugün, standart kodun kelimenin tam anlamıyla evrensel olmadığı, ancak temel organizasyonunda önemli değişikliklere uğramaya eğilimli olduğu yönünde bolca kanıt bulunmaktadır.
İnsan mitokondriyal genlerindeki kodon yeniden atamasının keşfinden bu yana (33), bakterilerde, arkelere, ökaryotik çekirdek genomlarında ve özellikle organel genomlarında standart genetik koddan çeşitli başka sapmalar bildirilmiştir ve en son sayım 20'den fazla alternatif kod saymıştır (34–38). Tüm alternatif kodların standart kodd an türediği düşünülmektedir (35); ayrıca, birçok aynı kodonun bağımsız soy dizilerinde (örneğin, en sık değişiklik durdurma kodonu UGA'nın triptofana yeniden atanmasıdır) yeniden atandığı gözlemiyle birlikte, bu sonuç, belirli değişikliklere karşı bir yatkınlık olması gerektiğini ima eder; bu değişikliklerden en az birinin seçici bir avantaj sağladığı rapor edilmiştir (39).
Kodon yeniden atamasının altında yatan mekanizmalar tipik olarak, tek bir nükleotit ikamesinin doğrudan kod çözmeyi etkilediği tRNA genlerindeki mutasyonları (40), baz modifikasyonunu (41) veya RNA düzenlemesini (42) içerir (35'te gözden geçirilmiştir). Kod evriminin bir diğer yolu, standart dışı amino asitlerin işe alınmasıdır. 21. amino asit olan selenokisteinin keşfi ve selenokisteinin proteine dahil edilmesiyle ilgili karmaşık moleküler mekanizma (43), mevcut amino asit repertuarının son derece zor değiştirilebilir olduğunun bir kanıtı olarak kabul edildi. Ancak, ikinci kanonik olmayan amino asit olan pirolizinin daha sonraki keşfi ve önemli olarak, pirolizin için özel bir tRNA'nın varlığı, kodun ek esnekliğini ortaya çıkardı (19, 44). Genomları en aza indirilmiş organizmalarda standart kod üzerindeki varyasyonlara ek olarak, kod modifikasyonu ve genişletilmesi üzerine birçok deneysel girişim rapor edilmiştir (45). Son zamanlarda, belirli bir amino asit için durdurma kodonlarından birini veya bir kodon serisinin alt kümesini işe alarak ve ilgili tRNA ve aminoasil-tRNA sentetazı mühendisliği yaparak genomlarda unnatural amino asitlerin dahil edilmesini kodlamak için genel bir yöntem geliştirilmiştir (46). Bu metodolojinin uygulanması, kodun potansiyel esnekliğinin çarpıcı bir göstergesi olarak, E. coli proteinlerinde 30'dan fazla unnatural amino asidin dahil edilmesine zaten olanak sağlamıştır (45, 46).
Kod değişikliklerini açıklamak için üç ana teori öne sürülmüştür. 'Kodon yakalama' teorisi (47, 48), genomik GC içeriğini azaltmak için mutasyon baskısı altında, bazı GC açısından zengin kodonların genomdan kaybolabileceğini (özellikle küçük, örneğin organel, bir genom) öne sürer. Daha sonra, rastgele genetik sürüklenme nedeniyle, bu kodonlar yeniden ortaya çıkacak ve tanımayan tRNA'lardaki mutasyonlar sonucunda yeniden atanacaktır. Bu mekanizma esasen nötrdür, yani kodon yeniden ataması, anormal veya işlevsiz proteinlerin üretilmesi olmaksızın meydana gelecektir.
Kod değişikliği için bir diğer kavram ise, belirli bir kodonun hem tanımayan tRNA hem de mutant bir tRNA tarafından belirsiz bir şekilde kodlandığı bir ara aşamadan geçerek kodon yeniden atamasının meydana geldiğini öne süren 'belirsiz ara' teorisidir (49, 50). Böyle bir belirsiz kodlamanın ve iki tRNA arasındaki rekabetin bir sonucu, tanımayan tRNA'yı kodlayan genin nihai olarak ortadan kalkması ve kodonun mutant tRNA tarafından ele geçirilmesi olabilir (37, 51). Aynı mekanizma, bir durdurma kodonunu tanıyan bir tRNA mutasyonla ortaya çıktığında ve durdurma kodonunu ilgili salıverme faktöründen ele geçirdiğinde, bir durdurma kodonunun anlamlı bir kodona yeniden atanması için de geçerli olabilir. Belirsiz ara hipotezi altında, organizmanın hayatta kalması üzerinde önemli bir olumsuz etki beklenebilir, ancak mantar Candida zeylanoides'teki CUG kodonunun (normalde lösin kodlayan) ya lösin (%3-5) ya da serin (%95-97) olarak kodlanması bu senaryoya inanç verdi (37, 52).
Son olarak, kodun evrimsel modifikasyonları 'genom düzleştirme' ile ilişkilendirilmiştir (53, 54). Bu hipotez altında, mitokondriyal genomları en aza indirme seçici baskısı, özellikle üç durdurma kodonundan birinin yeniden atanmasına yol açar.
Kodon yeniden atamasını açıklayan üç teori münhasır değildir, çünkü 'belirsiz ara' aşaması, GC açısından zengin kodonların içeriğinde önemli bir düşüşten önce gelebilir, böylece kodon yeniden ataması, özellikle organel genomlarında ve mikoplazmalar gibi paraziter bakterilerin küçük genomlarında, sıklıkla genom minimizasyonu baskısı altında bir evrimsel mekanizmalar kombinasyonu tarafından yönlendirilebilir (38, 54, 56, 57).
Kodun doğası, kökeni ve evrimi hakkındaki temel teoriler
Varyant kodların varlığı ve unnatural amino asitlerin dahil edilmesindeki deneylerin başarısı, genetik kodun bir dereceye kadar evrilebilirliğe sahip olduğunu göstermektedir. Bununla birlikte, bu sapmaların tümü yalnızca birkaç kodonu içerir, bu nedenle kodun ana özelliklerinde, yaşamın tüm tarihi boyunca veya daha kesin olarak, tüm modern (selüler) yaşam formlarının Son Evrensel Ortak Atasının (LUCA) zamanından beri değişmemiş gibi görünmektedir. Genetik kodun bu evrenselliği ve yapısının bariz rastgele olmaması bir açıklama(lar) çığlığıdır. Elbette, Crick'in donmuş kaza/kod genişleme teorisi, herhangi bir özel mekanizma gerektirmeyen ve yalnızca modern versiyonuna benzeyen gelişmiş bir translasyon sistemine sahip bir LUCA'nın varlığına dayanan varsayılan bir açıklama olarak kabul edilebilir (yani, örtük varsayım, LUCA'nın ilkel, çok yanlış translasyona sahip bir "progenot" olmadığıdır (58)). Ancak, bu açıklama genellikle yetersiz kabul edilir, öncelikle en genel, epistemolojik gerekçelerle, çünkü bir anlamda bir "açıklama değil" olması ve ikinci olarak, varyant kodların varlığı ve kodun ek olarak, deneysel olarak ortaya çıkarılan esnekliği (yukarıya bakınız) donmuş kaza görüşüne bir meydan okuma sunması nedeniyle. Gerçekten de, standart koda değişikliklerin "sızmasının" yolları varmış gibi görünmesi ve yine de, aynı sınırlı değişikliklerin çeşitli soy dizilerinde bağımsız olarak evrimleşmiş gibi görünmesi, kod yapısının rastlantısal olmayabileceğini düşündürmektedir. Amino asit atamalarının desenini standart genetik koddaki fizikokimyasal veya biyolojik faktörlere veya bir kombinasyonuna bağlamak için üç, zorunlu olarak birbirini dışlamayan ana teori öne sürülmüştür. Oldukça dikkat çekicidir ki, bu teorilerin her birinin merkezi fikirleri, moleküler biyolojinin klasik çağında, kod deşifre edildikten kısa bir süre sonra veya daha önce formüle edilmiştir ve sayısız sonraki gelişmelere rağmen bugüne kadar geçerli kalmaktadır. Önce üç teoriyi kendi tarihsel bağlamlarında kısaca özetleyelim ve ardından her birinin mevcut durumunu tartışalım.
Stereokimyasal teori, belirli amino asitler için kodon atamalarının, amino asitler ile ilgili nükleotid üçlüleri (kodonlar veya antikodonlar) arasında var olan bir fizikokimyasal afinite tarafından belirlendiğini ileri sürer. Böylece, bu model sınıfı altında, kodun özel yapısı hiç de rastlantısal değil, aksine gerekli ve muhtemelen benzersizdir. İlk stereokimyasal model, DNA'nın yapısı çözüldükten hemen sonra ve etkin bir şekilde kodun fikriyle birlikte 1954'te Gamow tarafından geliştirilmiştir (59). Gamow, amino asitleri ve çeşitli nükleotidler tarafından oluşturulan baklava şeklinde 'delikler' ile amino asitleri ilişkilendirmek için açık bir mekanizma önermiştir. Daha sonra, kod deşifre edildikten sonra, daha gerçekçi stereokimyasal modeller önerildi (60–62), ancak bunlar genellikle amino asitler ve ilgili üçlüler arasında spesifik etkileşimleri tespit etmedeki doğrudan deneylerin başarısızlığı nedeniyle olası görülmedi (5, 6). Yine de, stereokimyasal teorinin içsel çekiciliği, geçerliyse, kod evriminin nasıl başladığını görmeyi çok daha kolaylaştırarak bu alanda daha fazla deneysel ve teorik faaliyeti teşvik etti.
Kod evriminin uyarlanabilir teorisi, genetik kodun yapısının, kodun sentezlenen proteinlerdeki hataların etkisini en aza indirecek şekilde, kodun en sağlam olacak şekilde şekillendiğini öne sürer. 'Ölümcül mutasyon' hipotezini (63, 64) ayırt etmek mümkündür, bu hipotez altında standart kod, nokta mutasyonlarının etkisini en aza indirmek için evrimleşmiştir ve 'translasyon hatası en aza indirme' hipotezi (65, 66), kodun evriminde en önemli baskının translasyonel yanlış okumaların etkisini en aza indirmek için seçim olduğu iddiasındadır.
Bu iki tür kuvvetin birleşimi de düşünülebilir. İlgili kodonların benzer amino asitleri kodlaması gerçeği ve yanlış çevirmenin kodonların birinci ve üçüncü pozisyonlarında daha sık meydana geldiği, oysa ikinci pozisyonun amino asit özellikleriyle en iyi korelasyon gösterdiği yönündeki deneysel gözlemler, uyarlanabilir teoriyi destekleyen kanıtlar olarak ileri sürülmüştür (65, 67, 68). Translasyon hatası en aza indirme hipotezi, daha sonra standart kodun optimizasyon derecesini analiz etmek için önemli bir araç haline gelen Monte Carlo simülasyonlarından istatistiksel destek de aldı (69).
Eşevrim teorisi, standart kodun yapısının amino asit biyosentez yollarını yansıttığını ileri sürer (70). Bu senaryoya göre, kod, amino asit biyosentez yollarıyla birlikte evrimleşti, yani kod evrimi sırasında, öncü amino asitlerin kodon alt kümeleri, ürün amino asitlerini kodlamak için yeniden atandı. Koevrim hipotezinin temel fikri Crick'in kod genişleme senaryosu ile aynı olmasına rağmen, amino asit öncül-ürün çiftlerinin açık bir şekilde tanımlanması ve ima edilen öncül-ürün çiftleri için güçlü istatistiksel destek (70, 71), eşevrim teorisine geniş kabul kazandırdı.
Kod evrimi problemine tamamlayıcı bir yaklaşım, kodun özelliklerinin farklı türde eşevrimler tarafından belirlendiği, yani kodonlar ve ilgili tRNA antikodonları (51) veya kodonlar ve aminoasil-tRNA sentetazları (72) ile eşevrim olduğu bir "tRNA merkezli" görüşü savunur. Bu eşevrim, öncelikle translasyon hatalarının oranının ve etkisinin en aza indirilmesi (51) veya kod evriminin erken aşamalarında kodlama belirsizliğinin azaltılması (72) açısından yorumlanmıştır.
Stereokimyasal teori: ilgi çekici ipuçları ama sonuçlandırıcı kanıt yok
Kapsamlı erken deneyler, amino asitler ve ilgili üçlüleri arasında en iyi ihtimalle zayıf ve nispeten spesifik olmayan etkileşimler tespit etmiştir (5, 73, 74). Yine de, kodonlar (antikodonlar) ve ilgili amino asitler arasında nispeten zayıf, orta derecede seçici bir afinite bile, daha sonra güncel koda evrilen ilkel kodun ortaya çıkmasını tetiklemek için yeterli olabilirdi; bu kodda özgüllük, tRNA'ları ve aminoasil-tRNA sentetazları içeren çok daha kesin ve dolambaçlı, dolaylı mekanizmalarla korunmaktadır. Dahası, amino asitler ve üçlüler arasındaki etkileşimin, üçlülerin uygun konformasyonunu sağlayan spesifik RNA yapıları bağlamında yalnızca tespit edilebilecek kadar güçlü olduğu iddia edilebilir; bu, trinükleotidler veya ilgili polinükleotidler ile yapılan doğrudan deneylerin başarısızlığının nedeni olabilir. Gerçekten de, stereokimyasal teorinin modern versiyonu olan 'kaçış üçlü teorisi', ilkel kodun, amino asit bağlayan RNA molekülleri içinde bulunan amino asitler ve ilgili üçlüler arasındaki etkileşimler yoluyla işlev gördüğünü öne sürer (75). Bu teorinin altında yatan deneysel gözlemler, rastgele dizi karışımlarından amino asit bazında seçilen kısa RNA moleküllerinin (aptamerler) sırasıyla amino asitler için ilgili üçlülerle önemli ölçüde zenginleştirildiğidir (76, 77). Test edilen 8 amino asitten (fenilalanin, izolösin, histidin, lösin, glutamin, arginin, triptofan ve tirozin) (75), yalnızca glutamin seçilen aptamerlerin kodonu ile seçilen aptamerlerin dizisi arasında bir korelasyon göstermedi. Bu analizlere uygulanan doğrudan istatistiksel test, seçilen aptamerlerin kodonları ve dizileri arasındaki gözlemlenen korelasyonun şans eseri elde edilme olasılığının son derece düşük olduğunu gösterdi; en ikna edici sonuçlar arginin için görüldü (75). Bununla birlikte, (daha önceki aptamer verilerine uygulanan) daha muhafazakar istatistiksel prosedürler, aptamer-kodon korelasyonunun istatistiksel bir yapaylık olabileceğini öne sürer (78) (ancak bkz. (79)).
Standart kodun aptamer-amino asit bağlanma verilerine göre ne kadar alışılmadık olduğunu hesaplamak için farklı bir istatistiksel analiz kullanılmıştır (75, 77). Standart kodun rastgele alternatif kodlarla karşılaştırılması, aptamer seçimi verileriyle standart kodd an daha güçlü bir korelasyona sahip olan rastgele kodların yalnızca çok küçük bir kısmının olduğunu göstermiştir (gerçek genetik kod, rastgele kodların %90.3'ünden daha fazla kodon ilişkisine ve rastgele kodların %99.8'inden daha fazla antikodon ilişkisine sahiptir). Ancak bu hesaplamanın öncülleri tartışılabilir, çünkü standart kodun yapısı oldukça rastgele değildir ve yalnızca benzer yapılara sahip kodlarla karşılaştırmanın alakalı olacağı savunulabilir, bu durumda aptamer seçimi sonuçları önemli görünmeyebilir.
Genel olarak, aptamer deneylerinin düşündürücü olmasına rağmen, kodun stereokimyasal teorisi için davayı çözemediği görülmektedir. Yukarıda belirtildiği gibi, afiniteler oldukça zayıftır, bu nedenle gerçekleri hakkındaki sonuçlar bile benimsenen istatistiksel modellere bağlıdır. Daha da rahatsız edici olanı, farklı amino asitler için aptamerlerin ya kodon dizisiyle ya da antikodon dizisiyle veya hatta her ikisiyle (75) zenginleşme göstermesidir, bu etkileşimlerin kodun fiziksel temeli olduğu gerçeğiyle uzlaştırılması zor olan bir tutarlılık eksikliği.
Uyarlanabilir teori: kodun evrimsel optimizasyonunun kanıtı
Tercüme hatası en aza indirme hipotezini destekleyen nicel kanıtlar, standart kodun rastgele alternatif kodlarla karşılaştırılmasından çıkarılmıştır. Herhangi bir kod için maliyeti aşağıdaki formülle hesaplanabilir:
$\phi(a(c))=\sum_{c}\sum_{c'}p(c'|c)d(a(c'),a(c))$, (I)
burada $a(c): C \rightarrow A$ verilen bir koddur, yani 20 amino asit ve durdurma sinyali $a(c) \in A$'ya 64 kodon $c \in C$'nin eşlenmesidir; $p(c'|c)$, $c$ kodonunun $c'$ kodonu olarak yanlış okunmasının göreceli olasılığıdır ve $d(a(c'),a(c))$ ise, tanımayan amino asit $a(c)$'nin yanlış dahil edilen amino asit $a(c')$ ile değişiminin maliyetidir. Bu yaklaşıma göre, maliyet $\phi(a(c))$ ne kadar düşükse, kod yanlış çevirilmelere karşı o kadar sağlamdır, yani kodun uygunluğu o kadar büyüktür.
Haig ve Hurst (16), standart kodd an daha sağlam olan rastgele kodların kesrini elde eden ilk makul güvenilir sayısal tahminleri elde etmişlerdir. Bu tahminlere göre, iki kod arasındaki herhangi bir yanlış okumanın eşit derecede olası olduğu varsayılırsa ve amino asitlerin fizikokimyasal benzerliğinin ölçüsü olarak polar gereksinim ölçeği (80) kullanılırsa, rastgele bir kodun standart kodd an daha uygun olma olasılığı $P1 \approx 10^{-4}$'tür. Freeland ve Hurst, kodon pozisyonlarının tekdüze olmamasını ve baz bağımlı geçiş yanlılığını hesaba katan rafine edilmiş bir maliyet fonksiyonu kullanarak, standart kodd an daha iyi performans gösteren rastgele kodların kesrinin $P2 \approx 10^{-6}$ olduğunu göstermişlerdir, yani 'genetik kod milyonda biridir' (81). Sonraki analizler, standart kodun hata en aza indirilmesinin daha da yüksek tahminlerini ortaya çıkarmıştır (15, 17, 82, 83).
Standart kodun yanlış okumalara karşı yüksek sağlamlığının ikna edici gösterilmesine rağmen, translasyon hatası en aza indirme hipotezinin bazı içsel sorunları olduğu görülmektedir. İlk olarak, bir kodun sağlamlığının herhangi bir tahminini elde etmek için, maliyet fonksiyonunun tam formunu (I) belirtmek gerekir, bu fonksiyon en basit halinde bile, kodon yanlış okuma olasılıklarının belirli bir matrisinden ve amino asit ikameleri ile ilişkili belirli maliyetlerden oluşur. Freeland ve ark. (81) tarafından önerilen $p(c'|c)$ matrisinin formu yaygın olarak kullanılmaktadır (örneğin, (15, 83–86)), ancak destekleyici veriler yetersizdir. Özellikle, birinci ve üçüncü kodon pozisyonlarındaki yanlış çevirmenin ikinci pozisyondakinden daha yaygın olduğu ikna edici bir şekilde gösterilmiştir (65, 87, 88), ancak ikinci pozisyondaki geçiş yanlısı yanlış çevirme mevcut verilerden zor gerekçelendirilebilir. Bu sorunun üstesinden gelmek için bir ölçüde, Ardell ve Sella, genom içeriğindeki değişiklikleri kod değişiklikleriyle birlikte modellerken ilk popülasyon-genetik kod evrimi modelini formüle ettiler (89–91). Bu yaklaşım, kod evriminin uyarlanabilir kavramının bir genellemesidir ve ölümcül mutasyon ve translasyon hatası en aza indirme hipotezlerini birleştirir ve mutasyonlar arasında geçişlerin enlemlerden çok daha sık olduğu bilinen gerçeğini içerir (92, 93). Temelde, Ardell-Sella modeli, kodun onu protein üretmek için kullanan genlerle eşevrimini tanımlar ve kod değişikliklerinin kitlesel zararlı etkisine bağlı olarak genler üzerindeki kodun "dondurma etkisini" açıkça hesaba katar (90). Bu model altında, evrilen kodlar, standart kodunkine benzer yapılarda ve benzer sağlamlık seviyelerinde "donmaya" eğilimlidir.
Fonksiyon (I) ile ilgili bir diğer sorun, amino asitlerin fizikokimyasal benzerliğinin bir ölçüsüne dayanmasıdır. Herhangi bir böyle tek bir ölçünün tamamen yeterli olamayacağı açıktır. Amino asit dizisi karşılaştırması için yaygın olarak kullanılan PAM gibi amino asit ikame matrisleri, kod evriminin incelenmesi için uygun görünmemektedir, çünkü bu matrisler standart kod tarafından kodlanan protein dizilerinin karşılaştırılmasından türetilmiştir ve dolayısıyla o kodd an bağımsız olamaz (94). Bu nedenle, amino asitlerin fizikokimyasal özelliklerinin ilk prensip karşılaştırmasından türetilen, polar gereksinim ölçeği (80) gibi kodd an bağımsız bir matris kullanmak gerekir. Ancak, bu tür matrislerin olası sayısı çok fazladır ve "en iyi" olanı seçmek için net kriterler yoktur. Böylece, matris seçiminde keyfilik doğaldır ve bunun bir kodun optimizasyon derecesi üzerindeki etkisi değerlendirmek zordur.
Hata en aza indirme hipotezine (95) potansiyel olarak ciddi bir itiraz, $P1$ ve $P2$ tahminleri, standart kodun çoğu rastgele alternatife göre daha üstün olduğunu gösterse de, standart kodd an daha uygun olan olası kodların sayısının hala çok büyük olmasıdır (kodun sağlamlık tahminlerinin kullanılan rastgeleleştirme prosedürüne bağlı olduğu unutulmamalıdır; en sık kullanılan, amino asit atamalarının eşanlamlı kodon serileri arasında karıştırılmasını içerir, bu da $20! \approx 2.4 \cdot 10^{18}$ olası kodun aranmasına neden olur; farklı rastgele kod üreteçleri önemli ölçüde farklı sonuçlar üretebilir (86)). Hata en aza indirme seçimi kod evriminin ana gücü olsaydı, standart kod için göreceli optimizasyon seviyesinin gözlenenden önemli ölçüde daha yüksek olması gerektiği öne sürülmüştür (96). Hata en aza indirme hipotezinin destekçileri tarafından sunulan karşı argüman, rastgele kod maliyetlerinin dağılımının çan şeklinde olması, daha sağlam kodların uzun bir kuyruk oluşturması, uyarlama sürecinin doğrusal olmaması nedeniyle mutlak minimuma yaklaşmanın son derece olasılık dışı olmasıdır (17).
Gözlemlenen kod sağlamlığının, hata en aza indirme ile ilgisi olmayan seçici kuvvetler tarafından yönlendirilen evrimin bir yan ürünü olabileceği öne sürülmüştür (97). Özellikle, standart koddaki amino asitlerin rastgele olmayan atamalarının, kodon yakalama veya belirsizlik azaltma süreçleriyle kademeli kod evrimiyle neredeyse tamamen açıklanabildiği gösterilmiştir. Ancak bu sonuç, amino asit biyosentez yollarının evriminin spesifik yorumuna dayanmaktadır ki bu, hala tartışmalı bir konudur (98, 99).
Kod optimizasyon seviyesi nedir ve kod oraya nasıl ulaşmış olabilir?
Kodun evrimini etkileyen seçici kuvvetlerin tam doğası ne olursa olsun, standart kodun translasyonel yanlış okumalara ve mutasyonlara karşı önemli ölçüde sağlam olduğu bir gerçektir. Bu nedenle, kodun optimizasyon düzeyini mümkün olduğunca objektif olarak belirlemek önemli görünmektedir. Bu problemle ilişkili ilgi çekici sorular, standart kodun ne kadar evrim geçirdiği ve böyle bir evrim için en olası başlangıç noktasının ne olacağıdır.
Kod optimizasyonunun toplam düzeyi tahminleri uzun bir geçmişe sahiptir. Doğrudan karşılaştırma, standart kod ile rastgele kodların ortalama maliyet değerine göre en sağlam kod arasında yapılabilir. Bu optimizasyon düzeyi ölçüsüne en aza indirme yüzdesi adı verilmiştir (100, 101); daha kesin olarak, MP = ($\phi_{mean}$ − $\phi_{stand}$)/($\phi_{mean}$ − $\phi_{min}$), burada $\phi_{mean}$ rastgele kodların ortalama maliyetidir, $\phi_{stand}$ standart kodun maliyetidir, $\phi_{min}$ en uygun kodun maliyetidir [tüm değerler (I) formülü şeklinde belirli bir maliyet fonksiyoni verilerek hesaplanır]. Standart kodun en aza indirme yüzdesi, amino asit değişebilirliğinin ölçüsü olarak polar gereksinim ölçeği kullanıldığında ~%70 olarak tahmin edilmiştir (96, 101). Şekil 2, formül (I) tarafından verilen maliyet fonksiyonunun değerini en aza indirmek için amino asitlerin kodon atamalarının değiştirilmesiyle translasyon hatalarına karşı sağlamlık için optimize edilmiş bir kodun bir örneğini göstermektedir. Bu koda göre, standart kodun en aza indirme yüzdesi %78'dir (bu MP değeri, daha gerçekçi bir yanlış okuma matrisi $p(c'|c)$ kullanıldığı için Di Giulio (96) tarafından bildirilenlerden biraz daha yüksektir).
Son zamanlarda, genetik kodun olası evrimsel yörüngelerini sınırlı bir alan içinde araştırdık (yalnızca standart kodla aynı blok yapısına ve aynı yozlaşma düzeyine sahip kodlar analiz edildi) (86). Kod uzayının bu küçük kısmının seçimi arkasındaki varsayım, kod evriminin erken bir aşamasında, blok yapısının mevcut biçiminde ("donmuş") sabitlendiğidir, bu da dramatik zararlı bir etki olmadan değiştirilemez (bu, açıkça Crick'in donmuş kazasıyla ilgili bir düşüncedir). Bu nedenle, temel bir eleme evrimsel algoritması kullanarak, amino asit atamalarının dört kodonlu veya iki kodonlu seriler arasında takas edilmesini içeren temel adımlarla kod optimizasyon düzeyini araştırdık. Standart kodun özellikleri, dört set rastgele kodun özellikleriyle karşılaştırılmıştır (tamamen rastgele kodlar, standart kodd an daha fazla sağlamlığa sahip rastgele kodlar ve ilk iki setin optimizasyonundan kaynaklanan iki kod seti). Bu model altında, kod uygunluk manzarası son derece engebeli olup, neredeyse her rastgele kod kendi yerel maksimumunu ortaya çıkarır. Oldukça beklenmedik bir şekilde, rastgele bir koddan başlayarak, standart kodun optimizasyon seviyesine ortalama 10–12 evrimsel adımda kolayca ulaşılabilir ve genellikle optimizasyon, optimizasyon standart kodd an başladığında ulaşılabilen seviyeye devam edebilir. Başlangıç noktası standart kodd an daha sağlam olan rastgele bir kod olduğunda, optimizasyon prosedürü standart kodd an ulaşılabilecek seviyeden çok daha yüksek optimizasyon seviyeleri üretir, yani standart kod, benzer sağlamlık seviyelerine sahip çoğu rastgele kodd an olduğundan çok daha yakındır. Standart kodun açıklanan dört set kodla karşılaştırılması, standart kodun optimize edilmiş rastgele kodlar setine çok yakın olduğunu göstermektedir. Böylece, standart genetik kod, rastgele bir kodd an yerel zirvenin zirvesine doğru yukarı yönlü bir evrimsel yörüngede yaklaşık yarı yolda (kodon serisi takas sayısı açısından ölçülen) bulunan bir nokta gibi görünmektedir. Ayrıca, bu zirve oldukça vasat olup, manzarada çok sayıda daha yüksek zirve bulunmaktadır (Şekil 3). Bu model altında, standart kodun yerel olarak kararlı olmadığı, yani küçük bir bozulma (ek bir takas) ile kolayca "iyileştirilebileceği" vurgulanmalıdır. Bu nedenle, (I) fonksiyonunun kod uygunluğunun yeterli bir ölçüsü olduğu varsayımı altında, standart kodun daha fazla optimizasyon eksikliğini donmuş kazadan başka bir şeye bağlamak zordur.
Eşevrim teorisi: kod ile amino asit metabolizması arasında bir bağlantı mı?
Eşevrim teorisi ((71, 102, 103)'te gözden geçirilmiştir), prebiyotik sentezin 20 modern amino asidi üretemediğini, bu nedenle amino asitlerin bir alt kümesinin genetik koda ve translasyona birlikte dahil edilmeden önce biyosentetik yollarla üretilmesi gerektiğini öne sürer; dolayısıyla kodun ve amino asit biyosentez yollarının eşevrimi (104). Bu nedenle, amino asitlere kodon atamaları, amino asitler arasındaki metabolik bağlantılarla yönlendirilmiş olabilir. Eşevrim teorisine göre, amino asitlerin genetik koda girişinin üç ana aşaması vardı: ilk (aşama 1) amino asitler prebiyotik sentezden geldi, aşama 2 amino asitleri aşama 1 amino asitlerinden biyosentez yoluyla koda girdi ve aşama 3 amino asitleri post-translasyonel modifikasyonlar yoluyla proteinlere tanıtılır (105). Aşama 1 amino asitlerinin özel seçimi (Şekil 4), amino asit görünüm sırasını çıkarmak için kullanılan çeşitli kriterlerin (98) (bir istisna dışında) ve yüksek enerjili proton radyasyonuna maruz bırakılan karbon monoksit-nitrojen-su karışımından üretilen amino asitlerin listesinin bir incelemesiyle desteklenmektedir (106). Eşevrim teorisine göre, metabolik yolların evrimi, yeni amino asitler için önemli bir kaynaktır. Ön-ürün amino asit çiftleri göz önüne alındığında, standart koddaki amino asitlerin atanması şans eseri elde edilmesi neredeyse imkansızdır (Şekil 4). Proteinlerin amino asit bileşiminin evrilebilir olduğunu gösteren deneyler, eşevrim teorisini destekleyen kanıtlar olarak görülmektedir. Örneğin, Bacillus subtilis'in Triptofanını 4-fluoroTrp ile değiştirmek ve hatta Trp'yi tamamen yerinden etmek için mutasyona uğratılabileceği gösterilmiştir (107).
Eşevrim teorisine iki ana eleştiri yöneltilmiştir. İlk olarak, eşevrim senaryosu, amino asit öncül-ürün çiftlerinin seçimine çok duyarlıdır ve bu çiftlerin seçimi hiç de basit değildir. Gerçekten de, eşevrim teorisinin orijinal formülasyonunda, Wong doğrudan amino asitler arasındaki biyokimyasal olarak kurulmuş ilişkileri kullanmadı, bunun yerine hala tartışmalı olan ilkel metabolizmanın çıkarımsal reaksiyonlarını kullandı (70, 103). Amirnovin (108), büyük bir rastgele kod seti oluşturdu ve eğer Wong'un önerdiği orijinal 8 öncül-ürün çifti dikkate alınırsa, standart kodun çoğu rastgele kodd an önemli ölçüde daha yüksek bir kodon korelasyon skoruna (öncül-ürün amino asitlerini kodlayan bitişik kodonların sayısını hesaplayan bir ölçü) sahip olduğunu buldu (rastgele kodların yalnızca %0.1'i daha iyi performans gösteriyor). Ancak, Gln-His ve Val-Leu çiftleri kaldırıldıktan sonra (ikincisinin geçerliliği sorgulanmıştır (109)), daha iyi performans gösteren rastgele kodların oranı %3.6'ya yükselir ve öncül-ürün çiftleri E. coli'nin iyi karakterize edilmiş metabolik yollarından alındığında, rastgele bir kodun daha güçlü bir korelasyon gösterme oranı %34'e ulaşır. İkinci olarak, Wong'un istatistiksel analizinin biyolojik geçerliliği şüpheli görünmektedir (109). Ronneberg ve ark., tutarlı bir amino asit öncül-ürün çiftleri tanımı ile birlikte, sarkaç kuralına göre, genetik kodun amino asitleri kodlayan 61 işlevsel kodonu değil, 45 kodonu içerdiğini öne sürmüşlerdir, burada NNY biçimindeki her iki kodon tek bir kodon olarak kabul edilir çünkü bilinen hiçbir tRNA üçüncü baz pozisyonunda U veya C ile kodonları ayırt edemez. Bu varsayım altında, kodun eşevrim senaryosu için istatistiksel destek yoktu (109) (ancak bkz. (110)).
Bir uzlaşma senaryosu olası mı?
Yukarıda tartışıldığı gibi, genetik kodun doğası ve evrimi hakkındaki üç ana teori, uzun bir araştırma geçmişine ve önemli dolaylı kanıtların birikmesine rağmen, şu anda mevcut verilerle kesin olarak desteklenmemektedir. Örneğin, 'eşevrim teorisi kanıtlanmış bir teoridir' (103) veya 'ilgili kodonların ve/veya antikodonların RNA bağlama bölgelerinde beklenmedik derecede sık olduğu yönünde çok önemli kanıtlar var [...] Bu, genetik kodun önemli bir kısmının stereokimyasal bir temeli olduğunu gösteriyor' (75) gibi iddialarda bulunmak erken görünüyor. Bu teorilerin her birinin kodun kökeni ve evriminin bazı yönlerini yakalayabileceği ve birleştiğinde daha gerçekçi bir resim oluşturabileceği düşünülebilir mi? Prensipte, örneğin, ilk önce abiyogenik olarak sentezlenen amino asitlerin, ilgili stereokimyasal afiniteleri nedeniyle ilgili kodonlarını yakaladığını, daha sonra kodun eşevrim teorisine göre genişlediğini ve son olarak, amino asit atamalarının, translasyonel yanlış okumaların ve nokta mutasyonlarının genom üzerindeki etkisinin etkisini en aza indirmek için seçim altında ayarlandığını hayal ederek bu doğrultuda spekülasyon yapmak zor değildir. Böyle bir bileşik teori son derece esnektir ve sonuç olarak, standart kodun yapısına uyacak farklı süreçlerin göreceli katkılarını optimize ederek hemen hemen her şeyi "açıklayabilir". Elbette, böyle bir aşırı ayarlanmış senaryonun yanlışlanabilirliği veya daha genel olarak test edilebilirliği endişe konusu haline gelir. Yine de, her teorinin spesifik tahminlerinin incelenmesi, bileşik senaryonun yanlışlanmasının bir kısmını sağlamak için bir yere kadar götürebilir.
Eşevrim senaryosu, genetik kodun, tanımlanan öncül-ürün çiftleri fizikokimyasal olarak benzer amino asitlerden oluştuğu için yanlış çevrilmelere karşı son derece sağlam olması gerektiğini ima eder (97). Bununla birlikte, birkaç ayrıntılı analiz, eşevrimin tek başına standart kodun gözlemlenen sağlamlık düzeyini açıklayamayacağını, bu nedenle standart koda ulaşmak için hata en aza indirme seçimi altında ek evrimin gerekli olacağını düşündürmektedir (82, 85, 111). Bu nedenle, bileşik bir senaryonun olasılığı açısından, eşevrim ve hata en aza indirme uyumludur. Ancak, hata en aza indirme de gerekli görünürken, eşevrimin gerekliliği belirsizliğini korumaktadır.
Aptamer seçimi deneylerinde tespit edilen ilgili üçlüler ve amino asitler arasındaki afinitelerin, standart genetik kod tablosundaki son derece optimize edilmiş amino asit atamalarından bağımsız göründüğü (112). Bu nedenle, bu afiniteler kodun kökeni için ilgili olsa bile, standart kodun hata en aza indirme özelliklerinin hala bir açıklamaya ihtiyacı vardır. Stereokimyasal teorinin savunucuları, amino asit atamalarının bazılarının stereokimyasal olarak tanımlandığını, diğerlerinin ise gözlemlenen standart kod sağlamlığını sağlamak için hata en aza indirme seçimi altında evrildiğini savunmaktadır. Gerçekten de, standart kod tablosundaki 8–10 amino asit ataması sabitlendiğinde bile, son derece optimize edilmiş genetik kodlar üretmek için hala bolca alan olduğu gösterilmiştir (112). Ancak bu karışık stereokimya-seçim senaryosu bazı kanıtlarla çelişiyor gibi görünüyor. Belki de, paradoksal bir şekilde, ilgili üçlülerle afinitelerin bildirildiği amino asitlerin büyük ölçüde, koda geç eklenenler olarak kabul edilmesi: rapor edilen stereokimyasal afinitelere sahip 8 amino asitten yalnızca 4'ü, eşevrim teorisine göre aşama 1 amino asitleridir (Şekil 4). Özellikle, ilgili kodonlarla stereokimyasal bir ilişki için kanıtların en güçlü olduğu argüman edilen arginin, kod tablosundaki "en kötü konumlandırılmış" amino asittir, yani tüm amino asitler arasında, argininin kodon atamasında bir değişiklik, kodun uygunluğunda en büyük artışa neden olur (örneğin, (86)). Kod tablosundaki argininin bu alışılmadık konumu, kod evriminin farklı bir birleşik senaryosunu düşünmek için caziptir; bu senaryoda, kod evriminin erken aşaması öncelikle hata en aza indirme seçimi içerirken, daha sonraki bir aşamada kod, (zayıf) stereokimyasal afinitelerle ilişkili yeni amino asitlerin işe alınmasıyla değiştirilmiştir.
Genetik kodun evrenselliği ve kolektif evrim
Kodun, eşevrim teorisine göre biyosentetik yolları yansıtıp yansıtmadığına veya proteinlerin yanlış çevrilmesinin getirdiği yükü en aza indirmek veya hatta proteinlerin adaptif evrim hızını en üst düzeye çıkarmak için uyarlanabilir evrimsel kuvvetler tarafından şekillendirilip şekillendirilmediğine bakılmaksızın (113–115), temel ama genellikle gözden kaçan bir soru, kodun neden (neredeyse) evrensel olduğudur. Elbette, stereokimyasal teori, prensipte, basit bir çözüm sunabilir, yani standart koddaki kodon atamaları, amino asitler ve ilgili kodonları arasındaki belirli afinite tarafından kesin olarak dikte edilir. Yukarıda belirtildiği gibi, afiniteler çelişkili ve zayıftır ve kodun hata en aza indirme özelliğini açıklamaz. Bir alternatif, kodun translasyonel hatalara karşı sağlamlık açısından (neredeyse) mükemmelliğe evrimleşmiş olması veya belki de başka bir optimizasyon kriteri olabileceği ve bu (neredeyse) mükemmel standart kodun diğer tüm versiyonları geride bırakmış olması olabilir. Ancak, en azından çeviri hatalarına karşı sağlamlık açısından bunun böyle olmadığından uzakta olduğunu gördük (Şekil 3). Kodun evrenselliğinin açıklaması olarak kalan şey, donmuş kaza ile karmaşık yaşamın evrimi için yeterince yüksek bir sağlamlığa kodu getiren seçimle birlikte bir versiyonudur.
Donmuş kaza görüşü altında, kodun evrenselliği, benzersiz bir LUCA'nın varlığının bir epifenomeni olarak kabul edilebilir. LUCA, hücresel yaşama uyumlu minimum uygunluğa sahip bir koda sahip olmalıydı ve o kod o zamandan beri donmuş durumda (gözlemlenen sınırlı varyasyon hariç). Bu akıl yürütmenin altında yatan örtük varsayım, LUCA'nın zaten modern versiyona (neredeyse) kadar gelişmiş bir translasyon sistemine sahip olmasıdır. Gerçekten de, mevcut selüler yaşam formları arasında tRNA sentetazların neredeyse tam bir kümesi de dahil olmak üzere translasyon sisteminin temel bileşenlerinin evrenselliği, translasyon sisteminin ana özelliklerinin bir pre-LUCA evrim aşamasında sabitlendiğini güçlü bir şekilde düşündürmektedir (116, 117).
Son zamanlarda önerilen ilkel replikatörlerin kolektif evrim hipotezi, kodun evrenselliğini donmuş kaza ve farklı bir tür seçici baskı kombinasyonu yoluyla açıklar (118, 119). Merkezi fikir, genetik kodun evrenselliğinin, ilkel replikatör toplulukları arasında genetik bilginin (yatay) akışını sürdürmenin bir koşulu olması ve bu bilgi akışının herhangi bir karmaşık biyolojik varlığın evrimi için bir koşul olmasıdır. Replikasyonların yatay transferi, benzer kod kümelerinin ortaya çıkması için araçlar sağlayacak ve bu kümeler nişler için rekabet edecektir. Virüs benzeri genetik varlıkların topluluklarının kolektif evrimi fikri, hücresel yaşamın kökenine giden bir aşama olarak, Haldane'nin 1928'deki klasik makalesine kadar uzanır (120), ancak daha sonra modern terimlerle yeniden formüle edilmiş ve genişletilmiştir (121–124) ve fiziksel terimlerle geliştirilmiştir (125, 126). Vetsigian ve ark. (118), kolektif evrim altında kodun kaderini, Sella ve Ardell (90, 91) tarafından açıklanan kod evriminin popülasyon-genetik modelinin bir genellemesi olan basit bir evrimsel model kullanarak incelemiştir. Hata en aza indiren kodların seçici avantajı dikkate alındığında, yatay gen alışverişine yetenekli genetik elementlerin alt popülasyonlarının bir topluluğu içinde, evrimin neredeyse evrensel, yüksek oranda sağlam bir koda yol açtığı gösterilmiştir (118).
Sonuçlar yerine: Kod nasıl evrildi (ve bunu asla bilebilecek miyiz)?
Bu incelemenin yazılması, Crick'in genetik kodun evrimi üzerine 40. yıldönümüne denk geliyor (6), bu makale bu alandaki önceki araştırmaları sentezledi ve bu zor konu hakkındaki temel düşünce hatlarını öngördü. Görüşümüze göre, kod optimizasyonunu modellemek için kapsamlı ve çoğu durumda ayrıntılı girişimlere, eşevrim teorisi doğrultusunda dâhiyane teorileştirmeye ve önemli deneylere rağmen, kesin ilerleme çok az kaydedilmiştir.
Elbette, bu, kod evriminin yönlerinin anlaşılmasında ilerleme olmadığı anlamına gelmez. Bazı net sonuçlar negatiftir, yani a priori olarak makul olan bazı olasılıkları dışlamaya izin verir. Böylece, yıllarca süren deneyler, aptamer seçimi üzerine en son kapsamlı çalışmalar da dahil olmak üzere, kodun amino asitler ve ilgili kodonları (veya antikodonları) arasında düz bir stereokimyasal yazışmaya dayanmadığını göstermektedir. Amino asitler ve polinükleotidler arasındaki doğrudan etkileşimler, kodun evriminin bazı erken aşamalarında önemli olmuş olabilir, ancak kod evriminin ana faktörü olmaları pek olası değildir. Neredeyse aynısı eşevrim teorisi için de geçerlidir: amino asit metabolizmasının evrimi ve kodun evrimi bir ölçüde bağlantılı olmuş olabilir, ancak bu eşevrim kodun özelliklerini tam olarak açıklayamaz. Genetik kod evriminin uyarlanabilir teorisi hakkındaki karar, özellikle kodun translasyonel hatalara karşı çeviri hatalarının etkisini en aza indirme seçimi tarafından şekillendirildiği hipotezi farklıdır: görüşümüze göre, bu, pozitif olarak iddia edebilecek tek kod evrimi kavramıdır, çünkü (şimdiye kadar) en azından bir miktar seçimi çağırmadan kodun gözlemlenen sağlamlığını çeviri hatalarına karşı açıklama girişimi ikna edici olmamıştır. Bu nedenle, translasyon hatası en aza indirme seçimi, kodun standart forma evriminde önemli bir rol oynamış gibi görünmektedir. Bununla birlikte, uyarlanabilir teorinin de bir ters yüzü vardır, çünkü standart kod, hata en aza indirmede özellikle olağanüstü görünmemektedir ve görünüşe göre aynı blok yapısına sahip rastgele bir kodd an kolayca ulaşılabilir. "Genetik kod milyonda bir" (hatta yüz milyonda bir) gibi ifadeler teknik olarak doğrudur, ancak bir, standart kodun son derece engebeli bir uygunluk manzarasında dikkat çekici olmayan yerel bir zirvenin yamacında oturduğu gerçeğini göz ardı ederse kolayca yanlış anlaşılabilir (Şekil 3). Elbette, kod evriminin modellenmesinde kullanılan uygunluk fonksiyonlarının (Denklem (I) ve benzerleri) kodun evrimindeki "gerçek" optimizasyon kriterinin yakın bir temsili olmaktan uzak olduğu göz ardı edilemez. Öyleyse durum buysa, kod evrimi alanının genel değerlendirmesinin özellikle kasvetli olması gerekir, çünkü bu, kodda neyin önemli olduğuna dair hiçbir fikrimizin olmadığını ima edecektir. Ancak bu pek olası görünmüyor. Gerçekten de, gen dizisi evrimi ile ekspresyon arasındaki korelasyonlar üzerine yapılan son teorik ve ampirik çalışmalar, potansiyel olarak toksik yanlış katlanmış proteinlerin üretiminin en aza indirilmesinin evrimin kritik bir faktörü olduğunu güçlü bir şekilde düşündürmektedir (127–130). Hüküm sürmek mantıklıdır ki, protein yanlış katlanmasının en aza indirilmesi, protein dizileri, kodon kullanımı (130) ve genetik kodun kendisi de dahil olmak üzere çeşitli seviyelerde evrimi paralel olarak yönlendirmiştir. Ayrıca, Eigen'in kvasitürler teorisi ve mutasyonel erime'den kaynaklanan genel düşünceler, herhangi bir karmaşık yaşamın evrimi için replikasyon ve ifadenin yeterli sağlamlığının bir ön koşul olduğunu gösterir (131–133). Böylece, evrimsel biyolojiden gelen bu daha genel akıl yürütme çizgileri, kodun evriminin kodun modellenmesinin özel sonuçlarıyla tamamlanmaktadır.
Ve sonra, tabii ki, kodun kökeni ve evrimi problemini çözmek için 40 yıl sonra bile ilgili görünen Crick'in ünlü "açıklama yapmama"sı olan donmuş kaza var. Gerçekten de, standart kodun nispeten mütevazı optimizasyon seviyesi göz önüne alındığında, kod evriminin donmuş kaza ile hata en aza indirme seçimi kombinasyonunu içerdiği neredeyse kesindir. Diğer tanınmış ve/veya hala bilinmeyen faktörlerin de katkıda bulunup bulunmadığı, daha fazla teorik, modelleme ve deneysel araştırmada ele alınması gereken bir konudur.
Bu tartışmayı kapatmadan önce, kodun kendisinin özelliklerine ve evrimine odaklanan buradaki analizlerin, kodun kökeni gizemini gerçekten çözme potansiyeline sahip olup olmadığını sormak mantıklıdır. Böyle bir potansiyelin sorunlu olduğu anlaşılıyor çünkü zorunlu olarak, ele aldıkları problemleri çözülebilir kılmak için, kod evrimi üzerine tüm çalışmalar, öncül evrimin gerçekliğine ilgileri en iyi ihtimalle şüpheli olan biçimselleştirilmiş ve az ya da çok yapay ortamlarda gerçekleştirilmektedir (ister tanımlanmış bir kod dönüşüm seti altında modelleme olsun isterse de aptamer seçimi deneyleri). İlkel evrimin kolektif karakteri ile karakterize edilen ilkel replikatörlerin kolektif karakteri arasındaki nedensel bağlantı hakkındaki hipotez (118), çekici ve kavramsal olarak önemli görünüyor çünkü kod evrimi çalışmasını salt bir formalistik alıştırmadan daha geniş ve daha biyolojik olarak anlamlı bir bağlama taşıyor. Yine de, bu öneri, oldukça makul olsa bile, çok daha genel ve daha zor bir problemin, belki de tüm evrimsel biyolojinin en zor problemi olan çok daha genel ve daha zor bir problemin yalnızca bir yönüdür. Gerçekten de, kodun kökeni ve evrimi için herhangi bir senaryonun, kodlama ilkesinin kendisinin ve onu bünyesinde barındıran translasyon sisteminin kökeni anlayışı ile birleştirilmedikçe boş kalacağı mantıklıdır. Bu problemin merkezinde kasvetli bir kısır döngü var: Proteinler işlevsel olmadan önce son derece karmaşık translasyon sisteminin evrimi için seçici kuvvet ne olurdu? Ve tabii ki, yeterince etkili bir translasyon sistemi olmadan proteinler olamazdı. Döngüyü kırmak için çeşitli hipotezler öne sürülmüştür (bkz. (132–135) ve içindekiler) ancak şimdiye kadar bunlardan hiçbiri yeterince tutarlı görünmüyor veya gerçek bir teori statüsünü iddia etmek için yeterli desteğe sahip değil.
Kod evriminin erken aşamalarına dair yeni pencereler sunabilmek için, çiftli kodlar gibi daha basit öncüllerden standart kodun ayrıntılı modellemesi sunulabilir (72). Özellikle, standart kodu en olası çiftli sürümlerine geri izlemek, olağanüstü, neredeyse maksimum hata en aza indirme kapasitesine sahip kodlara yol açar (ASN ve EVK, yayınlanmamış), bu gözlem, hata en aza indirme seçimine ve/veya donmuş kazaya translasyonun gerçek kökenine en az bir adım daha yaklaştırır. Yine de, bunlar ve diğer teorik yaklaşımlar, evrimsel geçmişin yeniden yapılandırılmasının, işlevsel proteinler üretmek için gereken karmaşıklık eşiğini geçme yeteneğinden yoksundur ve bu ufku geçmek için somut yolların şu anda bilinmediğini kabul etmeliyiz.
Deneysel cephede, seçilmiş ribozimlerin katalitik yetenekleri etkileyicidir (136). Özellikle, son derece verimli kendi kendini aminoasilasyon yapan ribozimler ve peptidiltransferaz reaksiyonunu katalizleyen ribozimler elde edilmiştir (137, 138). Ayrıca, katalitik aktivitesi peptidler tarafından uyarılan ribozimler seçilmiştir (139), bu da RNA-protein bağlantısının olası kökenlerine işaret etmektedir (133). Yine de, teorik yaklaşımlarla yakın bir analojide, kodun kökenini gerçekten yeniden oluşturma potansiyeline sahip herhangi bir deneyden haberdar değiliz, hatta ciddi planlama aşamasında bile.
Kod evrimi çalışmasındaki güncel durumun özetlenmesi, önemli bir şüphecilikten kaçınamayacağımız anlamına geliyor. Moleküler biyolojinin şafağında, 50 yıldan fazla bir süre önce sorulan temel ikili soru: "genetik kod neden böyledir ve nasıl ortaya çıkmıştır?", başka 50 yıl sonra bile alakalı kalabilir. Tesellimiz, biyolojide daha temel bir problem düşünemiyor olmamızdır.
Teşekkürler
Genetik kodun evrimi çalışması nispeten iyi odaklanmış bir alan olmasına rağmen, 50 yıllık araştırma boyunca biriken literatür geniştir ve kısa bir dergi makalesinde hepsini kapsayamayacağımız kesindir. Yer kısıtlamaları nedeniyle ilgili çalışmaları alıntı yapılmayan tüm meslektaşlarımızdan içten özürlerimizi sunarız. EVK, Aspen Center for Physics'teki "Evrim: Atomlardan Organizmalara" çalıştayında Nigel Goldenfeld, Paul Higgs ve Claus Wilke'ye düşündürücü tartışmaları için minnettardır (Aspen, CO), 8/10/2008-8/31/2008. Yazarların araştırması, Sağlık ve İnsan Hizmetleri kurumlar arası programı (NIH, Ulusal Tıp Kütüphanesi) tarafından desteklenmektedir.