
Bugün öğrendim ki: Bilim insanları, Microsoft Excel'in gen isimlerini sürekli olarak tarihe dönüştürmesi ve bunun da yayınlanan genetik araştırmalarda yaygın hatalara yol açması nedeniyle 2020 yılında 27 insan geninin adını değiştirdi.
24 Ekim 2023, 11:25 ET Güncellemesi: Microsoft, Windows ve macOS üzerindeki Excel'i güncelleyerek otomatik veri dönüştürmeyi kapatmak için bir geçiş düğmesi ekledi. Bu makalenin orijinal versiyonu aşağıdadır.
İnsan genomunda on binlerce gen bulunur: hepimizi benzersiz kılan tüm özellikleri ve karakterleri ifade etmek için birleşen minik DNA ve RNA kıvrımları. Her gene, bilim insanlarının araştırmaları koordine etmek için kullandığı sembol olarak bilinen bir ad ve alfa-nümerik kod verilir. Ancak son bir yılda, hepsi Microsoft Excel'in sembollerini sürekli olarak yanlışlıkla tarih olarak okuması nedeniyle yaklaşık 27 insan geni yeniden adlandırıldı.
Bu sorun, ilk başta duyulduğu kadar şaşırtıcı değil. Excel, elektronik tablo dünyasında bir devdir ve bilim insanları tarafından çalışmalarını takip etmek ve hatta klinik deneyler yapmak için düzenli olarak kullanılır. Ancak varsayılan ayarları daha sıradan uygulamalar için tasarlanmıştır, bu nedenle bir kullanıcı, "Membrane Associated Ring-CH-Type Finger 1"in kısaltması olan MARCH1 gibi bir genin alfa-nümerik sembolünü bir elektronik tabloya girdiğinde, Excel bunu 1 Mart tarihi olarak dönüştürür.
Çalışmalar, makalelerdeki genetik verilerin beşte birinin Excel hatalarından etkilendiğini buldu
Bu, son derece sinir bozucu, hatta tehlikeli, bilim insanlarının elle düzeltmek zorunda kaldığı verileri bozuyor. Aynı zamanda şaşırtıcı derecede yaygındır ve hakemli bilimsel çalışmaları bile etkiler. 2016'da yapılan bir çalışma, yayınlanmış 3.597 makaleyle birlikte paylaşılan genetik verileri inceledi ve bunların yaklaşık beşte birinin Excel hatalarından etkilendiğini buldu.
İngiltere'deki Quadram Enstitüsü'nde bir sistem biyoloğu olan Dezső Módos, The Verge'e "Gerçekten, gerçekten sinir bozucu" dedi. Yeni dizilenmiş genetik verileri analiz etmeyi içeren Módos, Excel hatalarının her zaman meydana geldiğini, çünkü yazılımın genellikle bilim insanları sayısal verileri işlerken eldeki ilk şey olduğunu söylüyor. "Yaygın bir araç ve biraz hesaplama açısından bilgisizseniz onu kullanacaksınız," diyor. "Doktora çalışmalarım sırasında ben de kullandım!"
Bunun kolay bir çözümü de yok. Excel, bu otomatik biçimlendirmeyi kapatma seçeneği sunmuyor ve bundan kaçınmanın tek yolu, tek tek sütunlar için veri türünü değiştirmek. Yine de, bir bilim insanı verilerini düzeltebilir ancak biçimlendirmeyi kaydetmeden bir CSV dosyası olarak dışa aktarabilir. Veya başka bir bilim insanı, doğru biçimlendirme olmadan verileri yükleyebilir ve gen sembollerini tekrar tarihlere dönüştürebilir. Sonuç olarak, bilgili Excel kullanıcıları bu sorundan kaçınabilirken, hata yapılması kolaydır.
Ancak yardım, genlerin adlarını standartlaştırmaktan sorumlu bilimsel kuruluş olan HUGO Gen Adlandırma Komitesi (veya HGNC) şeklinde geldi. Bu hafta HGNC, "veri işleme ve erişimi etkileyen semboller" de dahil olmak üzere gen adlandırma için yeni yönergeler yayınladı. Bundan böyle, insan genlerinin ve ifade ettikleri proteinlerin, Excel'in otomatik biçimlendirmesini göz önünde bulundurarak adlandırılacağını söylüyorlar. Bu, MARCH1 sembolünün artık MARCHF1, SEPT1'in ise SEPTIN1 haline geldiği anlamına geliyor, vb. Gelecekteki karışıklığı önlemek için eski semboller ve adlar HGNC tarafından kaydedilecektir.
HGNC koordinatörü Elspeth Bruford, The Verge'e son bir yılda bu şekilde yaklaşık 27 genin adının değiştirildiğini söylüyor, ancak yönergelerin kendisi bu hafta resmen duyurulmadı. Bruford, "Önerilen güncellemeleri görüşmek için ilgili araştırma topluluklarına danıştık ve değişiklikler yürürlüğe konulurken bu genler hakkında özel olarak yayın yapan araştırmacıları da bilgilendirdik" diyor.
Bruford'un açıkça belirttiği gibi, gen adlandırma sanatı büyük ölçüde fikir birliği ile yönlendirilir. Sözlükleri güncellemekle görevli leksikograflar gibi, Gen Adlandırma Komitesi de çalışmalarından en çok etkilenecek bireylerin ihtiyaçlarına karşı duyarlı olmalıdır.
Ancak durum her zaman böyle değildi. Genetiğin erken, sınır günlerinde, gen adlandırma genellikle yaratıcı bilim insanlarının bir oyun alanıydı ve bu da "sonic hedgehog" (evet, o Sonic'ten adını almıştır) ve "Indy" ("henüz ölmedim"in kısaltması; mutasyona uğradığında meyve sineklerinin ömrünü ikiye katlayabilen genin işlevine bir gönderme) gibi kötü şöhretli genlere yol açtı.
Ancak şimdi HGNC meseleyi sıkı bir şekilde ele aldı ve mevcut yönergeler keyfe veya egoya pek yer bırakmıyor. Odak noktası pratik kaygılardır: karışıklığı nasıl en aza indirebiliriz? Bu nedenle komite, gen sembollerinin benzersiz olması ve gen adlarının kısa ve özel olması gerektiğini söylüyor. Alt simge veya üst simge kullanamazlar; yalnızca Latin harfleri ve Arap rakamları içerebilirler; ve isimleri veya kelimeleri, özellikle de saldırgan olanları (bu kuralın "ideal olarak herhangi bir dilde" geçerli olması gerekir) yazmamalıdırlar.
Gen adları "ideal olarak herhangi bir dilde" saldırganlıktan kaçınmalıdır
Bruford, gen adlandırma kararının hafife alınmadığını ancak alışılmadık olmadığını söylüyor. Örneğin, isim olarak okunabilecek birçok gen sembolü, aramalarda yanlış pozitifleri önlemek için yeniden adlandırıldı. Geçmişte CARS, CARS1, WARS, WARS1 ve MARS ise MARS1 oldu. Başka değişiklikler de hakareti önlemek için yapıldı.
Bruford, "Her zaman bir klinisyenin bir ebeveyne çocuklarının belirli bir gendeki mutasyona sahip olduğunu açıklamak zorunda kaldığını hayal etmek zorundayız" diyor. "Örneğin, HECA'nın daha önce 'kafa vakası homologu (Drosophila)' gen adı vardı, meyve sineğindeki eşdeğer gene göre adlandırılmıştı, ancak potansiyel hakareti önlemek için bunu 'hdc homologu, hücre döngüsü düzenleyici' olarak değiştirdik."
Ancak Bruford, yönergelerin özellikle yazılımdan kaynaklanan sorunları gidermek için ilk kez yeniden yazıldığını söylüyor. Şimdiye kadar tepkiler son derece olumlu görünüyor - bazıları neşeli bile diyebilir.
Genetikçi Janna Hutz, HGNC'nin yeni yönergelerinin ilgili bölümünü Twitter'da paylaştıktan sonra, topluluktan gelen yanıt coşkuluydu. Hutz'un kendisi "İnsan Gen Adlandırma Komitesi'nin bu duyurusundan HEYECANLANDIM" diye tweet attı. Massachusetts'teki Broad Enstitüsü'nde hesaplamalı biyolog olan Mudra Hegde, "Sonunda!!!" diye yanıt verdi. Takma adlı bir Twitter kullanıcısı "Günün en güzel haberi!" dedi.
Microsoft insan genetiğine karşı bir savaşta neden kazandı?
Bruford, karar hakkında bazı anlaşmazlıklar olduğunu belirtiyor, ancak bunlar çoğunlukla tek bir soru etrafında toplanıyor: Excel'in çalışma şeklini değiştirmek yerine insan genlerini yeniden adlandırmak neden daha kolaydı? Tam olarak neden, Microsoft ve tüm genetik topluluğu arasındaki bir savaşta, geri adım atmak zorunda kalan bilim insanlarıydı?
Microsoft yorum talebine yanıt vermedi, ancak Bruford'un teorisi, değişikliğin yapılmasına değmeyecek kadar basit olduğu yönünde. "Bu, Excel yazılımının oldukça sınırlı bir kullanım durumu," diyor. "Microsoft'un, Excel kullanıcılarının devasa topluluğunun geri kalanının son derece yaygın olarak kullandığı özelliklerde önemli bir değişiklik yapması için çok az teşviki var."
Ancak Bruford bu durumdan buruk görünmüyor. Ne de olsa, bilim insanlarının kendileri tarafından uzun vadeli bir çözüm sunulabilirken, bu sorunları çözmek için varsayımsal bir Excel güncellemesi beklemek mantıklı olmazdı, diyor. Microsoft Excel geçici olabilir, ancak insan genleri biz var olduğumuz sürece var olacak. Onlara işe yarayan isimler vermek en iyisidir.
Düzeltme: Makale, Excel kullanıcılarının, gen sembollerinin tarihlere dönüştürülmesi hatasını önleyen biçimlendirmesini koruyan elektronik tabloları kaydedebileceklerini açıklığa kavuşturmak için düzeltilmiştir. Hatamızdan dolayı üzgünüz.