Bugün öğrendim ki: Tayca isimler uzun ve karmaşıktır çünkü her ailenin kan bağıyla sınırlanmış benzersiz bir soyadı vardır ve betimleyici ilk isimlerin manevi avantajları olduğuna inanılır. Buna paralel olarak, Tayların yasal isimlerinden türetilmemiş kısa takma adları da vardır.

İsimlerin herhangi bir dilde analiz edilmesi, eşleştirilmesi ve çözümlenmesi zaten karmaşıktır, ancak Tay isimleri özellikle anlaşılması ve eşleştirilmesi açısından benzersiz zorluklar sunmaktadır. Tayland'daki isim verme geleneklerinin, Tay isimlerini doğru bir şekilde ayrıştırabilen bir isim eşleştirme modeli oluşturmak için anlaşılması gereken büyüleyici bir geçmişi ve evrimi vardır.

Verilerinizde Tay isimleri varsa, Tay isim eşleştirme sistemlerinde aranması gereken birkaç olmazsa olmaz şey vardır.

Basit başlayın: Tay alfabesini öğrenin

Herhangi bir Latin olmayan dilde olduğu gibi, geliştiricilerin öncelikle yazı sistemini anlamaları gerekir. Çoğu Asya dili gibi, Tay dili de Batı geliştiricilerine aşina olan Latin alfabesiyle yazılmaz. Herhangi bir metin yeni bir yazı sistemine çevirilebilse de, en doğru sonuçlar her zaman yerel yazı sistemindeki metnin, bu sistemde eğitilmiş bir modelle analiz edilmesiyle elde edilir.

Tay alfabesinde 44 ünsüz ve 15 ünlü sembolünün yanı sıra 28'e kadar ünlü biçimi ve 4 ton belirteci vardır. Çince'ye benzer şekilde, tonlama telaffuzundaki varyasyonlar da bir kelimenin anlamını tamamen değiştirebilir. Yazılı Tayca, doğru bir şekilde işlenmesi için dile özgü metin analitiği modelleri gerektirir.

Bir (takma) isimde ne var?

Tarihte Tay halkı, bazı harflerin, sayıların ve kelimelerin şanslı veya şanssız olduğuna inanmıştır. Ebeveynler, çocuklarının doğum zamanı ve tarihi için şanslı bir isim seçtiklerinden emin olmak için falcılara ve astrologlara danıştı. Sonuç, manevi açıdan avantajlı kabul edilen ancak pratikte günlük yaşamda kullanımı çok zor olan uzun ve karmaşık ilk isimlerin oluşturulması oldu.

Pek çok Tay vatandaşı ayrıca kötü ruhların çocuklara zarar verebileceğine inanıyordu. Çocuğun adının kullanılmasının, bu ruhların dikkatini çektiği ve çocukları riske attığı düşünülüyordu. Uzun bir ilk isim kullanmak yerine, ebeveynler çocuklarına doğumda basit, bir veya iki heceli bir takma isim verirler. Tay takma isimleri çift amaçlı hizmet etmiştir. Pratik olarak, basit isimler günlük kullanım için daha kolaydır. Manevi olarak, takma isimler kötü niyetli ruhları şaşırtır ve çocukları korur.

Tay takma isimlerinin verilen ilk isimle fonetik olarak bir bağlantısı nadiren vardır. Bunun yerine, çocuğun fiziksel özelliklerine, bir hayvanın adına, yabancı bir isimden türetilmiş veya tamamen uydurma bir heceden kaynaklanabilirler. Örneğin, adı ธัญมาศ (Thanyamas) olan bir Tay kadınının, "fare" anlamına gelen หนู (Nu) takma adı olabilir. Hem sosyal hem de profesyonel yaşamında, en resmi yasal belgeler haricinde Nu adını kullanacaktır.

Modern takma isimler

Batıl inançlara olan inanç azalsa da, çocuklara resmi bir ilk isim ve kısa bir takma isim verme geleneği ve takma isimlerin ilk isimlerden türetilmemesini tercih etme geleneği devam etmektedir.

Tay vatandaşları, birçok Amerikalı'nın adını kısaltması veya değiştirmesi gibi, gençler veya yetişkinler olarak ek takma isimler de kazanabilirler. Örneğin, "William", "Bill" olarak veya "Elizabeth", "Bizzy" olarak adlandırmayı tercih eder. Bu uygulama, özellikle Tay takma adları diğer kültürlere uygunsuz veya garip geliyorsa, Batılılarla sık sık etkileşim kuran Tay vatandaşları arasında özellikle yaygındır.

Örneğin, Apichatpong Weerasethakul (อภิชาติพงศ์ วีระเศรษฐกุล) adlı bir kişinin, Tay takma adı "Jei"den türetilen Amerikanlaştırılmış "Joe" takma adı olabilir. Benzer şekilde, takma adı "Fuk" (bir Tay yeşil kabak türünün adı) olan bir Tay çocuğu, daha "uygun sesli" yeni bir takma ad seçmeye karar verebilir.

Çapraz belirteç hizalama

Basit isim eşleştirme sistemleri, isimleri belirteç alanlarına (yani, ilk, orta, son) ayırır. Ad belirteçlerini farklı sırada içeren herhangi bir veri (örneğin, Sally Rider karşısında Rider, Sally), eşleşmeyi başaramaz.

Belirteçlerin kelime sırasına bakılmaksızın eşleştirilebilmesi, bir takma adın yanlışlıkla verilen ad olarak ve verilen adın orta ad olarak etiketlenebileceği Tay isimleri için özellikle gereklidir.

Örneğin, adı ประยุทธ์ จันทร์โอชา ("Prayut Chan-o-cha" veya "Prayuth Chan-ocha") olan bir kişinin takma adı ตู่ ("Tuu") olabilir. Her ad alanına veya belirtecine ayrı ayrı bakan bir isim eşleştirme sistemi, "ตู่ ประยุทธ์ จันทร์โอชา" ve "ประยุทธ์ จันทร์โอชา" isimlerine yanlış bir şekilde düşük bir eşleşme puanı verecektir.

Toplam eşleşme puanı: %47.03

Bunun yerine, akıllı isim eşleştirme, bir isme bütün olarak bakar ve kelime sırasına bakılmaksızın hangi belirteçlerin birbirleriyle uyumlu olduğunu belirler.

Silme cezası

Tay isimleri verileri takma adlar içerebileceği gibi içermeyebilir – doğum belgeleri gibi resmi belgelerde bile – bir Tay isimleri veritabanının değişken sayıda belirteç içeren isimler içermesi çok daha olasıdır.

Eşleşmeyen belirteçlere benzer şekilde, eksik belirteçler bir ismin genel eşleşme puanını düşürür. Bir silme cezası, farklı sayıda belirteç içeren iki isim için eşleşme puanını düşürür; örneğin, "Will Smith" ve "William Carroll Smith" isimlerinin eşleşme puanı, ilkinde orta ad eksik olduğu için cezalandırılacaktır.

Tay isimlerini eşleştirmek için ideal çözüm, kullanıcının silme cezasını ayarlamasına veya ortadan kaldırmasına olanak tanır.

Tay soyadlarının oluşturulması

İlk isimler ve takma isimlerin uzun bir geçmişi varken, Tay soyadları çok daha yeni bir olgudur. 1913 yılında, tüm Tayland'ın kalıcı sakinlerinin ilk kez soyadına sahip olmasını gerektiren Tay Vatandaşlık Yasası (Soyadı Yasası olarak da bilinir) kabul edildi. Soyadlar bu yasadan önce yaygın olmadığı için birçok aile basitçe bir isim uydurdu. Anlaşılabilir bir şekilde, aile üzerinde iyi bir etki bırakacak anlamlara sahip kelimeler seçtiler.

Tay kraliyet ailesi ayrıca ailelere onursal soyadları verebilir ve bu soyadlar mevcut soyada eklenir.

Sürekli büyüyen isimler

Tay Vatandaşlık Yasası ayrıca her soyadının benzersiz olmasını gerektirmiştir. Aileler seçtikleri soyadını hükümetle kaydettirdiler, ancak istedikleri isim zaten sicilde varsa onu değiştirmek zorunda kaldılar. Örneğin, "Jaturapattara" zaten kayıtlıysa, bir aile bunun yerine "Jaturapattarapong" gibi benzer bir şey seçebilir.

20. yüzyılın başlarında Tayland'da yaşayan büyük Çin nüfusunun da kayıtlı bir Tay soyadına sahip olması gerekiyordu. Başlangıçta, birçok kişi Çince soyadlarını "soyadı" anlamına gelen Tayca "แซ่" (sae) kelimesiyle kullanmayı seçti. Ancak her ailenin benzersiz bir isme sahip olması gereği, ortak bir isme sahip herhangi bir Çin ailesinin ek bileşenler eklemesi gerektiği anlamına geliyordu ve bu da giderek daha uzun isimlere yol açıyordu. Bugün görülen en uzun Tay isimlerinin çoğu Çin-Tay kökenli insanlara aittir.

Tayland'da "Smith" veya "Jones" yok

Sicil oluşturulurken teknolojinin yeterince gelişmiş olmaması nedeniyle Tay soyadlarında bazı örtüşmeler mevcuttur. Bununla birlikte, Tay isimleri yine de çoğu dildeki isimlerden çok daha benzersizdir. İki Tay vatandaşı aynı soyada sahipse, en azından uzaktan akraba olma olasılıkları çok yüksektir.

Bugün, yeni Tay vatandaşlarının yine benzersiz bir soyadı kaydettirmeleri gerekiyor, ancak artık o kadar uzun olamıyorlar. 1962 yılında, yeni Tay isimlerinin uzunluğunu sınırlandıran Kişi Adı Yasası kabul edildi. Yeni bir isim kaydettirmek için, ünlü sembolleri ve belirteçleri hariç olmak üzere ondan fazla Tay harfi içermemelidir. Ancak, kraliyet tarafından verilen herhangi bir unvan ve soyad, on karakter sınırını aşabilir.

Belirteçlere ağırlık verme

Bazı isimler, verilen veya aile isimleri olsun, diğerlerinden daha nadirdir. Benzersiz isimler, son isim eşleşme puanı hesaplanırken buna göre daha ağır şekilde değerlendirilmelidir.

Örneğin, bir veritabanındaki iki John'un aynı kişi olma olasılığı yüksek değildir çünkü John son derece yaygın bir isimdir. Buna karşılık, veritabanında iki Dweezil girişi varsa, bunların aynı kişiyi ifade etme olasılığı çok daha yüksektir.

Aynı model Tay isimleri için de geçerlidir. Neredeyse tüm Tay soyadları aileye özgü olduğu için, diğer dillerdeki soyadlardan çok daha nadirdir. Tay isimlerini eşleştirmek için ideal çözüm, belirteçlere benzersizliğe göre ağırlık atar ve kullanıcının ağırlıklandırma modelini manuel olarak ayarlaması seçeneğini sunar.

Soyadlar çoğu dilde daha önemli ve benzersizdir, ancak bu Tay isimleri için özellikle doğrudur. Soyadlara diğer belirteçlerden önemli ölçüde daha fazla ağırlık vermenize olanak tanıyan bir çözüm arayın.