Sayfa:Türkçe Kısa Metinlerde Yazar Tanıma Yönteminin Sınanması ve Geliştirilmesi.pdf/14

Bu sayfa doğrulanmış

Utku TANRIVERE


Yazar sayısının fazla olması ya da karşılaştırma iletilerinin az olmasının yanı sıra, kontrol iletilerinin çok kısa olup az miktarda dilsel veri içerdiği durumlarda da mukayesenin zorlaştığı görülmektedir. Karşılaştırma iletileri kısa olsa dahi, sayıca fazla olduklarında ölçütler yönünden belirgin birtakım farklılıklar ortaya koymaktadır. Ne var ki yazarı tespit edilmeye çalışılan kontrol iletileri, varoluşları itibariyle, ikame edilemez ve genişletilemez durumdadır. Kontrol iletisi için ayırt edici olmayan bir ölçüt ise ancak örneklemin elverişli olduğu, karşılaştırmada yer alan diğer başka yazarların birbirlerine olan benzerliklerini tespit etmede kullanılmakta ve böylelikle ikincil bir işleve sahip olabilmektedir.

Yapılan deneyler ve detaylarına yer verilen bulgular doğrultusunda, aşağıda maddeler hâlinde sıralanan konuların da birer ölçüt olarak yönteme eklenmesi gerektiği değerlendirilmektedir:

Büyük harf kullanımı: Yazarların iletiye, cümleye, tırnak içindeki cümleye başlarken veya özel adları (cümlenin başında veya içinde) yazarken büyük harf kullanma eğilimleri, kaynak gösterilen yöntemde ayrı bir başlık olarak ele alınmışsa da (Tanrıvere, 2018, s. 185) bu çalışma çerçevesinde konum yönünden bir yazım yanlışı olarak değerlendirilmiştir. Ne var ki bu ölçütün sıkça kullanılması, ayırt ediciliğinin yüksek olması ve bir “yazım yanlışı” olmanın ötesinde yazarlar tarafından tercih edilen üslubun bir parçası olması dolayısıyla, kaynak yöntemdeki gibi ayrı bir başlık olarak kullanılması gerektiği değerlendirilmektedir. Bu ölçüt, yazım ve noktalama başlığı altına eklenmiştir.
Sözcük sayısı: Özellikle birden fazla karşılaştırma iletisinin bulunduğu deneylerde, iletilerin uzunluğuna dair yazar eğilimlerinin ayırt edici olabildiği görülmüştür. Bu noktada, yazara ait iletilerdeki en az, en fazla ve ortalama sözcük sayıları, kontrol iletisi karşısında anlam kazanabilecek bir özelliktir. Bu ölçüt, sözcük ve bağlam başlığının konusu olarak eklenmiştir.
Kurgu: İletilerde sıklıkla karşılaşılan cümle türleri (basit, sıralı, birleşik) ile bir konunun nasıl ele alındığı, sözcük sayısı ile de yakından ilişkili olmakla birlikte, yazarların ayırt edilmesinde kullanılabilecek niteliktedir. Zira deneyler kapsamında iletileri incelenen yazarlardan bazılarının, bu yönde belirgin eğilimlerinin bulunduğu gözlemlenmiştir. Bu konu, içeriksel özelliği gözetilerek sözcük ve bağlam başlığında değerlendirilmektedir.
Vurgu > Diğer: Yöntemde vurgularla ilgili bir alt başlık bulunmakta ve burada büyük harf, tırnak işareti ve ünlem işaretiyle oluşturulan vurgular öngörülmektedir. Yapılan çalışmada, bazı harflerin tekrar edilmesi (“acccayip” gibi) ya da harfler arasında boşluk bırakılması (“n e d e n ?” gibi) gibi yollarla da vurgu oluşturulduğu görülmüştür. Bu nedenle, ilgili başlığın altına, öngörülmemiş olan ifadeler için “diğer” seçeneğinin eklenmesi kullanışlı olacaktır.
Profil bilgileri: Gerçekleştirilen son deneyde, ileti içeriklerinden hareketle yazarların cinsiyetlerine dair bir çıkarımda bulunulmuştur. Yazar tanıma uygulamasının temel amacı, metni oluşturan kişilerin ayırt edici dil kullanımlarını tespit etmek olsa da yazarların kimliklerine yönelik ayrım yapılabilmesine olanak sunan bilgiler de göz ardı edilmemelidir. Bu bağlamda yazarın cinsiyeti, yaşı, yaşadığı yer veya memleketi, mesleği gibi birtakım bilgileri açığa çıkaran ileti içerikleri de yazar tanıma çalışmaları yönünden ayrıca kayda değerdir. Sözcük ve bağlam düzeyinde, kullanılması hâlinde argo ile birlikte jargon ve terminoloji örneklerinin hangi konuya, bilim ya da meslek alanına dahil olduğu sorusu da yazara ilişkin profil bilgilerini elde etmeye yönelik olduğundan; “profil bilgileri” başlığının “argo ve jargon” kullanımını da kapsayacak biçimde, sözcük ve bağlam başlığı altında genişletilmesinin yerinde olacağı değerlendirilmektedir.
Şekil ve işaretler > Konum: Deneylerin gerçekleştirilmesinden önce yer verilen yöntemde şekil ve işaretlerle ilgili bir başlık oluşturulmuşsa da bu işaretlerin kullanıldığı konumlar itibariyle de yazarların ayırt edilebileceği görülmüştür. Yazarların iletinin başında, ortasında, sonunda ve hatta iletideki bir sözcük yerine çeşitli şekil ve işaretler kullanması dolayısıyla bunların konumları, ayrı bir alt başlık altında ele alınmalıdır.

259