Sayfa:Türkçe Kısa Metinlerde Yazar Tanıma Yönteminin Sınanması ve Geliştirilmesi.pdf/13

Bu sayfa doğrulanmış

Türkçe Kısa Metinlerde Yazar Tanıma Yönteminin Sınanması ve Geliştirilmesi


yazarlarında ise muhtelif ayırt edici ölçütlerin varlığı tespit edilse de M0 iletisiyle karşılaştırılabilecek yalnız bir ölçüt bulunduğu görülmüştür: Cümle ve ileti sonu noktalama işaretlerinin varlığı. Diğer ölçütlerin hiçbiri, M0 iletisinin biçim ve içeriği itibariyle karşılaştırılabilir durumda değildir. Y5 yazarının ise noktalama işareti kullanmakla birlikte her iletisinde cümle içindeki bazı sözcüklerin büyük harfle başladığı ve tüm iletilerin, tıpkı şiirlerde olduğu gibi mısra düzeniyle ve her satır arasında birer boş satır bırakarak oluşturulduğu görülmüştür. Cins isimlerin başında büyük harf kullanılması ve iletinin biçimsel düzeni, ayrı ayrı ayırt edici birer ölçüt olarak not edilmiştir. Y3 yazarının cümle sonlarında noktalama işareti kullanmaması ve diğer tüm yazarların tesadüfî biçimde cümle ve ileti sonunda ilgili noktalama işaretine sürekli olarak yer vermesi, bu incelemede belirleyici olmuştur. Ne var ki bu tespitin hem istatistiksel hem de bilimsel olarak güvenilirliği tartışmaya son derece açık görünmektedir. Dolayısıyla yazar tanıma çalışmaları için mümkün olduğunca çok veri içeren, uzun metinlerin elde edilmesinin önemi bir kez daha ortaya çıkmaktadır.

Bu çalışma kapsamında gerçekleştirilen son deneyde kontrol iletisi, oldukça az miktarda dilsel veri içermekte olup toplam 5 sözcükten ibarettir. İletinin (ve cümlenin) sonunda noktalama işaretine yer verilmeyişi, yöntem bağlamında yer verilen ölçütler içerisindeki tek ayırt edici özellik olarak görülmektedir. Ayrıca içerik ele alındığında, yazarın erkek olduğu anlaşılmaktadır. Buna göre Y1 yazarı noktalama yönünden, Y3 ve Y5 yazarları ise hem noktalama hem de cinsiyet yönünden ayrılık göstermektedir. Zira Y3 ve Y5 yazarlarının oluşturduğu iletilere bakıldığında, yazarların kadın olduğu açıkça tespit edilebilmektedir. Y1, Y2 ve Y4 yazarlarının karşılaştırma iletileri ise bu konuda net bir tespit yapılmasına elverişli değildir. Netice olarak, Y2 ve Y4 yazarları, noktalama işareti kullanmamaları bakımından M0 iletisiyle benzerlik taşımaktadır. Bu esnada, her ne kadar yöntem bağlamında bir ölçüt olarak sunulmamışsa da iletilerin uzunluğunda açık bir farklılık olduğu görülmüştür. Kontrol iletisi 5 sözcükten ibaretken; Y2 yazarının iletileri en az 8, en fazla 27 ve ortalama 15,8 sözcükten oluşmaktadır. Y4 yazarının iletileri ise en az 5, en fazla 12 ve ortalama 6,8 sözcük içermektedir. Y2 yazarı, iletilerinde genellikle sebep-sonuç ilişkileri kurmuş, sıralı ve birleşik cümleler tercih etmiştir. Y4 yazarı ise daha yalın ve basit biçimde birtakım tespitlere yer verirken bunları basit cümlelerle aktarmıştır. Bu yönüyle, sözcük sayısı ve cümle kurgularının ayrı bir ölçüt olarak sayılmasıyla Y4 yazarının iletileri ile M0’ın benzerliği artmış ve yapılan kontrolde, M0 iletisinin Y4 tarafından yazıldığı doğrulanmıştır.

Özgül olarak bu deney, yöntem dahilindeki ölçütlerin ortalama sözcük sayısı ve ileti kurgusunu (cümle yapıları ile bir konunun ele alınış biçimlerini) da içerecek şekilde geliştirilmesinin, özellikle kısa metinlerde yazar tespiti açısından önemini ortaya koymaktadır. Bunlarla birlikte ileti içeriklerinden anlaşılabilmesi hâlinde, yazar cinsiyetinin veya yazara ilişkin başka birtakım bilgilerin belirlenmesi de uygulamaya ve dolayısıyla yazarın tespit edilmesine katkı sağlayacaktır.

Sonuç ve Öneriler

Çalışma kapsamında iki yazarın birer ve beşer iletisi ile beş yazarın birer ve beşer iletisi üzerinde, üçer farklı uygulama olmak üzere toplam 12 karşılaştırma gerçekleştirilmiştir. Yapılan bu incelemelerde, yöntem başlığı altında sunulan ölçütlerin bazıları hiç kullanılmamış, bazıları ise sıkça belirleyici bir özellik olarak öne çıkmıştır. Ölçütler arasındaki bu farklılığın hem örneklemin rastgele oluşu nedeniyle bazı ölçütlerin kullanılabileceği ya da ayırt edici olabileceği iletilerle karşılaşılmamasından hem de bazı ölçütlerin ayırt edicilik gücünün daha yüksek oluşundan kaynaklandığı değerlendirilmektedir.

Özellikle incelemeye konu olan ileti sayısının azaldığı ve yazar sayısının arttığı deneylerde, önceden tahmin edilebileceği gibi, yazar tespitinin zorlaştığı ve karşılaştırmanın, daha çok sayıda iletiyle yapılan deneylere göre, daha az güvenilir sonuç verdiği ortaya çıkmıştır. Diğer yandan bu çalışmanın örneklemi için veri toplayan, tasnif eden ve incelemeyi gerçekleştiren bir kişi olması dolayısıyla; karşılaştırmayı yapan, her deneyde kontrol iletisinin yazarı ile bir karşılaştırma iletisinin yazarının mutlaka eşleşeceğinin bilincindedir. Diğer bir deyişle iki yazarlı deneylerde %50, beş yazarlı deneylerde ise %20 ihtimalle yazar, hiçbir ölçüt olmaksızın doğru tespit edilecektir. Ne var ki 6’sı iki, diğer 6’sı beş yazarlı deneylerin hiçbirinde hatalı bir tespit yapılmamış ve hiçbir deneyde “sonuç” kısmı boş bırakılmamış, karşılaştırma sonucunda kararsız kalınmamıştır. Kontrol iletisi yazarının, karşılaştırma iletilerini oluşturan yazarlar arasında bulunmayabileceği durumlarda ise kimi deneylerde sonuç verilmeyebileceği, kararsız kalınabileceği değerlendirilmektedir. Bu durumda dahi, hatalı bir tespit yapılmamış olacaktır.

258