Sayfa:Türkçe Kısa Metinlerde Yazar Tanıma Yönteminin Sınanması ve Geliştirilmesi.pdf/9

Bu sayfa doğrulanmış

Türkçe Kısa Metinlerde Yazar Tanıma Yönteminin Sınanması ve Geliştirilmesi


Bulgular

İki Yazar ve Birer İleti

Yazarı bilinmeyen birer ileti (M0) ile ikişer yazarın birer iletisini (rastgele numaralandırılmış M1 ve M2) içeren toplam üç farklı deney (rastgele numaralandırılmış D1, D2 ve D3) gerçekleştirilmiştir. M0 yazarını tespit edebilmek için bu ileti, M1 ve M2 iletileriyle ayrı ayrı karşılaştırılmış, sonucun güvenilirliğini arttırmak maksadıyla M1 ve M2 mesajları da kendi aralarında mukayese edilmiştir. İki yazarın birer iletisiyle yapılan deneylerin ilkine detaylarıyla yer verilmiş, diğer iki deneyin sonuçları ise aşağıdaki tabloda özet olarak sunulmuştur.

Buna göre ilk deneydeki M0 ve M1 iletileri arasında iki ölçütte ayrılık tespit edilmiş, benzerlik gösteren ölçüte ise rastlanmamıştır. Noktalama yönünden ayrılık teşkil eden ölçüt, karşılaştırmada kendini üç kez tekrar etmiştir: M0 iletisinde bir cümle mevcutken cümle sonunda noktalama işareti kullanılmamış, M1 iletisinde yer alan üç cümlenin sonunda da uygun noktalama işaretlerine (sırasıyla nokta, nokta ve soru işareti) yer verilmiştir. M0 iletisinde Instagram adlı ve görsel veri paylaşımı üzerine kurulu sosyal medya platformundaki bir işlevden bahsedilirken “story’e” denilmiş, M1 iletisinde ise Twitter’deki ana sayfa (akış ya da “timeline”, kısaca “time”) kastedilerek “tayma” yazımı tercih edilmiştir. Bu iki ifade, gerek yabancı sözcüğün Türkçe metinde kullanımı gerekse sosyal medya platformlarının birer alanı olarak eşdeğerdir ve yazımlarında farklılık görülmesi, yazar tanıma çalışması bakımından kayda değer bulunmuştur.

M0 ve M2 iletileri arasında ise bir benzerlik bulunmuştur: Her iki iletide de birer cümle oluşturulmuş ancak sonlarında noktalama işaretine yer verilmemiştir. Bunun dışındaki ölçütler ise ya metnin biçim ve içeriği itibariyle uygulanabilir değildir ya da her iki iletinin de büyük harfle başlaması gibi ölçünlü dil kuralları kapsamında benzer sonuç verdiğinden “etkisiz” olarak değerlendirilmiştir.

Sonuç olarak iki yazarla yapılan ilk deneyde, M0 ile M2 iletilerinin aynı yazar tarafından yayınlandığı değerlendirmesi yapılmış ve bu karşılaştırma doğrulanmıştır.

Tablo 2. İki yazar ve birer iletiyle gerçekleştirilen ikinci ve üçünü deneylerin özeti
Deney Karşılaştırma Ayırt edici ölçüt Benzerlik sayısı Ayrılık sayısı Sonuç
D2 M0-M1 5 0 5 M0=M2
M0-M2 2 2 0
D3 M0-M1 3 3 0 M0=M1
M0-M2 3 0 3

Yukarıdaki tabloda ikinci deneyle ilgili sunulan M0-M2 benzerliğiyle ilgili olarak, her iki iletinin de sonunda nokta kullanılmasıyla birlikte her iki örnekte de noktanın ikişer kez ardışık olarak kullanıldığı ve bunun, benzerliği pekiştiren bir unsur olarak değil, iki ayrı benzerlik olarak değerlendirildiğini belirtmek gerekir. Zira yazarın her iki iletide noktalama işareti kullanımı ile birlikte bunların sayısına dair eğilimi de tutarlıdır. M0 ve M2 iletilerinin aynı yazara ait olduğu değerlendirmesi yapılarak gerçekleştirilen kontrolde bu tespit doğrulanmıştır.

Üçüncü deneyde ise M0 ve M2 iletileri arasında 3 ayırt edici ölçüt kullanılmış ve bunların tamamı farklı sonuç vermişken, M0 ve M1 iletileri arasında yapılan karşılaştırmada kullanılan 3 ölçütün tamamından benzeşen sonuç alınmıştır. Karşılaştırmanın ardından M0 ve M1 iletilerinin aynı hesaptan yayınlandığı görülmüştür.

İki Yazar ve Beşer İleti

İkinci aşamada yazarı bilinmeyen bir M0 iletisi karşısında, iki yazarın beşer farklı iletisi karşılaştırmaya konu edilmektedir. Bu noktada önceki deneylerin aksine M0 iletisi ile diğer iletiler değil, yazarlar (rastgele numaralandırılmış Y1 ve Y2) karşılaştırılacaktır. Diğer bir deyişle beş ayrı iletisi toplanan her iki yazarın da, bu beş paylaşımdaki genel dil kullanımları tespit edilerek M0 iletisi karşısında ele alınmaktadır.

254