Sayfa:Türkçe Kısa Metinlerde Yazar Tanıma Yönteminin Sınanması ve Geliştirilmesi.pdf/1

Bu sayfa doğrulanmış

Hacettepe Üniversitesi Edebiyat Fakültesi Dergisi
Hacettepe University Journal of Faculty of Letters
Aralık/December 2020 – 37(2), 246-262
doi:10.32600/huefd.656983

Hakemli Makaleler – Refereed Articles
Geliş Tarihi / Received: 09.12.2019 Kabul Tarihi / Accepted: 04.04.2020



Türkçe Kısa Metinlerde Yazar Tanıma Yönteminin Sınanması ve Geliştirilmesi

Testing and Developing Author Identification Method for Short Texts in Turkish


Utku TANRIVERE*


Öz

Yazar tanıma, adli dilbilimin belki de en önemli uygulamalarından bir tanesidir. Türkçe alan yazınına bakıldığında ise bu konudaki çalışmaların nispeten kısa bir süredir yapıldığı ve bu çalışmalarda çok kısa metinlerin kullanılmadığı görülmektedir (Amasyalı ve Diri, 2006; Taş ve Görür, 2007; Doğan ve Diri, 2010). Oysaki adli dilbilim çerçevesinde sadece birkaç sözcükten ibaret olan metinler dahi bir inceleme konusu olabilmektedir. Geçmişte, Twitter isimli mikroblog sitesinde yayınlanan metinler (tweet) üzerinde yapılan bir çalışma neticesinde Türkçe alan yazınında bir yöntem önerilmiştir (Tanrıvere, 2018). Bu çalışma kapsamında ise söz konusu yöntem, yine Twitter iletilerinden oluşan yeni bir bütünce ile sınanmış ve yöntemi oluşturan ölçütler sayıca arttırılıp nitel bağlamda da detaylandırılarak geliştirilmeye çalışılmıştır. Yöntem, yazarının kim olduğu bilinmeyen iletilerin yazarı bilinen iletilerle karşılaştırılması neticesinde olumlu sonuçlar vermiştir. Uygulama sürecinde öngörülmemiş başka birtakım ayırt edici ölçütlerin de varlığı gözlenmiş ve bunlar detaylıca sunularak, yöntemdeki ilgili ölçüt gruplarına dahil edilmeleri önerilmiştir. Elde edilen sonuçlar genel olarak, çok kısa metinlerde dahi yazar tespitinin mümkün olduğunu ve yöntemin adli bağlamlarda da kullanılabileceğini göstermektedir.
Anahtar sözcükler: Adli dilbilim, yazar tanıma, yazar tespiti, bireydil, kısa metinler, sosyal medya.

Abstract

Author identification is probably one of the most important applications of forensic linguistics. Considering scientific literature in Turkish language, related studies have been carried out relatively recently and very short texts have not been used in these studies (Amasyalı & Diri, 2006; Taş & Görür, 2007; Doğan & Diri, 2010). However, texts involving only a few words may also be a subject of study in terms of forensic linguistics. In the past, as a result of a study on published texts (tweets) on a micro-blog site “Twitter”, a method in the scientific literature in the Turkish language had been proposed (Tanrıvere, 2018). In the present study, however, that very method has been tested with a new corpus consisting of tweets again, and the markers within the method were developed by increasing the number and making elaborations qualitatively. This method has brought about successful results by comparing texts with known and unknown authors. In the implementation process, there have been some distinctive but unpredicted markers. These were also given in detail and proposed to be added to the relevant marker group within the method. The results of the study have shown in general author identification is possible even in very short texts and the method may also be used in forensic contexts.
Keywords: Forensic linguistics, author identification, authorship attribution, idiolect, short texts, social media.


* Hacettepe Üniversitesi Adli Bilimler Anabilim Dalı doktora adayı, filolog. E-posta: utkutanrivere@hacettepe.edu.tr,
ORCID: 0000-0003-2534-1701

246