Twitter duygu analizinde terim ağırlıklandırma yönteminin etkisi

Terim ağırlıklandırma, metin sınıflandırmada sonuçlar üzerinde doğrudan etkili olan önemli bir adımdır. Ancak, bir metin sınıflandırma problemi olarak ele alınan duygu analizinde farklı önişleme tekniklerine bağlı olarak ağırlıklandırma yönteminin davranışı değişebilmektedir. Bu çalışmada bilgi geti...

Full description

Bibliographic Details
Main Authors: Önder Çoban, Gülşah Tümüklü Özyer
Format: Article
Language:English
Published: Pamukkale University 2018-04-01
Series:Pamukkale University Journal of Engineering Sciences
Subjects:
Online Access:http://dergipark.gov.tr/pajes/issue/36922/419720?publisher=pamukkale
Description
Summary:Terim ağırlıklandırma, metin sınıflandırmada sonuçlar üzerinde doğrudan etkili olan önemli bir adımdır. Ancak, bir metin sınıflandırma problemi olarak ele alınan duygu analizinde farklı önişleme tekniklerine bağlı olarak ağırlıklandırma yönteminin davranışı değişebilmektedir. Bu çalışmada bilgi getirimi, metin sınıflandırma, doküman filtreleme gibi farklı çalışma alanları için yakın zamanda önerilen yöntemler Twitter duygu analizinde uygulanmış ve sonuçlar üzerindeki etkisi incelenmiştir. Öznitelikler çıkarılırken kelime torbası (BoW) ve karakter seviye N-gram olmak üzere iki farklı model kullanılmıştır. Deneyler Türkçe ve İngilizce Twitter mesajlarından oluşan veri kümeleri üzerinde uygulanmıştır. Twitter mesajlarının duygu sınıflandırması, Gizli Dirichlet Ataması (LDA) tabanlı konu modeli ile gerçekleştirilmiştir. Sınıflandırma aşamasında ise Destek Vektör Makinesi (SVM) algoritması kullanılmıştır. Deneysel sonuçlara göre, Twitter duygu analizi çalışmalarında kullanılabilecek en etkili terim ağırlıklandırma yöntemi önerilmiştir.
ISSN:1300-7009
2147-5881