Twitter duygu analizinde terim ağırlıklandırma yönteminin etkisi
Terim ağırlıklandırma, metin sınıflandırmada sonuçlar üzerinde doğrudan etkili olan önemli bir adımdır. Ancak, bir metin sınıflandırma problemi olarak ele alınan duygu analizinde farklı önişleme tekniklerine bağlı olarak ağırlıklandırma yönteminin davranışı değişebilmektedir. Bu çalışmada bilgi geti...
Main Authors: | , |
---|---|
Format: | Article |
Language: | English |
Published: |
Pamukkale University
2018-04-01
|
Series: | Pamukkale University Journal of Engineering Sciences |
Subjects: | |
Online Access: | http://dergipark.gov.tr/pajes/issue/36922/419720?publisher=pamukkale |
Summary: | Terim
ağırlıklandırma, metin sınıflandırmada sonuçlar üzerinde doğrudan etkili olan
önemli bir adımdır. Ancak, bir metin sınıflandırma problemi olarak ele alınan
duygu analizinde farklı önişleme tekniklerine bağlı olarak ağırlıklandırma
yönteminin davranışı değişebilmektedir. Bu çalışmada bilgi getirimi, metin
sınıflandırma, doküman filtreleme gibi farklı çalışma alanları için yakın
zamanda önerilen yöntemler Twitter duygu analizinde uygulanmış ve sonuçlar
üzerindeki etkisi incelenmiştir. Öznitelikler çıkarılırken kelime torbası (BoW)
ve karakter seviye N-gram olmak üzere iki farklı model kullanılmıştır. Deneyler
Türkçe ve İngilizce Twitter mesajlarından oluşan veri kümeleri üzerinde
uygulanmıştır. Twitter mesajlarının duygu sınıflandırması, Gizli Dirichlet Ataması
(LDA) tabanlı konu modeli ile gerçekleştirilmiştir. Sınıflandırma aşamasında
ise Destek Vektör Makinesi (SVM) algoritması kullanılmıştır. Deneysel sonuçlara
göre, Twitter duygu analizi çalışmalarında kullanılabilecek en etkili terim
ağırlıklandırma yöntemi önerilmiştir. |
---|---|
ISSN: | 1300-7009 2147-5881 |