روشی جدید در تشخیص گوینده مستقل از متن در محیطهای نویزی
در این مقاله بازشناسی مقاوم به نویز گوینده در حالت مستقل از متن مورد توجه قرار گرفته است. روش پیشنهادی بر مبنای حذف سکوت از جملات و تقطیع آنها به واحدهای کوچکتر شامل چند آوا و حداقل یک واکه برای استخراج ویژگیهای زمانبلند از جمله آنتروپی عمل میکند. یک واکه پرانرژی در هر قطعه گفتاری برای استخراج ف...
Main Authors: | , |
---|---|
Format: | Article |
Language: | English |
Published: |
Najafabad Branch, Islamic Azad University
2014-11-01
|
Series: | Journal of Intelligent Procedures in Electrical Technology |
Subjects: | |
Online Access: | http://jipet.iaun.ac.ir/pdf_8598_8af0ffa13b7aed7fd1bbf57628f2f5f1.html |
id |
doaj-a7e5629dc92e4e2ab2fe9d72e72bed5c |
---|---|
record_format |
Article |
spelling |
doaj-a7e5629dc92e4e2ab2fe9d72e72bed5c2020-11-24T23:12:24ZengNajafabad Branch, Islamic Azad UniversityJournal of Intelligent Procedures in Electrical Technology2322-38712345-55942014-11-0151933448598روشی جدید در تشخیص گوینده مستقل از متن در محیطهای نویزینونا حیدری اصفهانی0حمید محمودیان1کارشناس ارشد، شرکت پرشیان فولاد اصفهاناستادیار - دانشکده برق، دانشگاه آزاد اسلامی، واحد نجف آباددر این مقاله بازشناسی مقاوم به نویز گوینده در حالت مستقل از متن مورد توجه قرار گرفته است. روش پیشنهادی بر مبنای حذف سکوت از جملات و تقطیع آنها به واحدهای کوچکتر شامل چند آوا و حداقل یک واکه برای استخراج ویژگیهای زمانبلند از جمله آنتروپی عمل میکند. یک واکه پرانرژی در هر قطعه گفتاری برای استخراج فرکانس پایه و فرمنتها شناسایی میشود. با اعمال یک روش خوشهبندی، ویژگیهای زمانکوتاه یعنی ضرایبِ MFCC با ویژگیهای زمانبلند ترکیب میشوند. نتایج آزمایشات با استفاده از طبقهبندی کننده از نوع MLP نشان میدهد که میانگین نرخ بازشناسی گوینده با روش پیشنهادی در حالت بدون نویز 33/97% و در نسبت سیگنال به نویز 2- دسیبل 33/61% است که نسبت به روشهای متداول بهبود نشان میدهد. http://jipet.iaun.ac.ir/pdf_8598_8af0ffa13b7aed7fd1bbf57628f2f5f1.htmlSpeaker identificationMFCC coefficientspitch ferequencyformantsShannon entropyMLP |
collection |
DOAJ |
language |
English |
format |
Article |
sources |
DOAJ |
author |
نونا حیدری اصفهانی حمید محمودیان |
spellingShingle |
نونا حیدری اصفهانی حمید محمودیان روشی جدید در تشخیص گوینده مستقل از متن در محیطهای نویزی Journal of Intelligent Procedures in Electrical Technology Speaker identification MFCC coefficients pitch ferequency formants Shannon entropy MLP |
author_facet |
نونا حیدری اصفهانی حمید محمودیان |
author_sort |
نونا حیدری اصفهانی |
title |
روشی جدید در تشخیص گوینده مستقل از متن در محیطهای نویزی |
title_short |
روشی جدید در تشخیص گوینده مستقل از متن در محیطهای نویزی |
title_full |
روشی جدید در تشخیص گوینده مستقل از متن در محیطهای نویزی |
title_fullStr |
روشی جدید در تشخیص گوینده مستقل از متن در محیطهای نویزی |
title_full_unstemmed |
روشی جدید در تشخیص گوینده مستقل از متن در محیطهای نویزی |
title_sort |
روشی جدید در تشخیص گوینده مستقل از متن در محیطهای نویزی |
publisher |
Najafabad Branch, Islamic Azad University |
series |
Journal of Intelligent Procedures in Electrical Technology |
issn |
2322-3871 2345-5594 |
publishDate |
2014-11-01 |
description |
در این مقاله بازشناسی مقاوم به نویز گوینده در حالت مستقل از متن مورد توجه قرار گرفته است. روش پیشنهادی بر مبنای حذف سکوت از جملات و تقطیع آنها به واحدهای کوچکتر شامل چند آوا و حداقل یک واکه برای استخراج ویژگیهای زمانبلند از جمله آنتروپی عمل میکند. یک واکه پرانرژی در هر قطعه گفتاری برای استخراج فرکانس پایه و فرمنتها شناسایی میشود. با اعمال یک روش خوشهبندی، ویژگیهای زمانکوتاه یعنی ضرایبِ MFCC با ویژگیهای زمانبلند ترکیب میشوند. نتایج آزمایشات با استفاده از طبقهبندی کننده از نوع MLP نشان میدهد که میانگین نرخ بازشناسی گوینده با روش پیشنهادی در حالت بدون نویز 33/97% و در نسبت سیگنال به نویز 2- دسیبل 33/61% است که نسبت به روشهای متداول بهبود نشان میدهد. |
topic |
Speaker identification MFCC coefficients pitch ferequency formants Shannon entropy MLP |
url |
http://jipet.iaun.ac.ir/pdf_8598_8af0ffa13b7aed7fd1bbf57628f2f5f1.html |
work_keys_str_mv |
AT nwnạḥydryạṣfhạny rwsẖyjdyddrtsẖkẖyṣgwyndhmstqlạzmtndrmḥyṭhạynwyzy AT ḥmydmḥmwdyạn rwsẖyjdyddrtsẖkẖyṣgwyndhmstqlạzmtndrmḥyṭhạynwyzy |
_version_ |
1725600938875420672 |