روشی جدید در تشخیص گوینده مستقل از متن در محیط‌های نویزی

در این مقاله بازشناسی مقاوم به نویز گوینده در حالت مستقل از متن مورد توجه قرار گرفته است. روش پیشنهادی بر مبنای حذف سکوت از جملات و تقطیع آنها به واحدهای کوچک‌تر شامل چند آوا و حداقل یک واکه برای استخراج ویژگی‌های زمان‌بلند از جمله آنتروپی عمل می‌کند. یک واکه پرانرژی در هر قطعه گفتاری برای استخراج ف...

Full description

Bibliographic Details
Main Authors: نونا حیدری اصفهانی, حمید محمودیان
Format: Article
Language:English
Published: Najafabad Branch, Islamic Azad University 2014-11-01
Series:Journal of Intelligent Procedures in Electrical Technology
Subjects:
MLP
Online Access:http://jipet.iaun.ac.ir/pdf_8598_8af0ffa13b7aed7fd1bbf57628f2f5f1.html
id doaj-a7e5629dc92e4e2ab2fe9d72e72bed5c
record_format Article
spelling doaj-a7e5629dc92e4e2ab2fe9d72e72bed5c2020-11-24T23:12:24ZengNajafabad Branch, Islamic Azad UniversityJournal of Intelligent Procedures in Electrical Technology2322-38712345-55942014-11-0151933448598روشی جدید در تشخیص گوینده مستقل از متن در محیط‌های نویزینونا حیدری اصفهانی0حمید محمودیان1کارشناس ارشد، شرکت پرشیان فولاد اصفهاناستادیار - دانشکده برق، دانشگاه آزاد اسلامی، واحد نجف آباددر این مقاله بازشناسی مقاوم به نویز گوینده در حالت مستقل از متن مورد توجه قرار گرفته است. روش پیشنهادی بر مبنای حذف سکوت از جملات و تقطیع آنها به واحدهای کوچک‌تر شامل چند آوا و حداقل یک واکه برای استخراج ویژگی‌های زمان‌بلند از جمله آنتروپی عمل می‌کند. یک واکه پرانرژی در هر قطعه گفتاری برای استخراج فرکانس پایه و فرمنت‌ها شناسایی می‌شود. با اعمال یک روش خوشه‌بندی، ویژگی‌های زمان­کوتاه یعنی ضرایبِ MFCC با ویژگی‌های زمان‌بلند ترکیب می‌شوند. نتایج آزمایشات با استفاده از طبقه‌بندی کننده از نوع MLP نشان می‌دهد که میانگین نرخ بازشناسی گوینده با روش پیشنهادی در حالت بدون نویز 33/97% و در نسبت سیگنال به نویز 2- دسی‌بل 33/61% است که نسبت به روش‌های متداول بهبود نشان می‌دهد.  http://jipet.iaun.ac.ir/pdf_8598_8af0ffa13b7aed7fd1bbf57628f2f5f1.htmlSpeaker identificationMFCC coefficientspitch ferequencyformantsShannon entropyMLP
collection DOAJ
language English
format Article
sources DOAJ
author نونا حیدری اصفهانی
حمید محمودیان
spellingShingle نونا حیدری اصفهانی
حمید محمودیان
روشی جدید در تشخیص گوینده مستقل از متن در محیط‌های نویزی
Journal of Intelligent Procedures in Electrical Technology
Speaker identification
MFCC coefficients
pitch ferequency
formants
Shannon entropy
MLP
author_facet نونا حیدری اصفهانی
حمید محمودیان
author_sort نونا حیدری اصفهانی
title روشی جدید در تشخیص گوینده مستقل از متن در محیط‌های نویزی
title_short روشی جدید در تشخیص گوینده مستقل از متن در محیط‌های نویزی
title_full روشی جدید در تشخیص گوینده مستقل از متن در محیط‌های نویزی
title_fullStr روشی جدید در تشخیص گوینده مستقل از متن در محیط‌های نویزی
title_full_unstemmed روشی جدید در تشخیص گوینده مستقل از متن در محیط‌های نویزی
title_sort روشی جدید در تشخیص گوینده مستقل از متن در محیط‌های نویزی
publisher Najafabad Branch, Islamic Azad University
series Journal of Intelligent Procedures in Electrical Technology
issn 2322-3871
2345-5594
publishDate 2014-11-01
description در این مقاله بازشناسی مقاوم به نویز گوینده در حالت مستقل از متن مورد توجه قرار گرفته است. روش پیشنهادی بر مبنای حذف سکوت از جملات و تقطیع آنها به واحدهای کوچک‌تر شامل چند آوا و حداقل یک واکه برای استخراج ویژگی‌های زمان‌بلند از جمله آنتروپی عمل می‌کند. یک واکه پرانرژی در هر قطعه گفتاری برای استخراج فرکانس پایه و فرمنت‌ها شناسایی می‌شود. با اعمال یک روش خوشه‌بندی، ویژگی‌های زمان­کوتاه یعنی ضرایبِ MFCC با ویژگی‌های زمان‌بلند ترکیب می‌شوند. نتایج آزمایشات با استفاده از طبقه‌بندی کننده از نوع MLP نشان می‌دهد که میانگین نرخ بازشناسی گوینده با روش پیشنهادی در حالت بدون نویز 33/97% و در نسبت سیگنال به نویز 2- دسی‌بل 33/61% است که نسبت به روش‌های متداول بهبود نشان می‌دهد.  
topic Speaker identification
MFCC coefficients
pitch ferequency
formants
Shannon entropy
MLP
url http://jipet.iaun.ac.ir/pdf_8598_8af0ffa13b7aed7fd1bbf57628f2f5f1.html
work_keys_str_mv AT nwnạḥydryạṣfhạny rwsẖyjdyddrtsẖkẖyṣgwyndhmstqlạzmtndrmḥyṭhạynwyzy
AT ḥmydmḥmwdyạn rwsẖyjdyddrtsẖkẖyṣgwyndhmstqlạzmtndrmḥyṭhạynwyzy
_version_ 1725600938875420672