Puhujariippumaton automaattinen puheentunnistusjärjestelmä Matlab-ohjelmalla

Työn tarkoituksena oli tutustua automaattiseen puheentunnistukseen ja toteuttaa Matlab-ohjelmalla toimiva muutaman käskyn tunnistava puhujariippumaton puheentunnistusjärjestelmä, joka voidaan liittää simulaationukkeen kontrolloimaan sen hengitystä. Työssä tutustuttiin yleisiin ja järjestelmän toteut...

Full description

Bibliographic Details
Main Author: Kumpula, O. (Ossi)
Format: Others
Language:Finnish
Published: University of Oulu 2016
Subjects:
Online Access:http://urn.fi/URN:NBN:fi:oulu-201611123027
http://nbn-resolving.de/urn:nbn:fi:oulu-201611123027
id ndltd-oulo.fi-oai-oulu.fi-nbnfioulu-201611123027
record_format oai_dc
spelling ndltd-oulo.fi-oai-oulu.fi-nbnfioulu-2016111230272018-06-22T04:51:14ZPuhujariippumaton automaattinen puheentunnistusjärjestelmä Matlab-ohjelmallaKumpula, O. (Ossi)info:eu-repo/semantics/openAccess© Ossi Kumpula, 2016Health SciencesTyön tarkoituksena oli tutustua automaattiseen puheentunnistukseen ja toteuttaa Matlab-ohjelmalla toimiva muutaman käskyn tunnistava puhujariippumaton puheentunnistusjärjestelmä, joka voidaan liittää simulaationukkeen kontrolloimaan sen hengitystä. Työssä tutustuttiin yleisiin ja järjestelmän toteutuksen kannalta merkittävimpiin puheentunnistuksen menetelmiin, joiden avulla puheentunnistusjärjestelmä rakennettiin. Toteutuksessa puhetta sisältävä signaali erotettiin hiljaisuudesta käyttäen Rabinerin ja Schaferin kuvaamaa algoritmia ja tunnistettavana yksikkönä käytettiin käskyt sisältävää fraasia. Piirreirrotus tehtiin Mel-Frequency Cepstrum Coefficients (MFCC) -menetelmällä ja akustiset mallit pohjautuivat Gaussin Mixture malliin (GMM) ja Markovin piilomalliin (HMM). Tunnistuksessa käytettiin useampaa mallia rinnakkain vähentämään satunnaisen puheen tunnistamista virheellisesti joksikin opetetuista käskyistä. Akustisten mallien harjoitteluun ja järjestelmän testaukseen tarvittava puheaineisto hankittiin pääasiassa Oulun yliopistollisen sairaalan Sädehoidon yksikön hoitajilta, jotka puheohjausjärjestelmää tulevat käyttämään. Testausten perusteella järjestelmä tunnisti alle 1 % virheellä oikeat puhekäskyt. Ongelmia tuli satunnaisen puheen virheellisellä tunnistuksella joksikin opetetuista puhekäskyistä, mitä ei onnistuttu kokonaan poistamaan. Järjestelmästä tuli kuitenkin toimiva käyttökohteeseensa, sillä käskyt annetaan painamalla näppäimistöstä enteriä pohjassa vastaavasti kuin potilaalle puhutaan mikrofonin kautta pitämällä tangenttia pohjassa ja nukelle annetaan pääsääntöisesti vain oikeita käskyjä.The aim of this thesis was to study automatic speech recognition (ASR) and produce Matlab-based speaker-independent ASR system that recognizes few speech commands and can be joined to control breathing of a simulation manikin. During this thesis commonly used ASR methods was studied and represented. In the produced ASR system, algorithm of Rabiner’s and Schafer’s was used to pick the speech signal from silence. Whole phrase containing the speech command was used as the recognition unit. Feature extraction was made by using Mel-Frequency Cepstrum Coefficients (MFCC) and acoustic models was based on Gaussian Mixture Model (GMM) and Hidden Markov Model (HMM). During recognition state combine of the models was used in tandem to reduce the misrecognition of random speech as the speech commands. Set of speech signals for training the acoustic models and testing performance of the ASR system was acquired mainly in the Oulu University Hospital from nurses who will use the ASR system. The error ratio of the ASR system was less than 1 percent with the correct speech commands according to the tests. The main problem with the system was misrecognition of random speech as the speech commands. However, the ASR system is suitable for use because mainly only correct speech commands is spoken and the speech commands is spoken pressing and holding down the enter key.University of Oulu2016-11-14info:eu-repo/semantics/bachelorThesisinfo:eu-repo/semantics/publishedVersionapplication/pdfhttp://urn.fi/URN:NBN:fi:oulu-201611123027urn:nbn:fi:oulu-201611123027fin
collection NDLTD
language Finnish
format Others
sources NDLTD
topic Health Sciences
spellingShingle Health Sciences
Kumpula, O. (Ossi)
Puhujariippumaton automaattinen puheentunnistusjärjestelmä Matlab-ohjelmalla
description Työn tarkoituksena oli tutustua automaattiseen puheentunnistukseen ja toteuttaa Matlab-ohjelmalla toimiva muutaman käskyn tunnistava puhujariippumaton puheentunnistusjärjestelmä, joka voidaan liittää simulaationukkeen kontrolloimaan sen hengitystä. Työssä tutustuttiin yleisiin ja järjestelmän toteutuksen kannalta merkittävimpiin puheentunnistuksen menetelmiin, joiden avulla puheentunnistusjärjestelmä rakennettiin. Toteutuksessa puhetta sisältävä signaali erotettiin hiljaisuudesta käyttäen Rabinerin ja Schaferin kuvaamaa algoritmia ja tunnistettavana yksikkönä käytettiin käskyt sisältävää fraasia. Piirreirrotus tehtiin Mel-Frequency Cepstrum Coefficients (MFCC) -menetelmällä ja akustiset mallit pohjautuivat Gaussin Mixture malliin (GMM) ja Markovin piilomalliin (HMM). Tunnistuksessa käytettiin useampaa mallia rinnakkain vähentämään satunnaisen puheen tunnistamista virheellisesti joksikin opetetuista käskyistä. Akustisten mallien harjoitteluun ja järjestelmän testaukseen tarvittava puheaineisto hankittiin pääasiassa Oulun yliopistollisen sairaalan Sädehoidon yksikön hoitajilta, jotka puheohjausjärjestelmää tulevat käyttämään. Testausten perusteella järjestelmä tunnisti alle 1 % virheellä oikeat puhekäskyt. Ongelmia tuli satunnaisen puheen virheellisellä tunnistuksella joksikin opetetuista puhekäskyistä, mitä ei onnistuttu kokonaan poistamaan. Järjestelmästä tuli kuitenkin toimiva käyttökohteeseensa, sillä käskyt annetaan painamalla näppäimistöstä enteriä pohjassa vastaavasti kuin potilaalle puhutaan mikrofonin kautta pitämällä tangenttia pohjassa ja nukelle annetaan pääsääntöisesti vain oikeita käskyjä. === The aim of this thesis was to study automatic speech recognition (ASR) and produce Matlab-based speaker-independent ASR system that recognizes few speech commands and can be joined to control breathing of a simulation manikin. During this thesis commonly used ASR methods was studied and represented. In the produced ASR system, algorithm of Rabiner’s and Schafer’s was used to pick the speech signal from silence. Whole phrase containing the speech command was used as the recognition unit. Feature extraction was made by using Mel-Frequency Cepstrum Coefficients (MFCC) and acoustic models was based on Gaussian Mixture Model (GMM) and Hidden Markov Model (HMM). During recognition state combine of the models was used in tandem to reduce the misrecognition of random speech as the speech commands. Set of speech signals for training the acoustic models and testing performance of the ASR system was acquired mainly in the Oulu University Hospital from nurses who will use the ASR system. The error ratio of the ASR system was less than 1 percent with the correct speech commands according to the tests. The main problem with the system was misrecognition of random speech as the speech commands. However, the ASR system is suitable for use because mainly only correct speech commands is spoken and the speech commands is spoken pressing and holding down the enter key.
author Kumpula, O. (Ossi)
author_facet Kumpula, O. (Ossi)
author_sort Kumpula, O. (Ossi)
title Puhujariippumaton automaattinen puheentunnistusjärjestelmä Matlab-ohjelmalla
title_short Puhujariippumaton automaattinen puheentunnistusjärjestelmä Matlab-ohjelmalla
title_full Puhujariippumaton automaattinen puheentunnistusjärjestelmä Matlab-ohjelmalla
title_fullStr Puhujariippumaton automaattinen puheentunnistusjärjestelmä Matlab-ohjelmalla
title_full_unstemmed Puhujariippumaton automaattinen puheentunnistusjärjestelmä Matlab-ohjelmalla
title_sort puhujariippumaton automaattinen puheentunnistusjärjestelmä matlab-ohjelmalla
publisher University of Oulu
publishDate 2016
url http://urn.fi/URN:NBN:fi:oulu-201611123027
http://nbn-resolving.de/urn:nbn:fi:oulu-201611123027
work_keys_str_mv AT kumpulaoossi puhujariippumatonautomaattinenpuheentunnistusjarjestelmamatlabohjelmalla
_version_ 1718702178575581184