Sound localization for human interaction in real environment

For a robot to succeed at speech recognition, it is advantageous to have a strong and clear signal tointerpret. To facilitate this the robot can steer and aim for the sound source to get a clearer signal, todo this a sound source localization system is required. If the robot turns towards the speake...

Full description

Bibliographic Details
Main Authors: Strömberg, Ralf, Svensson, Stig-Åke
Format: Others
Language:English
Published: Mälardalens högskola, Akademin för innovation, design och teknik 2011
Subjects:
ITD
Online Access:http://urn.kb.se/resolve?urn=urn:nbn:se:mdh:diva-12496
id ndltd-UPSALLA1-oai-DiVA.org-mdh-12496
record_format oai_dc
spelling ndltd-UPSALLA1-oai-DiVA.org-mdh-124962018-01-13T05:15:48ZSound localization for human interaction in real environmentengStrömberg, RalfSvensson, Stig-ÅkeMälardalens högskola, Akademin för innovation, design och teknikMälardalens högskola, Akademin för innovation, design och teknik2011Cross-correlationITDFourier transformSound source localizationComputer SciencesDatavetenskap (datalogi)For a robot to succeed at speech recognition, it is advantageous to have a strong and clear signal tointerpret. To facilitate this the robot can steer and aim for the sound source to get a clearer signal, todo this a sound source localization system is required. If the robot turns towards the speaker thisalso gives a more natural feeling when a human interacts with the robot. To determine where thesound source is positioned, an angle relative to the microphone pair is calculated using theinteraural time difference (ITD), which is the difference in time of arrival of the sound between thepair of microphones. To achieve good result the microphone signals needs to be preprocessed andthere are also different algorithms for calculating the time difference which are investigated in thisthesis. The results presented in this work are from tests, with an emphasis on focusing at real-timesystems, involving noisy environment and response time. The results show the complexity of thebalance between computational time and precision. För att en robot ska lyckas med taleigenkänning, är det fördelaktigt att ha en stark och tydlig signalatt tolka. För att underlätta detta kan roboten styra och rikta in sig mot ljudkällan för att få entydligare signal och för att detta skall vara möjligt krävs ett system för lokalisering av ljudkällan.Om roboten vänder sig mot talaren ger detta även en mer naturlig känsla när en människainteragerar med roboten. För att avgöra var ljudkällan är placerad, beräknas en vinkel i förhållandetill mikrofonparet med hjälp av interaurala tidsskillnaden (ITD), vilket är skillnaden i ankomsttid avljudet mellan mikrofonparet. För att uppnå bra resultat måste mikrofonsignalerna förbehandlas ochdet finns också olika algoritmer för att beräkna tidsskillnaden som undersöks i detta examensarbete.Det resultat som presenteras i detta arbete kommer från tester, med tonvikt på att fokusera pårealtidssystem, som inbegriper bullrig miljö och svarstid. Resultaten visar komplexiteten i balansenmellan beräknings tid och precision. Student thesisinfo:eu-repo/semantics/bachelorThesistexthttp://urn.kb.se/resolve?urn=urn:nbn:se:mdh:diva-12496application/pdfinfo:eu-repo/semantics/openAccess
collection NDLTD
language English
format Others
sources NDLTD
topic Cross-correlation
ITD
Fourier transform
Sound source localization
Computer Sciences
Datavetenskap (datalogi)
spellingShingle Cross-correlation
ITD
Fourier transform
Sound source localization
Computer Sciences
Datavetenskap (datalogi)
Strömberg, Ralf
Svensson, Stig-Åke
Sound localization for human interaction in real environment
description For a robot to succeed at speech recognition, it is advantageous to have a strong and clear signal tointerpret. To facilitate this the robot can steer and aim for the sound source to get a clearer signal, todo this a sound source localization system is required. If the robot turns towards the speaker thisalso gives a more natural feeling when a human interacts with the robot. To determine where thesound source is positioned, an angle relative to the microphone pair is calculated using theinteraural time difference (ITD), which is the difference in time of arrival of the sound between thepair of microphones. To achieve good result the microphone signals needs to be preprocessed andthere are also different algorithms for calculating the time difference which are investigated in thisthesis. The results presented in this work are from tests, with an emphasis on focusing at real-timesystems, involving noisy environment and response time. The results show the complexity of thebalance between computational time and precision. === För att en robot ska lyckas med taleigenkänning, är det fördelaktigt att ha en stark och tydlig signalatt tolka. För att underlätta detta kan roboten styra och rikta in sig mot ljudkällan för att få entydligare signal och för att detta skall vara möjligt krävs ett system för lokalisering av ljudkällan.Om roboten vänder sig mot talaren ger detta även en mer naturlig känsla när en människainteragerar med roboten. För att avgöra var ljudkällan är placerad, beräknas en vinkel i förhållandetill mikrofonparet med hjälp av interaurala tidsskillnaden (ITD), vilket är skillnaden i ankomsttid avljudet mellan mikrofonparet. För att uppnå bra resultat måste mikrofonsignalerna förbehandlas ochdet finns också olika algoritmer för att beräkna tidsskillnaden som undersöks i detta examensarbete.Det resultat som presenteras i detta arbete kommer från tester, med tonvikt på att fokusera pårealtidssystem, som inbegriper bullrig miljö och svarstid. Resultaten visar komplexiteten i balansenmellan beräknings tid och precision.
author Strömberg, Ralf
Svensson, Stig-Åke
author_facet Strömberg, Ralf
Svensson, Stig-Åke
author_sort Strömberg, Ralf
title Sound localization for human interaction in real environment
title_short Sound localization for human interaction in real environment
title_full Sound localization for human interaction in real environment
title_fullStr Sound localization for human interaction in real environment
title_full_unstemmed Sound localization for human interaction in real environment
title_sort sound localization for human interaction in real environment
publisher Mälardalens högskola, Akademin för innovation, design och teknik
publishDate 2011
url http://urn.kb.se/resolve?urn=urn:nbn:se:mdh:diva-12496
work_keys_str_mv AT strombergralf soundlocalizationforhumaninteractioninrealenvironment
AT svenssonstigake soundlocalizationforhumaninteractioninrealenvironment
_version_ 1718608542682841088