A frame differencing algorithm that allows for small camera movements.

The field of computer vision is ever-changing, and with more video being captured every day than before. This thesis examined motion detection through frame differencing. More specifically, this thesis examined what effect small camera movements had to the motion detection and if there was an algori...

Full description

Bibliographic Details
Main Author: Kindberg, Ludvig
Format: Others
Language:English
Published: KTH, Skolan för elektroteknik och datavetenskap (EECS) 2020
Subjects:
Online Access:http://urn.kb.se/resolve?urn=urn:nbn:se:kth:diva-280738
Description
Summary:The field of computer vision is ever-changing, and with more video being captured every day than before. This thesis examined motion detection through frame differencing. More specifically, this thesis examined what effect small camera movements had to the motion detection and if there was an algorithm that could mitigate some of the unwanted camera movements from the resulting motion detection. It was examined through having different test case with varying amounts of movement inflicted onto the camera. Test cases with and without moving objects in the frame were examined. The moving objects were annotated and used as a metric to determine the F1-score. The two algorithms that were compared both managed to mitigate some vibrations and movement of the camera. One aspect that would benefit further research within this area is pixel perfect annotations of the moving objects within the frame. Potential future research could be on a heuristic-based approach or if a deep neural network can perform frame differencing and mitigate small camera movements. === I takt med att fler videor spelas in och att kameror blir allt billigare så har användningsområdena ökat. Ett användningsområde är inom datorseende där det är möjligt att med hjälp av olika metoder upptäcka rörliga föremål i bilden. Detta kan användas i olika övervakningssystem eller för att analysera hur föremål rör sig i bilden. Ett av kraven för att rörelsedetektion ska vara möjligt är att kameran som spelar in videon står perfekt stilla. Detta är för att algoritmerna som används inte ska generera falska resultat (eng. False positives). En kategori av algoritmer som kan utföra rörelsedetektion är bilddifferentieringsalgoritmer (Eng. Frame differencing algorithms). Två versioner av bilddifferentieringsalgoritmer undersöktes m.a.p. hur de hanterade att kameran som filmade inte står perfekt stilla i en utomhusmiljö. Dessa kamerarörelser kan vara resultatet av att det är väldigt blåsigt eller av markvibrationer. Sammanfattningsvis så lyckades båda algoritmerna att eliminera mindre kamerarörelser om det korrekta tröskelvärdet användes för att klassificera om det fanns några föremål som förflyttade sig i videon eller inte. För framtida forskning så skulle det kunna vara intressant att ha mer data som har uppmärkt vad som är ett rörligt föremål med väldigt hög noggrannhet (eng. pixel perfect). Det skulle också vara intressant och se om detta problem kan lösas med hjälp av maskinlärning