Summary: | 碩士 === 國立清華大學 === 資訊工程學系 === 98 === 本篇論文提出了一個以非監督式的場景切割方面的影像理解方法.以影像理解為目標, 我們把"非監督式場景切割"定義為將一張給定的影像切割成有語意的物件而不需要標記或是人為提供的資訊.我們試著去探究一個學習演算法在有限人為的提供資訊下可以把一張影像切割到多好的結果,明確一點的說,我們有興趣的目標是發展一個只需要靠一些影像中學得的結構機率資訊的非監督式場景切割演算法.我們的演算法需要和欲切割的影像結構相似的少量影像, 並且使用稀疏編碼的技術來分析這些相似影像的視覺結構, 而稀疏編碼的特點在於可以讓藉由這些相似的影像來產生欲切割影像結構分佈區塊的估計.接著,對不同結構分佈區塊我們可以利用高斯混合模型來處理,後續結合馬可夫隨機場的方法來進行切割.在實驗結果中可以看到我們的非監督式影像切割演算法可以把一張影像成功的切出有語意的部分,如建築物,路面,樹叢和天空,並且不需要人為的事先標記資訊.經由我們的演算法產生的有語意的影像區塊可以是很有用的資訊,舉例來說可以當做後續以分類為基礎的標記演算法的輸入資訊,最後達成場景的自動標示以及場景剖析.
|