INTRODUCTION

Introduction

在機器學習當中卷積神經網路(CNN)是進行影像辨識很重要的 state-of-the-art架構,因為他的很多的特性,讓大家無法去了解這個架構中哪些最為重要。

而其中,Convolution是一個矩陣的運算,算完一次移動一格,每一層convolution layer又有很多channels,因此計算量非常的大,也因為如此,深度學習到了這幾年才因為硬體的能力能夠承載這些運算才崛起,現今的深度學習,通常用的是GPU來加速整個運算過程。

然而儘管如此 convolution 的運算量仍然需要花上很多時間進行training和testing,這對於很多即時性的工作來說會是個很大的挑戰,像是交通事故的辨識並通報、犯罪行為的辨識與舉報、醫院急診人員的取代和無人商店的精準辨識等等,這些充滿深度學習可能性的地方都需要real-time的特性,但目前卻無法提供強大的硬體在現場即時支援。

因此我們在研究當中希望能夠藉由研究 CNN 的結構,進一步分析卷積神經網路,並且進行優化與改善,而實驗的詳細方法將於報告中呈現。

心得感想

我們在這個專題自己發想了題目,並找到方法去驗證自己的假說,儘管過程中有時會因此覺得不太踏實,但也學會了如何印證自己的想法和如何解決沒有遇到過的問題。過程中不是第一次就有好的結果,感謝呂仁碩老師願意不斷幫助我們,教我們分析資料,並找出可能的改善方式,我很感激能有這樣的訓練,同時也很感謝沈之妤和李承儒不厭其煩得和我們分享他們的經驗。