컴퓨터 비전은,

 

컴퓨터를 이용하여 사진 또는 동영상으로부터 의미 있는 정보를 추출하는 방법을 연구하는 학문입니다.

 

이전 포스팅에 소개드렸던 머신러닝은 컴퓨터에게 학습을 시키는 것에 중점을 두었다면,

컴퓨터 비저닝은, 사람이 눈으로 사물을 인지하는 것처럼...

 

컴퓨터가 사진이나 영상을 보고 인지하게 만드는 작업이라고 할 수 있습니다.

 

사실, 텐서플로우나 케라스 파이토치를 통해서 이미 이미지 인식 및 분류를 하였었고

mnist 숫자 이미지로 손글씨로 판단을 하였었습니다.

 

똑같이, 이미지 인식을 텐서플로우나 케라스를 이용하면 되지 않을까!?!

굳이 컴퓨터 비저닝이 왜 필요할까요?!

 

먼저, 사과 사진 한장을 보시죠!!

우리는 딱 보면 알죠.. 눈으로 보는 즉시 바로 뇌에서 "사과"구나… 하고 알아차리죠…

 

하지만 컴퓨터는… 뇌가 없으니까.. 1차적으로 다음과 같이 사과의 모양만을 기억할것 입니다.

 

그리고 나서, 이러한 둥근 모양이 어떠한 색상을 갖는지 판단할 것입니다.

 

그럼 컴퓨터는... "사과는 둥글고 빨갛다" 라고 인식을 할 것입니다.

 

이번에는, 이렇게 사과를 인식한 컴퓨터에게 둥글고 빨간 토마토 사진을 보여주도록 하겠습니다.

 

그러면 컴퓨터는 과연 이 토마토를 보고 사과가 아니다라고 판단 할 수 있을까요?!

 

또는컴퓨터에게 이렇게배경 없이 여러 색깔들의 사과들을 보여주면

 

컴퓨터는 과연 이것들을 여러 개의 사과.. 라고 판단 할 수 있을까요?!

 

아마, 둥글고 빨간 것은 사과다 라고 인식한 컴퓨터에게 위 두가지의 사진을 판단은 불가능 합니다.

 

사실 우리가 기존에 텐서플로우 등을 이용하여 이미지를 인식하는 작업들은 대부분...

 

위에 첫번째 사과와 같이 정제된 사진만을 가지고 테스트를 하였었습니다.

그래서 인식 정확도도 높았던 것이구요..

 

위와 같은 이유로, 이미지 관련 딥러닝 모델을 아무리 잘 만들었다고 하더라도...

우리 실생활까지 응용하고 사용 하기까지는 힘들것입니다.

 

그렇기 때문에, 우리는 정확도가 높은 영상 처리를 위해..!

CV 컴퓨터 비저닝에 대해서 연구해볼 필요가 있는 것입니다.

반응형

+ Recent posts