인간의 시각은 놀라움 우리는 사진 하나를 보고 인식, 추론, 예측, 상상등을 수행함

심지어 더 나아가 사진에있는 어떤 인물이 운동선수라면 선수가 어떤점수를 받을수있을지 까지도 추정가능

시각은 오감 중에서 가장 뛰어남

 

인간 눈의 구조와 동작

동쪽 경로(녹색)은 주로 물체의 움직임, 배쪽 경로(보라색)은 주로 물체의 부류를 알아냄

매 순간, 빠르고 정확하게 그리고 손쉽게 인식함.

 

인간 시각의 강점

분류, 검출, 분할, 추적, 행동 분석에 능숙함(사전 행동에 능숙)

3차원 복원 능력

빠르고 강건: 과업 전환이 매끄럽고 유기적이고 빠름

다른 지능 요소인 지식 표현, 추론,계획과 협동

 

인간 시각의 한계

착시가 있으며 정밀 측정에 오치가 나오고 시야가 한정됨 그리고 피로해지고 퇴화함.

 

why computervision?

컴퓨터 비전은 인간의 시각을 흉내 내는 컴퓨터 프로그램

시각은 인공지능의 중요한 구성요소

현재 컴퓨터 비전 기술로 인간에 필적하는 시각 구현은 불가능하지만 과업을 한정하면 인간 성능에 가깝거나 뛰어넘는 응용이 무궁무진함

사용예시)

과일 수확 드론, 혈관 분할, 자율주행, 불량 검사, 선수의 행동 분석, 고객의 동선 분석 등등

 

이러한 컴퓨터 비전은 왜 어려운가?

환경의 변화(밤 낮 날씨) 보는 위치와 방향의 변화, 강체와 연성 물체

원자부터 우주까지 긴 스펙트럼에서 영상 수집

인공지능의 미숙함: 지식 표현, 추론, 계획, 학습이 유기적으로 동작할 때만 강한 인공지능 가능

강한 인공지능은 먼 미래의 일 또는 영영 불가능

 

컴퓨터 비전의 목표

 

궁극적인 목표:

   일반적인 상황에서 잘 작동하는 인간과 같은 시각(강한 인공지능)

   영영 불가능하거나 먼 미래에 실현

현실적인 목표:

    제한된 환경에서 특정 과업을 높은 성능으로 달성(약한 인공지능)

    컴퓨터 비전 문제를 여러 세부 문제로 구분하고 세부 문제별로 알고리즘 구상

 

멀티미디어: 여러가지 매체(정보를 표현하고 분배하기 위한 수단, 정보를 표현하기 위한 다양한 형태의 매체)

신호처리: 신호(디지털or아날로그)를 처리하는 방법 혹은 알고리즘으로서 각종 정보에 가공을 하여 어떠한 부가가치를 만들어내는 작업, 디지털 신호처리(DSP)는 멀티미디어 신호처리의 기초가 됨.

 

일반적인 디지털 신호처리 구상도

아날로그 입력신호 -> 아날로그 필터 -> 아날로그-디지털 변환기 -> DSP or 컴퓨터 -> 디지털-아날로그 변환기 ->아날로그 필터 -> 아날로그 출력 신호

 

디지털 영상처리 vs 컴퓨터 그래픽스

 

디지털 영상처리: 영상처리를 실제의 영상을 조작하는 것

전형적으로 2차원 데이터로 제한되지만, 의한 진단 분야의 경우 3차원 데이터도 수행

컴퓨터 그래픽스: 컴퓨터 프로그램에 의한 합성 영상을 생성하는 것 

2차원과 3차원 물체를 가지고 작업

 

디지털 영상의 내부

 

영상의 파일 사이즈

예시) MxN (640 x 480)

흑백영상: 각 픽셀당 8비트 (256의 밝기값): 640x480x8(bit) = 640x480 byte

컬러영상: 640x480x8x3(bit) 컬러는 RGB로 색을 표현해여하기때문에 곱하기 3을 해줘야함

 

 

디지털 영상파일 형식

현재 가장 널리 사용되는 영상파일 형식은 JPG와 BMP영상 파일

영상 파일 구조

 

'computer_vision' 카테고리의 다른 글

히스토그램(histogram)  (0) 2023.04.16
픽셀기반 영상처리-산술연산  (0) 2023.04.16
영상처리  (0) 2023.04.16
colormap  (0) 2023.04.16
OpenCv  (0) 2023.04.15

+ Recent posts