* 인공지능(AI)의 한 분야로, 컴퓨터와 시스템을 통해 디지털이미지, 비디오 및 기타 시각적 입력에서 의미있는 정보를 추출한 다음 이런 정보를 바탕으로 작업을 실행하고 추천할 수 있게 함 - AI -> 생각 - 컴퓨터 비전 -> 보기, 관찰, 이해
2. 데이터셋
* 컴퓨터 비전 모델은 데이터 모음(일반적으로 이미지, 비디오 또는 기타 시각적 정보)를 학습 * 데이터셋은 모델의 성능을 결정하는데 중요(양과 품질) * 데이터셋의 크기는 모델이 학습 중에 본 예제의 수를 타나내기 때문에 중요 * 데이터셋의 품질은 주석이 잘못 지정되거나 레이블이 잘못 저장된 경우 모델의 성능에 많은 부정적 영향을 줄 수 있다. * 다양한 개체 변형의 존재, 조명조건, 배경 등을 포함한 데이터셋의 다양성도 모델의 견고성을 보장하는 데 중요
1. 어노테이션(주석)
주석은 데이터 집합의 데이터의 정보 또는 레이블을 추가하는 프로세스
예) 이미지에서 특정 개체의 존재, 이미지 내 개체의 위치 또는 속성(색상, 크기, 모양 등)을 나타내는 레이블이 포함
어노테이션은 데이터셋에 수동으로 추가하거나 컴퓨터 알고리즘을 사용하여 자동으로 생성할 수 있음
2. 어노테이션 종류
Bounding Box:이미지 내에서 개체의 위치 및 크기를 정의하는 작업, 개체 주위에 box를 그리고 클래스로 label을 지정
Keypoint :개채 내의 특정 관심 지점을 표시하는 작업. 예) 이미지 내 사람의 관절의 위치를 예측이 목표인 작업
Segmentation: 이미지 내에서 개체의 경계를 정의
3. 어노테이션 의 방법
수동 주석: 마우스 또는 스타일러스와 같은 도구를 사용하여 이미지 내의 각 개체 수동으로 레이블을 지정하는 작업, 가장 시간이 많이 걸리지만 최고 수준의 제어와 정확성을 제공
반자동 주석: 컴퓨터 지원 도구를 사용하여 주석 프로세스의 속도를 높이는 작업
자동 주석: 컴퓨터 알고리즘을 사용하여 이미지 내의 개채에 자동으로 레이블을 지정하는 작업. 가장 빠르지만 정확도가 가장 낮음