100만 마리의 물고기로 종 분류하는 딥러닝과 FishNet
피터 사도우스키 교수의 인공지능을 활용한 어종 분류 및 크기 회귀
🐠
목차
- 소개
- 도전과제
- 해결책
- 데이터 수집
- 이미지 분할
- 어종 분류
- 크기 회귀
- 성과
- 잠재력
- 전망
1. 소개
인도네시아 해양 자원을 관리하고 지속 가능한 어종 관리를 위해 인공지능을 활용한 어종 분류 및 크기 회귀 기술을 소개합니다. 이 기술은 피터 사도우스키 교수와 하와이 대학교의 컴퓨터 과학 부문의 협력을 바탕으로 개발되었습니다. 이 프로젝트는 자연 보존 조직, 인도네시아 자연 보전 연구 소속 단체 및 인도네시아 해양 행정부로부터의 지원을 받았습니다.
2. 도전과제
인도네시아는 수천 마리의 어종이 분포하는 환상적인 바다의 유산을 가지고 있습니다. 그러나 이 어종들은 어장에서 잡히는 어종 뿐만 아니라 어선의 종류에 따라 다양하게 분포하고 있어 자원 관리가 어렵습니다. 해외 어종 관리 인증을 받기 위해서는 어장에서 분석 대상인 어종의 5%를 모니터링 해야 하는데, 이는 약 10,000대의 어선에 대한 분석 작업으로 매우 어렵습니다.
3. 해결책
우리 팀은 디지털 카메라를 활용하여 어장에서 잡힌 어종들의 사진을 쉽게 수집할 수 있게 되었습니다. 이 사진들에는 어종의 잡힌 시간과 위치와 같은 메타데이터가 포함되어 있어 분류 작업에 활용할 수 있습니다. 또한, 컴퓨터 비전과 인공지능 기술의 발전으로 인해 대규모 데이터베이스를 구축하여 학습된 모델을 만들 수 있게 되었습니다. 이를 위해 인도네시아 어종 관리를 위해 수십만 장의 사진을 어종과 크기로 주석을 붙여 수집하였습니다.
4. 데이터 수집
Nature Conservancy와 협력하여 수집한 데이터는 500,000 여대의 특수 어선에서 2억 장 이상의 디지털 이미지로 구성되어 있습니다. 이 중 약 1백만 장의 어종과 크기에 대한 주석이 달려 있습니다. 특정 어종과 일치하는 이미지를 인공지능 학습에 활용하기 위해 딥 러닝 모델과 이미지 분할 기술을 적용하였습니다.
5. 이미지 분할
단일 이미지에 존재하는 어종이 겹치지 않도록 세분화하는 작업이 필요합니다. 이를 위해 Facebook의 Detectron 2 region CNN을 사용하여 이미지 분할 작업을 수행하였습니다. 한 마리의 어종만 포함된 이미지에서는 약 99%의 정확한 분할 결과를 얻을 수 있었으며, 겹치는 어마어마한 어종 이미지에서도 약 93%의 정확도를 보였습니다.
6. 어종 분류
분할된 어종들에 대해 어종 정보를 분류하기 위해 또 다른 딥 러닝 모델을 사용하였습니다. 학습된 모델은 163가지 다른 어종에 대한 확률을 출력하며, 상위 1위의 정확도는 94% 이상, 상위 5위의 정확도는 99% 이상을 보입니다.
7. 크기 회귀
어종의 크기 추정을 위해 엔지니어링된 특성 데이터를 활용하여 랜덤 포레스트 모델을 구축하였습니다. 실제로 사람에게서 주석을 받은 크기와 예측된 크기 간의 평균 제곱근 오차는 2.2cm로 매우 정확한 결과를 얻을 수 있었습니다.
8. 성과
통합된 인공지능 기술을 통해 어종의 분류와 크기 회귀 작업을 실시함으로써 어종 관리에 대한 중요한 정보를 얻을 수 있게 되었습니다. 인도네시아 어종 자원의 지속 가능한 관리에 기여하고 있으며, 그 결과로 어종 자원 관리 기관으로부터 인증을 받게 될 전망입니다.
9. 잠재력
인공지능을 활용한 어종 분류 및 크기 회귀 기술은 다른 분야로의 전이 학습에 큰 잠재력을 가지고 있습니다. 대규모 데이터셋을 활용하여 훈련된 모델은 의료 영상이나 다른 어종 자원관리에 응용될 수 있습니다.
10. 전망
현재의 기술은 어종 분류와 크기 회귀에 큰 도움을 주고 있으며, 앞으로 더 많은 협력과 연구를 통해 더 정교하고 신뢰성 있는 모델을 개발할 전망입니다. 이를 통해 인도네시아를 비롯한 다양한 어종 자원관리에 대한 해법을 제공할 수 있습니다.
FAQ (자주 묻는 질문)
Q: 어떤 데이터를 사용하여 어종 분류와 크기 회귀를 수행하셨나요?
A: 인도네시아 어종 관리 단체와의 협력을 통해 2억 장 이상의 디지털 이미지를 수집하였습니다. 이 이미지들은 163가지 다른 어종에 대한 주석을 포함하고 있습니다.
Q: 어종 분류 모델의 정확도는 얼마나 되나요?
A: 분류 모델의 상위 1위 정확도는 94% 이상이며, 상위 5위 정확도는 99% 이상입니다.
Q: 크기 회귀 모델은 어떻게 구성되어 있나요?
A: 크기 회귀를 위해 엔지니어링된 특성 데이터와 랜덤 포레스트 모델을 사용하였습니다. 이를 통해 얻은 결과는 예측된 크기와 실제 크기 간의 평균 제곱근 오차가 2.2cm로 매우 정확한 결과를 보여줍니다.
Q: 인공지능을 활용한 어종 분류 기술은 다른 분야에도 적용될 수 있나요?
A: 네, 훈련된 모델은 전이 학습을 통해 다른 분야에도 적용될 수 있습니다. 의료 영상이나 다른 어종 자원 관리에도 활용될 수 있는 잠재력을 가지고 있습니다.
요약
이 프로젝트는 피터 사도우스키 교수와 하와이 대학교의 인공지능 기술을 활용하여 인도네시아 어종 관리에 기여하고 있습니다. 어종 분류와 크기 회귀를 통해 어종 자원 관리에 대한 중요한 정보를 효과적으로 얻을 수 있게 되었으며, 전이 학습을 통해 다른 분야에도 응용될 수 있는 잠재력을 가지고 있습니다.