과기정통부, AI 학습용 데이터 190종 추가 개방...총 381종으로 늘어

12일부터 AI허브에 공개...데이터 활용 확산 논의도

과학기술정보통신부는 국내 인공지능 기술과 산업 발전을 견인할 AI 학습용 데이터 190종(5억 8000만 건)을 AI 통합 플랫폼 AI허브(aihub.or.kr)를 통해 추가로 개방한다고 12일 밝혔다.

과기정통부는 2017년부터 기업, 연구자 등이 시간·비용 문제 등으로 개별 확보하기 어려운 AI 학습용 데이터를 구축·개방해 왔고, 2020년부터 구축 규모를 대폭 늘린 후 18만 건 이상의 다운로드를 기록 중이다.



이번 데이터 개방은 지난해 6월 개방한 2020년 구축 데이터 170종(4억 8000만 건)에 더해 지난해 구축한 190종에 대한 품질·활용성 검증을 거쳐 순차적으로 개방하는 것으로 총 규모는 381종에 달하게 된다.

이번에 개방되는 AI 학습용 데이터는 기획부터 구축까지 산업계와 전문가, 국민이 대거 참여한 결과물이다. 데이터 구축 과정에만 811개 기업·대학·병원·기관과 4만 3000여명에 이르는 국민이 참여했다.

데이터는 한국어 음성·자연어(아동, 다화자 음성 등 44종), 영상·이미지(스포츠 동작, 반려동물 등 39종), 교통·물류(로봇주행, 교통사고 등 22종), 헬스케어(심장질환, 정신건강 등 32종), 재난·안전·환경(과적차량, 물류창고 등 27종), 농·축·수산(정밀 농업, 스마트 양식 등 26종) 등 6대 분야로 구성됐다.

과기정통부는 데이터 개방과 함께 AI 허브 데이터 활용 촉진과 성과 확산 방안을 논의하는 ‘제3회 AI 데이터 활용협의회’를 박윤규 2차관 주재로 열어 인공지능·데이터 산업·연구현장의 생생한 의견을 수렴했다.

이날 협의회에는 인공지능 서비스를 직접 개발·활용하고 있는 주요 대기업, 중소·스타트업과 유관기관 등 14개 기업·기관 관계자가 참석했다.

과기정통부와 지능정보원은 AI 학습용 데이터 구축·활용 주요 성과와 AI 허브 기능 개선사항 등을 공유하고 데이터 이용 활성화를 위한 지원 방안 등을 제시했다.

이어 민간의 AI 허브 데이터 활용 우수사례 발표에서는 KT의 다양한 한국어 음성 데이터를 활용한 콜센터 상담 내용 분류 및 요약 성능 향상 사례와 함께 에이아이포펫의 AI 허브 ‘반려동물 안구질환 이미지 데이터’를 활용한 반려동물 질병 판독 서비스 ‘티티케어(TTcare)’ 개발 사례(CES 2022 혁신상 수상)를 소개했다.

참석자들은 계속되는 간담회를 통해 인공지능 산업·연구·교육 등 다양한 현장에서 AI 허브 데이터 활용을 더욱 촉진할 수 있는 각종 정책지원 방안 등에 대해 가감 없이 의견을 나눴다.

박윤규 차관은 “우리 데이터로 우리 기업이 개발한 서비스가 세계적으로 인정받고 있다는 점이 자랑스럽기도 하지만, 동시에 막중한 책임감을 느끼고 있다”며 “앞으로도 다양한 분야에서 의미 있는 활용성과가 나타날 수 있도록 데이터의 양적·질적 가치를 계속 높여가나는 것이 협의회를 통해 모색할 중요한 과제”라고 말했다.

<저작권자 ⓒ 한국인포맥스, 무단 전재 및 재배포 금지>