“中企·스타트업도 빅데이터 활용 어렵지 않아요”
상태바
“中企·스타트업도 빅데이터 활용 어렵지 않아요”
  • 이권진 기자
  • 승인 2020.07.14 10:21
  • 댓글 0
이 기사를 공유합니다

[스타트up 인터뷰] 신호욱 셀렉트스타 대표
크라우드소싱 앱 ‘캐시미션’ 구축
전세계 누구나 AI학습데이터 생산

DATA-STARS(데이터 활용 사업화 지원)는 과학기술정보통신부가 주최하고, 한국데이터산업진흥원이 주관하고 있는 사업이다. DATA-STARS는 데이터를 활용한 기업이 경쟁력을 갖출 수 있도록 종합적으로 지원 중이다. ​▲사업화지원금 ▲데이터 활용 및 비즈니스 특화 인큐베이팅 ▲후속지원 및 네트워킹 등이 주요 지원 내용이다.

올해 데이터스타즈 공모에는 총 414개 스타트업이 접수하면서 34.5:1이라는 최고 경쟁률을 기록했습니다. 핀테크, 프롭테크 외에도 데이터 가공, 모빌리티, 소셜미디어, 라이브커머스 등 ​새로운 영역의 데이터 활용한 비즈니스 모델을 가진 스타트업 12개사를 선정했됐다.

이 가운데 셀렉트스타는 카이스트 출신의 젊은 학부생들이 창업한 스타트업이다. 개별 기업마다 빅데이터 활용을 어떻게 할까 고민이라면, 셀렉트스타가 그 해법을 제시한다. 중소기업뉴스가 신호욱 대표를 직접 만나 이야기를 들어봤다.

 

신호욱 대표
신호욱 대표

셀렉트스타는 어떤 스타트업인가?

한마디로 말하자면 모바일 크라우드소싱 기반 AI 데이터 플랫폼이다. AI기업들이 필요한 데이터를 모바일 크라우드소싱 형태로 빠르게 가공해서 해결하고 있다. 2016년에 알파고가 성공해 본격적으로 딥러닝 기법이 유행을 끌었다.

그런데 학습용 데이터를 만들기까지 크게 두 단계의 과정이 필요하다. 첫 번째로 수집과정이다. 범용성 있고 높은 성능의 AI를 만들기 위해서 많은 양의 데이터가 필요하다. 또한 이를 수집하기 위해 다양한 사람들로 구성된 수집 풀이 필요하다.

그 후엔 데이터 가공이 필요한데 가공은 원천 데이터를 기계가 이해할 수 있는 형태로 변환하는 작업이다. 이를 트랜스크립션(transcription) 또는 어노테이션(Annotation) 과정이라고 한다. 예를 들어 음성으로 안녕하세요라고 얘기했을 때 컴퓨터는 이를 안녕하세요.’라는 글자로 투입해야 한다. 이때 변환이 정확히 이뤄져야 한다. ‘안녕하세요.’인데 안녕하십니까?’로 투입되면 오류가 생긴다. 또 기계가 언어의 변주도 계속 학습해야 한다.


어떻게 같은 뜻이라는 것을 학습시키나?

안녕하세요’‘안녕하십니까?’‘안녕하신지요등의 원천 데이터가 다양해야 하고 트랜스크립션도 무척 많아야 한다. 그래서 가공 쪽의 니즈는 AI기업이 필요한 데이터를 아웃소싱해서 빠르고 정확하게 해결하는 것이다. 그런데 데이터 가공 수요가 굉장히 비주기적이어서 회사 내부에 전담부서를 두기가 어렵다. 또한 전문성이 높은 작업이 아니기에 보통 비정규직 노동자들에게 일감을 맡긴다. 그러다 보면 거기에 수반하는 부가비용들이 많다. 사람들을 컨트롤해야하고 데이터를 생산하는 파이프라인도 설계해야 한다. 이런 것들은 규모가 작은 중소기업이나 AI스타트업에게 상당한 부담이 된다.

 

셀렉트스타는 이걸 어떻게 비즈니스 모델로 만들었나?

우리는 이러한 문제점들을 크라우드소싱 형태로 해결한다. 크라우드소싱은 불특정 다수의 참여로 문제를 해결하는 방식이다. 최근 네트워크 속도가 빨라지고 사람들이 어디서든 참여할 수 있게 되면서 화두가 되고 있는 문제 해결 방안이다. 우리는 이 크라우드소싱 형태를 캐시미션이라는 어플리케이션으로 만들었다. 유저들이 플랫폼에 들어와서 AI기업이 우리에게 맡긴 데이터 생산 작업을 언제 어디서나 수행할 수 있다.

 

유저인 작업자가 과제를 수행할 때 특정 기업의 가공작업에 참여할 수 있다는 건가?

맞다. 어플리케이션에 접속해 미션에 따라 박스치기(그리기)를 손가락으로 하면 된다. 작업자는 1건마다 리워드(포인트)를 받아간다. 그러니까 자신이 시간을 쏟는 만큼 참여해서 돈을 받아갈 수 있다. 우리는 전 세계 불특정 다수가 참여한 학습 데이터를 생산하는 것이다.

 

이러한 리워드 모델이 해외에도 있나?

대표적으로 2008년부터 아마존에서 시작한 메카니컬 터크(Amazon Mechanical Turk)’라는 서비스가 있다. 물류과정에서 AI를 도입하기 위해 만든 형태였다. 웹 기반으로 전국 어디서든 참여해서 비슷한 학습 데이터 작업을 유저가 하면 돈을 받는 구조였다. 이 모델이 잘 되다 보니 다른 기업들에게로 서비스를 확대한 것이다. 이것이 미국 쪽에서는 10년 전부터 유행했던 비즈니스다. 국내에서는 이제 시작이다.

 

코로나 사태를 겪으면서 제조업의 중요성이 부각됐다. 전통 제조업들이 AI를 도입할 수 있는가?

전통 제조업 및 1, 2차 산업에도 AI를 통해 혁신을 이룰 수 있다. 예를 들어 축산농가에서 돼지가 오랫동안 누워 있으면 병에 걸려있을 확률이 높다고 한다. 그런데 사실상 인간이 24시간 동안 CCTV를 보며 관리할 수가 없다. 그런 인간의 한계를 대신해 AI는 자동으로 돼지가 누워있는 모습을 본다. 만약 일주일 동안 누워있는 시간이 몇 시간이다하면 병에 걸렸을 확률이 높다라고 농장주한테 알림을 준다. 그러면 그 특정 돼지를 더 돌볼 수 있다. 농사에서도 마찬가지다.

전통 제조업에서도 제품의 불량을 탐지하는 것이 굉장히 큰 이익이 된다. 불량 탐지율이 0.1%만 올라가도 대기업 입장에서 1000억 가까이 손실이 줄어들게 된다. 인간은 빛의 각도 등에 따라 제품의 흠집을 보지 못한다. 반면에 AI는 인간의 지각보다 훨씬 뛰어나다. AI가 제조업에서 혁신할 수 있는 부분은 굉장히 많다.


- 이권진 기자·사진 오명주 기자


댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.