
AI(인공지능)이 사람의 말을 알아듣고 그에 맞는 답을 해주는 AI 콜센터가 한걸음 가까워졌다. 영화 아이언맨의 AI 비서 '자비스'가 현실화되고 있는 셈이다.
2일(현지시각) 오픈AI는 음성-텍스트 변환모델인 '위스퍼'(Whisper) API를 공개했다.
오픈AI가 지난해 9월 공개한 위스퍼는 웹에서 수집한 68만 시간의 다국어 및 멀티태크스 데이터로 학습한 자동음성인식(ASR) 시스템이다. 음성을 다양한 언어로 옮기거나, 이를 영어로 번역해준다. 당시 오픈AI는 "대규모의 다양한 데이터셋을 기반으로 억양이나 주변 소음에 대한 견고성(robustness)이 향상됐다"라며 "데이터셋의 3분의 1은 비영어 데이터"라고 설명했다.
위스퍼 API는 분당 0.006달러로, 다양한 파일형식(m4a·mp3·mp4·mpeg·mpga·wav·webm)을 지원한다. 오픈AI는 "지난해 9월 공개된 위스퍼는 개발자 커뮤니티로부터 찬사를 받았지만 실행하기 어려운 모델이었다"라며 "이젠 API를 통해 위스퍼 large-v2 모델을 사용할 수 있게 됐다. 최적화된 스택으로 다른 서비스 대비 빠른 서비스를 보장한다"고 강조했다.
이에 따라 AI 콜센터도 확산될 전망이다. 이미 글로벌 전자상거래 기업 쇼피파이는 자체 쇼핑 어시스턴트 서비스에 챗GPT를 적용했다. '따뜻한 우드 찾아줘'라고 입력하면 그에 맞는 상품을 추천해주는 서비스인데, 앞으로는 문자가 아니라 간단히 말만 하면 될 전망이다.
영어 회화 앱 스픽(Speak)도 위스퍼 API를 적용한 교육서비스를 선보였다. 예를들어 햄버거 가게에서 음식을 주문하는 상황에서 영어로 말하면 AI가 이를 인식하고 그에 맞는 답을 해준다. 오픈AI는 "스픽은 한국에서 가장 빠르게 성장하고 있는 영어 앱"이라며 "모든 레벨의 언어 학습자에게 인간 수준의 정확도를 제공하는 위스퍼는 개방형 대화연습과 정확한 피드백을 제공한다"고 설명했다.
윤지혜 기자 yoonjie@mt.co.kr
저작권자 ⓒ '돈이 보이는 리얼타임 뉴스' 머니투데이
| “로봇이 택배배달·순찰 나선다”…관련주 줄줄이 강세 (0) | 2023.03.03 |
|---|---|
| [MWC23] SKT "부스 누적 방문객 5만명 돌파…AI·UAM 인기 덕" (0) | 2023.03.03 |
| 머스크도 뛰어든 AI전쟁…챗GPT 대항마 검토 (0) | 2023.03.02 |
| "카카오모빌리티, 택시운영 노하우로 하늘길 더 잘 누빈다" (0) | 2023.03.01 |
| 월 35만원짜리 '서빙 로봇'…사장님들 만족한 뜻밖의 이유 [긱스] (0) | 2023.03.01 |