LG, 이미지 양방향 인식 AI 대중화 나서
초거대 AI용 반도체 개발 나선 대기업들
/그래픽=비즈워치챗
GPT를 시작으로 초거대
AI 시장이 빠르게 커지면서 초기 시장점유율 확보를 위한 대기업들의 기술 경쟁이 시작됐다.
최근엔 AI 반도체 기술 개발을 위한 합종연횡도 활발히 진행되고 있다. 초거대 AI는 소프트웨어뿐만 아니라 데이터 처리 능력, 전력효율 등 하드웨어의 성능도 중요한 탓에 여러 기업 간 연합전선 구축이 필요하기 때문이다.
이미지 읽는 인공지능 나왔다
LG AI연구원은 18일(현지시간) 캐나다에서 열린 세계 최대 컴퓨터 비전 학회 'CVPA(Computer Vision and Pattern Recognition·컴퓨터 비전 및 패턴 인식) 2023'에서 인공지능(AI) 서비스 '캡셔닝 AI(Captioning AI)'를 처음 대중에 공개했다.
캡셔닝 AI는 텍스트와 이미지를 양방향으로 인식하는 초거대 멀티모달 AI '엑사원(EXAONE)'의 일부 기능을 상용화한 기업 대상 AI 서비스다.
앞서 LG AI 연구원은 지난 2021년 12월 초거대 멀티모달 AI 엑사원을 선보였다. 올 3월 오픈AI가 공개한 멀티모달 AI '챗GPT-4'보다 15개월 가량 앞선 셈이다. 엑사원은 일반 대중이 활용할 수 있는 챗GPT-4와 달리 산업용 AI로 개발돼 대중에 잘 알려지지 않았다. 업계에서는 이번에 LG가 일부 기능을 대중에 공개하면서 LG의 AI 기술 상용화가 머지 않았다는 관측도 나온다. (관련기사: 챗GPT-4보다 15개월 앞섰다…LG AI '엑사원' 넌 누구니)
이미지 상의 다양한 요소와 특징을 인식해 설명글과 키워드를 생성하는 캡셔닝 AI(Captioning AI)/사진=LG캡셔닝
AI엔 '제로샷 이미지 캡셔닝(
Zero-Shot Image Captioning)' 기술이 최초로 적용됐다. 제로샷 이미지 캡셔닝은
AI가 기존에 학습한 대량의 이미지와 텍스트를 기반으로 배경, 인물, 행동 등 이미지에 표현된 여러 요소의 특징과 관계를 인식하도록 돕는 기술이다. 이를 이용하면
AI가 처음 보는 이미지라도 기존 경험과 지식을 활용해 이해하고 설명할 수 있다.
캡셔닝 AI는 이미지를 대량으로 관리하는 기업들의 업무 효율성을 높이고 생산성을 높일 수 있을 것으로 기대된다. LG AI연구원에 따르면 캡셔닝 AI는 문장이나 단어의 길이에 따라 다르지만 평균적으로 5개 문장, 10개 키워드를 10초 이내 생성할 수 있다.
배경훈 LG AI연구원장(가운데)이 LG AI연구원을 방문한 폴 헤네시(Paul Hennessy) 셔터스톡 CEO(오른쪽)와 이야기를 나누고 있다. / 사진=LGLG AI연구원은 캡셔닝
AI 개발 과정에서 세계 최대 이미지 플랫폼 기업 셔터스톡(
Shutterstock)과 데이터 학습부터 서비스 개발까지 함께해 완성도를 높였다. 학습 데이터의 편향성·선정성 문제 같은
AI 윤리 검증과 저작권 투명성 확보 작업을 거쳤다.
세잘 아민(Sejal Amin) 셔터스톡 최고기술책임자(CTO)는 "현재 글로벌 고객사 10곳을 대상으로 '얼리 액세스(앞서 해보기) 프로그램'을 진행하며 캡셔닝 AI 기술을 발전시키고 있다"며 "캡셔닝 AI는 고객들이 반복 작업보다 좀 더 본질적이고 창의적인 일에 집중할 수 있게끔 돕는 AI가 될 것"이라고 말했다.
AI 생태계 구축에 속도 내는 대기업들
챗GPT를 시작으로 초거대 AI 시장이 가파르게 성장하자 대기업들도 경쟁력 확보를 위해 초거대 AI 개발에 나선 상태다. 이 과정에서 여러 업체 간 합종연횡이 활발히 이뤄지고 있다. 초거대 AI는 소프트웨어뿐만 아니라 방대한 데이터 처리 능력, 전력효율 등 하드웨어의 높은 성능도 뒷받침돼야 하기 때문이다.
초거대 AI는 방대한 데이터를 초고속으로 연산·추론해 결과물을 산출한다. 막대한 전력을 사용하기 때문에 저전력으로 높은 성능을 발휘하는 AI 전용 반도체가 필수다. 현재는 그래픽처리장치(GPU·Graphic Processing Unit)를 통해 AI 연산을 처리하고 있지만, 향후 초거대 AI가 고도화될수록 전력소모와 연산속도의 한계에 부딪힐 수밖에 없다.
AI 반도체는 '신경망처리장치(NPU·Neural Processing Unit) 반도체 칩으로도 불린다. NPU는 중앙처리창치(CPU·Central Processing Unit)나 GPU보다 더 빠르고 효율적으로 데이터를 처리할 수 있고, 추론 성능도 높다. 덕분에 AI 분야에서 혁신을 가져올 수 있을 것이란 평가다.
LG AI연구원은 국내 AI 반도체 개발 업체 '퓨리오사AI'와 손잡았다. 퓨리오사AI는 2세대 AI 반도체 '레니게이드'를 통해 LG AI 연구원의 초거대 AI '엑사원' 기반의 생성형 AI 상용 기술을 검증할 계획이다. 또 LG AI연구원의 평가와 피드백을 AI 반도체를 개발 과정에 반영할 예정이다.
LG전자는 캐나다의 AI 컴퓨팅 설계기업 텐스토렌트와 손잡고 NPU 개발에 나선다. 협업을 통해 개발된 NPU는 향후 LG전자의 가전제품과 전장부품, 데이터센터 등에 활용될 예정이다.
삼성전자도 네이버와 손잡고 초거대 AI용 반도체를 제작하고 있다.
SK그룹은 SK텔레콤·SK하이닉스를 중심으로 AI 반도체 설계업체 '사피온'을 설립하고, 초거대 AI 생태계 구축에 나섰다. 사피온에서 개발한 NPU를 통해 데이터센터와 자율주행 등 미래기술 분야를 선점하겠다는 구상이다. 사피온은 최근 엔비디아의 마이클 쉐바노우 박사를 최고기술책임자(CTO)로 영입하고, NPU 개발 속도를 높였다. 쉐바노우 CTO는 사피온 미국법인에 근무하며 차세대 NPU 연구개발을 총괄할 예정이다.
업계 관계자는 "최근 대기업들이 초거대 AI 기술 개발을 위해 AI 반도체 업체들과의 합종연횡이 한창이다"며 "현재 글로벌 AI 반도체 시장은 외국 업체의 점유율이 높지만, 국내 업체들도 하나둘씩 상용화 제품을 내놓기 시작하면서 추격을 시작하고 있는 상황"이라고 설명했다.