logo
logo
라인 日 개발자가 본 초거대 AI의 양면…"성대모사랑 비교하면요"
IT·과학1321321321
IT피플

라인 日 개발자가 본 초거대 AI의 양면…"성대모사랑 비교하면요"

Andrew Chair tt
입력
수정
2016년 구글 딥마인드의 바둑 인공지능(AI) '알파고'가 이세돌9단을 꺾은 '알파고 쇼크' 이후 전세계 AI 산업은 빠르게 발전했다. 지금은 디지털화의 첨단을 논할 때 AI가 빠지면 이상할 정도다. 그리고 6년 전 인류를 놀라게 한 AI는 이제 한 걸음 더 진화 중이다. 더 많은 일을 더 빠르고 똑똑하게, 인간처럼 수행해낼 수 있는 '초거대 AI'로 말이다.

알파고에 이어 초거대 AI로 나아가는 자극제는 2020년 미국 오픈AI가 공개한 'GPT-3'라는 자연어 처리 AI 모델이었다. GPT-3를 만능이라 부를 순 없지만, 적어도 인간 수준의 문장을 생성하고 때론 인간의 요청에 따라 프로그램 코딩까지 가능한 수준임이 증명되면서 화제를 모았다. 다만 GPT-3를 구성하는 언어 학습 데이터의 93%는 영어다. 따라서 영어 외 언어에서는 최고의 성능이나 활용성을 기대하기 어렵다는 점은 한계로 지적됐다. 

일본의 라인과 한국의 네이버 합작으로 탄생한 초거대 AI '하이퍼클로바(HyperCLOVA)'는 이 한계를 극복하기 위해 개발됐다. 각각 모국어인 일본어와 한국어에 특화된 모델로 고도화 작업이 진행 중이며 성능도 GPT-3에 뒤지지 않는 수준이다. 영어 외 언어에서도 기업과 소비자들이 글로벌 수준의 초거대 AI 서비스 혜택을 누릴 수 있게 된 것. 

그러나 초기 단계인 초거대 AI 연구에는 아직 여러 기대와 우려, 도전이 공존한다. 예컨대 상용화의 걸림돌인 높은 운영 비용, 윤리적 기준의 확립 등의 문제가 대표적이며 이를 해결하기 위한 노력이 세계 각지에서 이뤄지고 있다.

하이퍼클로바도 예외는 아니다. <블로터>는 최근 일본 라인의 AI 컴퍼니·자연어처리 개발실 리더인 토시노리 사토(Toshinori Sato)와 화상으로 만나 하이퍼클로바의 개발 상황과 초거대AI의 장점 및 아쉬운점에 대해 들었다. 사토는 지난달 라인과 야후재팬이 공동주최한 '테크버스(Tech-Verse) 2022'에서도 일본어 기반 하이퍼클로바가 거둔 성과에 대해 발표한 바 있다.
 

▲ 토시노리 사토 일본 라인 자연어처리(NLP) 개발실 리더. (사진=라인)
▲ 토시노리 사토 일본 라인 자연어처리(NLP) 개발실 리더. (사진=라인)

하이퍼클로바 일본어 모델의 문장력은 이미 인간과 다르지 않는 수준으로 평가된다. 개발 2년만에 820억개에 이르는 일본어 학습 데이터(파라미터·매개변수)가 학습에 사용됐으며, 인간이 입력한 명령의 의미와 대화의 맥락을 파악하는 능력이 뛰어나다. 특히 인간과의 일대일 대화 상황에서 강점을 보인다.
사토는 "지난해 일본에서 대화 시스템 연구자·개발자들이 한데 모인 대회에서 하이퍼클로바가 '무슨 말을 해도 되는 부문'과 '회사 선배를 회식 자리로 권하는 시나리오 부문'에서 다른 모든 시스템보다 우월하다는 확인을 받았다"고 말했다. 또 "최근 iROS 라는 국제 로봇 콘퍼런스에서도 로봇을 이용한 관광 안내 부문에서 로봇에 하이퍼클로바 대화 시스템을 접목해 가장 좋은 성적을 거둘 수 있었다"고 덧붙였다.

하이퍼클로바는 한·일 모델 공통으로 문장 이해, 처리, 요약, 생성 등에 뛰어난 능력을 보인다. 현재 일본에서도 이런 능력을 이용해 초거대 AI가 인간을 효과적으로 도울 수 있는 시나리오들을 테스트해보고 있다.

사토는 "지금처럼 광고의 캐치프레이즈를 카피라이터가 처음부터 끝까지 만드는 시대는 끝날 수 있다"며 "카피라이터가 자신의 영감을 입력하면 하이퍼클로바가 즉각 그에 기반해 다양한 느낌과 형태의 카피를 제안할 수 있고, 사용자는 그 중 하나를 고르거나 조합을 통해 새로운 카피를 더 쉽게 완성할 수 있기 때문"이라고 말했다.
 

▲ 하이퍼클로바와 같은 초거대 AI는 예를 들어 인간 카피라이터의 업무 순서를 완전히 바꿀 수도 있다. 인간은 AI의 도움을 받아 조금 더 업무량을 줄이고, 더 효율적인 작업에 시간을 투자하고 더 많은 여가 시간을 확보할 수 있게 된다. (자료=테크버스 2022, 하이퍼클로바 세션 발표 영상 갈무리.)
▲ 하이퍼클로바와 같은 초거대 AI는 예를 들어 인간 카피라이터의 업무 순서를 완전히 바꿀 수도 있다. 인간은 AI의 도움을 받아 조금 더 업무량을 줄이고, 더 효율적인 작업에 시간을 투자하고 더 많은 여가 시간을 확보할 수 있게 된다. (자료=테크버스 2022, 하이퍼클로바 세션 발표 영상 갈무리.)

즉, 인간의 특정 업무에서 '프로가 만들었다'고 생각되기 직전의 단계까지 AI가 도울 수 있는 시대가 왔다는 얘기다. 이는 하이퍼클로바 한국어 모델도 마찬가지다. 현재 국내에서 클로즈베타 서비스 중인 한국어 기반 '클로바 스튜디오' 서비스도 △아무 말 요약기 △감성 카피라이터 △보고서 작성기 △감정 분석기 등 글자 기반 작업에서 인간의 능력을 보완하거나 더해줄 수 있는 기능이 강점으로 홍보되고 있다.

이밖에 네이버 선물숍에서는 선물하는 상품의 종류, 보내는 의도, 받는 대상 등에 맞는 적절한 메시지를 추천하는 'AI 추천메시지' 기능이 하이퍼클로바 기반으로 서비스 중이다. 또 음성 회의록을 문자로 자동 변환해주는 클로바 노트에도 하이퍼클로바를 이용한 'AI 요약' 기능이 추가돼 널리 쓰이고 있다.
 

▲ 하이퍼클로가 기반 '클로바 노트' 서비스에서 기사화 이전의 인터뷰 전문을 'AI 요약' 해본 결과의 일부. 사토가 전한 메시지 가운데 중요한 부분들이 잘 요약 정리됐음을 확인할 수 있었다.
▲ 하이퍼클로가 기반 '클로바 노트' 서비스에서 기사화 이전의 인터뷰 전문을 'AI 요약' 해본 결과의 일부. 사토가 전한 메시지 가운데 중요한 부분들이 잘 요약 정리됐음을 확인할 수 있었다.

이처럼 하이퍼클로바 같은 초거대 AI는 기존 AI보다 큰 규모의 학습 데이터, 초고속 연산이 가능한 하드웨어 인프라 등을 기반으로 보다 인간 능력에 근접한 결과물들을 구현해 내고 있다. 아직은 주로 대화나 문장 영역에서 연구가 이뤄지고 있지만 추후 이미지, 영상, 게임 등 상상 가능한 모든 영역에서 초거대 AI가 인간을 도와 활약할 여지는 크다.
다만 잠재력을 폭발시키기 전에 해결해야 할 과제들도 적지 않다. 무엇보다 초거대 AI는 충분히 똑똑해도 아직 영화 속 AI 비서들처럼 스스로 무엇을 선택해 행동하거나 결정을 내릴 수준이 아니다. 사토는 이를 성대모사에 비유했다.

그는 "성대모사를 잘 하는 연예인이 있다고 하자. 그런 연예인은 보통 몇몇 인물에 대한 성대모사에 뛰어난 편이고, 요청을 받으면 자신이 잘하는 성대모사를 하면 된다. 그런데 만약 그 사람이 모든 사람의 성대모사를 잘 한다면? 성대모사를 해달라는 요청이 들어왔을 때 어떤 성대모사를 해야 할지 몰라 고민에 빠질 수 있다. 지금 초거대 AI 언어 모델이 이와 비슷한 상황"이라고 말했다.

이 비유는 지금의 초거대 AI가 가령 인터넷에 흘러 넘치는 모든 일본어나 한국어 문장을 학습하는 일은 가능하지만, 인간이 구체적으로 명령하지 않으면 그것을 제대로 활용할 순 없다는 얘기다. 아는 것이 많고 할 수 있는 일이 많아도 그에 따른 작업의 가치를 AI가 능동적으로 판단하진 못한다.

따라서 초거대 AI가 더 가치 있는 결과물을 만들어내면서 더 다양한 분야로 확산되려면, 우선 인간이 초거대 AI를 어떻게 활용할 수 있을지에 대한 명확한 정의를 내려야 한다. 서비스 인프라 등의 운용 환경도 충분히 갖춰야 한다.

아울러 초거대 AI가 인간의 윤리와 감정을 다루는 문제도 더 많은 연구와 고민이 필요한 영역이다. 사토는 "언어 모델을 만들 땐 존재하는 최대한 많은 데이터를 모으려 하게 되고, 아주 다양한 사람이 만든 데이터가 들어가게 된다. 그 안에는 다양한 상황이 묘사되어 있는데 그것을 두고 '상처받을 만한 상황'이라거나 윤리적으로 문제가 될 수 있다는 판단에 대해선 판단 기준이 모두 다를 수 있다"며 "글자가 그림보다 어려운 점도 지칭이 명확한 그림과 달리 글자는 읽은 사람의 마음에서 어떤 반응이 만들어질지 고민해야 하기 때문"이라고 설명했다.

그는 이 대목에서 "회사가 자체적 기준을 만들어 대처하는 것뿐 아니라 다양한 외부 평가, 사회적 합의가 함께 이뤄져야 한다"고 강조했다. 이에 일본 라인은 독자적인 일본어 윤리와 관련된 데이터셋을 먼저 구축하고 이를 타사의 윤리 검증 데이터셋과 비교 실험하는 연구 등을 진행 중이다. 이미 약간의 비교우위를 확인했지만 라인은 이 평가 세트를 오픈소스로 공개하고, 다양한 연구기관과 연계를 통해 사회적 합의에 따른 윤리 기준을 정립하겠단 계획이다.

비용의 문제도 피해갈 수 없다. 초거대 AI는 방대한 규모의 데이터 기반 모델 구축, 최적화만 하더라도 기존 AI보다 막대한 비용이 든다. 이를 가동하는 비용도 마찬가지다. AI의 구조가 복잡해지고 연산력이 좋아질수록 성능도 높아지지만 이를 일반 사용자에게 서비스하는 단계의 비용도 그만큼 증가한다면 상용화가 쉽지 않다.

사토에 따르면 GPT-3의 차세대 버전으로서 이전 세대보다 훨씬 뛰어난 성능을 보여줄 것으로 기대되는 GPT-4는 '잡담 한마디 오가는 데 비용'이 한화로 약 2000원~3000원 사이가 될 것이라고 한다. 만약 로봇과 메신저로 한마디 대화 하는데 1회 서비스 비용이 수천원에 달한다면? 기업 입장에서는 무료 서비스가 쉽지 않다. 고성능 초거대 AI의 대중화까지 앞으로 수년이 더 걸릴 것으로 예상되는 이유다. 이 같은 운영비 절감은 현재 관련 분야의 모든 종사자와 전문가들이 관심을 갖고 연구 중인 과제다.

이처럼 차세대 기술혁신의 키(Key) 가운데 하나로 주목받는 초거대 AI도 아직은 일장일단이 뚜렷하다. AI 분야에 20년 이상 종사했다는 사토도 "AI도 따지고 보면 단순 프로그램이며, 초거대 AI도 생각만큼 어렵거나 기술적으로 새로운 개념은 아니다"라고 말했다.
다만 사회가 2016년의 알파고 쇼크를 기억하듯 지금의 시기는 후일 AI 발전 역사에 기록될 또 하나의 이정표가 될 시기란 점에서 관심을 가져보기에 충분하다.

이에 대해 사토는 "개인적으로 지금 초거대 AI 개발에 참여하고 있다는 건 거의 10년, 20년에 한번 있을 만한 경험을 하고 있는 것"이라며 "20년쯤 검색엔진이 확 보급되던 시절, 다양한 유형의 사용자 검색 데이터가 뒷단에 쌓였고 2010년에는 하둡 등의 프로그램으로 이를 빅데이터 분석할 수 있게 됐다"고 회고했다. 이어 "지금 초거대 AI 개발에 대한 경험 역시 10~20년 후 새로운 기술의 파도가 몰아쳐 올 때 활용될 중요한 지식이 될 것이라 기대하며 열심히 임하고 있다"고 말했다.
 

Andrew Chair tt
#네이버#라인#인공지능#초거대ai#하이퍼클로바