본문 바로가기
기타 IT 경험/ETC

챗GPT - 구글의 시대가 저물고 있다.

by 슬기로운 동네 형 2023. 2. 16.
반응형

챗GPT - 구글의 시대가 저물고 있다.

 

인간다운 텍스트를 만들어내는 자기회귀 언어모델.


오픈AI 그리고 GPT(AI검색 서비스)

 최근 오픈 AI가 개발한 대화 전문 인공지능(AI) 챗 GPT가 온갖 매체와 사람들의 관심을 받고 있다.

 오픈AI 는 개발사 이름이다. 일론 머스크와 샘 올트먼 등이 설립했다.

 현재 사용자는 약 1000만명 정도 추산이고... 지금도 많은 이들이 관심을 갖고 사용을 시작하고 있으니 숫자는 계속 늘어나고 있다.

 주로 제공하는 서비스는 번역, 검색(질의응답), 문서 작성 및 코딩 지원이다.

 이 AI서비스는 미 의사먼허 시험을 통과했고 로스쿨 졸업시험을 평균 C+학점으로 이수, 와튼 스쿨 MBA 기말시험에서 B학점을 받았다.

 

GPT(Generative Pre-trained Transformer)를 풀이하면 '미리 훈련된 생성형 변환기'

기존에 입력된 스크립트만 대화를 진행하는 변환기에서 더 발전된 딥러닝(심층학습)을 통해 스스로 언어를 생성하고 추론할 수 있는 게 가장 큰 특징이다. 이런 특징을 기반으로 사용자의 검색 요청에 따라 글과 그림, 코딩, 음악, 영상 등 각종 '창작물'을 생성한다.

 

오픈AI는 이용자 폭주로 서버가 마비되자 월 20달러를 받는 유료 서비스를 시작한다고 밝혔다. 당연히 이용자가 폭주하니 받아주는 서버가 필요할 것이다. 구체적인 유료화 일자는 확정되지 않았지만, 미국에서 먼저 서비스가 시작된다. 곧이어 다양한 버전이 출시될 것으로 예상된다.

구글의 바드와 전쟁시작

아직은 시작 그리고 풀어야 할 문제들

 구글이 대단한게 GPT가 관심을 끌자마자 질세라 곧이어 바드를 발표했다. 비록 망신은 톡톡히 당했지만... 당장 타이핑에 익숙한 구글 같은 검색엔진을 바로 대체하기는 어려울 것이라는 전망이다. 현재 챗GPT 버전은 데이터가 입력된 2021년까지 발생한 일들만 인지하고 있다. 실시간 발생한 이벤트에 대해선 대응이 불가능하다.  영어 외 다른 언어는 학습 데이터가 부족해 오류가 잦으며 답변 속도도 느리다. 답변으로 내놓은 결과의 사실여부도 정확하지 않는 경우도 있으므로 사용자가 검증하고 책임져야 한다. 언어 데이터 기반이니 복잡한 수학 문제 등은 만족할만한 답변을 얻지 못한다.

 

 많은 기업들이 앞다투어 생성형AI(Generative)를 출시하고 있다. 사용자 입장에서는 더 나은 결과를 더 빨리 얻을 수 있다는 점에서 나쁠 건 없다.  하지만, 이들 AI의 훈련과정과 실제 사용자들의 이용과정에서 에너지 소비는 피할 수 없다.


 "검색 때 마다 온실가스가 배출된다."

춘천 네이버 데이터센터 내부서버

 AI를 학습시키기 위해서는 엄청난 서버를 운영해야 하며 에너지 소비도 그만큼 늘어난다.

 챗GPT 개발을 위한 GPT-3 교육에서는 1287㎿h를 소비하고 550톤의 CO2를 배출했다.

 

 OpenAI 대표 샘 알트만의 인터뷰 내용이다.

GPT-3은 너무 과대평가되었습니다. 여러 칭찬은 감사하지만, 여전히 약점이 있고 이상한 실수를 하기도 합니다. AI가 세상을 바꿀 것이지만 GPT-3가 그 첫발을 내딘 것뿐이라 생각합니다. 여전히 알아낼 게 많아요.

공식적으로 드러난 문제점들이 존재한다.


1. 효율성이 너무 떨어진다.


GPT-3은 무려 1,750억 개의 매개변수를 가지고 있으며 인간이 평생 보는 정보보다 많은 데이터를 학습해야 한다. 사전학습에 필요한 비용과 시간이 다소 방대하고 활용하기도 쉽지 않다.


2. 현실세계의 물리적 상식을 잘 모른다.


GPT-3는 "치즈를 냉장고 안에 넣으면 녹을까?"라는 질문에 "그렇다"라고 답했는데, 일반적인 사람이라면 당연히 알 만한 물리적 지식을 잘 모른다. 고장 난 냉장고 GPT-3 모델은 엄밀히 말해 인간의 뇌처럼 '개념을 학습'하는 것이 아니라, '이 뒤에 나올 문장 중 가장 자연스러운 단어를 학습'하는 모델이기 때문이다. 아무리 밀도 높은 수학 문제집을 학습시키더라도 계속해서 오류가 나오는 것도 이런 이유에서이다.

 

3. 학습에 사용된 예제를 외우고 패턴을 분석, 학습하는 것이지 실제로 추론해 내는 것이 아니다.


4. 새로운 정보를 수용하기 어렵다. 한 마디로 제대로 된 '기억력'이 없다.


 GPT-3 모델이 비록 (학습 내용에 따라) 인간 또는 인격과 대화를 나누는 것 같은 자연스러운 문장을 내놓긴 하지만, 실제론 무수한 DB를 바탕으로 학습한 패턴에 따라 가장 자연스러운 단어를 가장 자연스러운 문장구조에 따라 출력하는 것뿐이다. 이러한 패턴 분석(딥 러닝)에는 오랜 시간이 걸리며, 사용 중 입력된 정보를 즉시 기억, 기록(또는 학습) 하기 위해서는 GPT-3와 API를 공유하는 서드파티 기능이 필요하다. 아주 간단한 예로 GPT-3 기반 AI와 틱택토 게임을 해 보면, 게임의 룰은 알고 있지만 AI는 자신이나 상대가 방금 전에 둔 수를 기억해내지 못하는 문제가 있어서 임의로 수를 만들어내는 경우가 있다.
GPT-3 특유의 자연스러운 문장 구현에 의해 마치 해당 모델이 인격을 구현하는 데에 성공한 듯 느껴지기 쉽지만, 실제론 가장 높은 점수를 받을 수 있는(가장 자연스러운) 문장을 반복해서 출력하는 딥러닝 예측 모델에 불과하다. 당연히 기억, 추론, 이해와 같은 인간 지능을 구성하는 대부분의 요소가 결락되어 있으므로, 자아를 지닌 인격 모델이 아닌 단순 문장 출력기로 이해하는 것이 바람직하다.

 

그럼에도 더 성장하고 발전할 것이다.

챗GPT와 같은 서비스가 어떤 형태의 비즈니스로 발전할 것인지 미래를 예측하는 게 중요하다.

어떤 이는 투자 기회를 엿볼 것이고 어떤 이들은 비관할 것이다. 또 어떤 이들은 직업을 잃기도 할 것이고...

나 역시 개발자로서 하루하루를 살고 있지만 아직은 AI가 코딩을 할 수 있는 수준은 아니다.

하지만 하루아침에 모든 게 바뀌는 특이점이 올 것이라는 것을 짐작하고 있다.

터미네이터 영화 속 세계관이 현실로 펼쳐질지 인산을 더욱 윤택하게 하는 미래가 될지 궁금해진다.

생성형 AI

 

반응형

댓글