코딩하는 공무원

[주간조선] 편리한 챗 GPT, 치명적 결함은 이것 (2023.3.13.) 본문

스크랩

[주간조선] 편리한 챗 GPT, 치명적 결함은 이것 (2023.3.13.)

코딩펀 2023. 3. 14. 16:27

편리한 챗 GPT, 치명적 결함은 이것 < IT/과학 < 기사본문 - 주간조선 (chosun.com)

 

편리한 챗 GPT, 치명적 결함은 이것 - 주간조선

본격적인 인공지능(AI)으로 소개되는 챗(Chat)GPT의 정체와 한계, 그리고 효용성과 부작용에 대한 갑론을박이 뜨겁다. 일단 본격적인 인공지능의 시대가 열리게 되었다는 긍정적인 평가가 있다. 챗

weekly.chosun.com

챗GPT의 등장이 인류사의 ‘중대한 사건’이라고 반긴 빌 게이츠 마이크로소프트 창업자의 평가가 대표적이다. 그런데 세계적 언어학자인 노엄 촘스키의 입장은 정반대다. 챗GPT가 ‘첨단기술 표절기(high-tech plagiarism system)’에 불과하다는 것이다. 챗GPT와 같은 ‘짝퉁’ 인공지능이 얄팍한 표절로 인류 문명을 심각하게 오염시키지 않도록 경계해야 한다는 뜻이다.
챗GPT의 문장은 깔끔하고, 정갈하고, 단순하고, 명쾌하고, 자신만만하다. 무려 1750억개의 파라미터를 동원하는 챗GPT가 무한정의 ‘인터넷 데이터’를 철저하고 정교하게 분석해서 얻은 결론이라는 개발자의 자신감이 고스란히 배어 있다. 실제로 한 치의 망설임이나 쓸데없는 군더더기는 찾아보기 어렵다.

그런데 챗GPT에는 절대 무시할 수 없는 치명적 결함이 있다. 내용을 도무지 믿을 수 없다는 것이다. 대동여지도가 만들어진 1300년대 조선에서 연금술사의 난이 일어났었고, 신사임당의 남편이 이순신이라는 정도의 오류는 애교라고 볼 수도 있다. 챗GPT가 우리에 대한 학습을 충분히 하지 못했을 것이기 때문이다.

하지만 국제표준단위(SI) 체계의 ‘kg(킬로그램)’을 ‘Kg’으로 써도 되고, ‘km’(킬로미터)를 ‘KM’으로 써도 된다는 챗GPT의 대답은 사정이 다르다. SI 체계에서 ‘K’는 절대온도를 나타내는 ‘캘빈’이고, ‘M’은 ‘100만’을 뜻하는 접두사 ‘메가’다. ‘1000’을 뜻하는 접두사 ‘킬로’와 거리를 나타내는 ‘미터’는 반드시 소문자로 적어야만 한다. SI 체계의 가장 기본적인 원칙조차 알아내지 못한 것은 챗GPT의 치명적 결함이다.

물론 챗GPT가 딥러닝 신경망 학습을 반복하면 그런 정도의 오류는 바로잡을 수 있을 것이다. 그런데 섣부른 낙관은 금물이다. 챗GPT의 학습 무대인 인터넷은 허접한 ‘쓰레기 정보’가 넘쳐나는 난장판이기 때문이다. ‘쓰레기를 넣으면 쓰레기가 나온다(Garbage in, garbage out)’는 통계의 기본 철칙을 무시할 수 없다. 쓰레기통에서 화려하고 향기로운 장미꽃이 피어나기를 기다려야 하는 챗GPT 사용자의 입장이 안타깝다.
챗GPT는 대규모 언어 모델(LLM)을 사용한다. 문장에 포함된 단어에 대한 개별적 지식에 통계적 방법론을 적용해서 답을 찾아낸다. 딥러닝 기법으로 LLM을 학습한 AI가 단어를 꿰어맞춰서 학습한 패턴에 따라 확률론적으로 그럴듯한 문장을 만들어낸다는 뜻이다. 챗GPT는 상식적인 물리법칙이나 논리에 대한 고민을 철저하게 외면해버린다. 챗GPT의 문장이 반드시 AI의 ‘이해’를 뜻하는 것이라고 할 수는 없는 것도 그런 이유 때문이다. 자칫하면 1996년 뉴욕대학의 수리물리학자 앨런 소칼이 촉발한 소모적이고 무의미한 ‘과학전쟁’이 일상화될 수도 있다.

어떤 개념을 언어적으로 ‘설명’하는 능력과 그 개념을 정확하게 이해하고 실제로 ‘사용’하는 능력은 분명하게 구별된다. 메타(페이스북)의 최고 AI 과학자인 얀 르쿤과 AI 철학자 제이콥 브라우닝의 지적이다. LLM의 ‘얄팍한 이해력’을 인간이 세상을 살아가면서 다른 사람과 상호교류하면서 문화적으로 습득하는 ‘깊은 이해력’과 혼동해서는 안 된다는 뜻이다. 챗GPT는 ‘상식’과 ‘논리’를 철저하게 무시한 ‘확률론적 언어 조합 프로그램’에 지나지 않는다는 뜻이기도 하다.
챗GPT와 같은 생성형 AI를 무작정 거부할 수는 없을 것이다. 오히려 챗GPT를 양성화해서 ‘공존(共存)’을 꿈꿔야 한다는 주장이 설득력을 얻고 있다. 그러나 공존을 이야기하기 전에 챗GPT를 비롯한 생성형 AI의 정체와 가치에 대한 냉정한 분석·평가가 필요하다. 정부의 간섭을 원천적으로 배제한 새로운 통화로 떠들썩하게 등장했던 ‘코인(가상화폐)’의 아픈 경험을 되풀이해서는 안 된다. 

챗GPT에 의한 전력 낭비에 대한 고민도 필요하다. 지난 1월에만 챗GPT가 덴마크 국민 17만5000명이 사용한 전력을 소비했다는 분석이 있다. 챗GPT의 사용이 본격화되면 부담이 만만치 않게 될 것이 분명하다. 자칫 챗GPT의 사용이 막대한 전력의 낭비를 초래했던 가상화폐 채굴과 같은 일이 될 수도 있다는 뜻이다
Comments