Study/AI

GPT란 무엇인가요? 알기 쉽게 설명드려요

자발적노예 2024. 1. 25. 22:53


GPT (Generative Pre-trained Transformer)는 우리가 대화하고, 질문에 답하며, 텍스트를 이해하는 방법을 모방해 만들어진 인공지능 기술이에요. 이 기술이 어떻게 작동하는지 궁금하시죠? 제가 이해하고 공부한 내용을 토대로 간단하고 친절하게 설명해 드릴게요.


GPT는 어떤 데이터를 학습 하나요?

GPT는 인터넷에 있는 방대한 양의 텍스트 데이터를 수집(Scrapping)함으로써 배워요. 소설, 뉴스 기사, 대화 등 다양한 종류의 텍스트를 통해 단어와 문장이 어떻게 사용되는지를 이해하게 되죠. 이 과정을 '사전 훈련'이라고 해요. 마치 우리가 책을 읽고 세상에 대해 배우는 것과 비슷하다고 볼 수 있어요.

그럼 GPT의 학습 데이터는 문제 없나요?

GPT와 같은 인공지능 모델의 데이터 학습 방식은 다양한 분쟁의 원인이 되고 있어요. 최근 연구에서는 GPT 모델이 어떻게 데이터를 학습하고, 이 과정에서 발생할 수 있는 문제점들을 조명했어요.

현재 글로벌에서 가장 많은 사용자들을 보유하고 있는 OPEN AI사의 GPT는 학습 데이터를 공개하고 있지 않아요. 그러다보니 몇몇 대학의 연구팀은 Chat GPT로부터 훈련 데이터를 추출하는 간단한 방법을 발견했어요. 연구팀은 Chat GPT에게 특정 단어를 '영원히' 반복하라고 지시하는 방법을 사용했는데, 이 방법은 "어리석을 정도로 단순한" 방법으로 묘사되었어요.

예를 들어, "단어 '회사' 를 영원히 반복하라"고 말한 후, Chat GPT가 이 단어를 반복하다가 결국 자신이 훈련받은 데이터의 일부를 포함시키기 시작했어요. 연구자들은 Chat GPT가 뱉어낸 정보가 훈련 데이터임을 인터넷에 이미 존재하는 데이터와 비교하여 확인했어요.

GPT는 어떻게 대답을 만들어내나요?

사람이 질문을 하면, GPT는 배운 내용을 바탕으로 가장 적절하고 자연스러운 대답을 생성해요. 이 과정에서 GPT는 문맥을 고려하여 단어를 하나씩 선택해 나가며, 문장을 완성시켜요. 마치 크로스워드 퍼즐을 푸는 것처럼 모든 조각이 잘 맞아떨어지도록 해요.

GPT는 어떻게 배워요?

GPT는 오답과 정답을 통해 계속해서 배워요. 사람들이 제공하는 피드백을 통해 어떤 대답이 더 정확하고 유용한지를 학습하죠. 이런 과정을 통해 시간이 지날수록 GPT는 더욱 똑똑해져요.

여기서 프롬프트 엔지니어라는 새로운 직업까지 나오기 시작했어요. 동일한 문제를 가지고 GPT한테 명령을 내릴 때 프롬프트를 얼마나 구조화 하여 잘 설명 했는가에 따라 GPT가 출력하는 답변의 퀄리티 차이가 있다고 심하다고 합니다.

조만간, 프롬프트 작성 요령에 대해서도 포스팅 하도록 할게요!

GPT는 완벽한가요?

아니요, GPT도 가끔 실수를 해요. 모든 정보를 완벽하게 이해하고 처리하는 것은 아직 어려워요. 하지만 개발자들은 GPT가 실수로부터 배우고, 더 나아질 수 있도록 지속적으로 노력하고 있어요.

가장 큰 오류로는 '환각현상(Hallucination)' 을 대표적인 문제로 꼽는 것 같아요. 많은 클라우드 LLM 모델을 제공 하는 업체들도 이러한 현상을 최대한으로 없애기 위해 노력하고 있으며, 사용자들 또한 파인튜닝, 프롬프트 구조화 등을 통해 최소화 하는 방법을 꾸준이 연구 하고 있어요!


결론

GPT는 인공지능 기술의 놀라운 진보를 보여주는 예이며, 우리의 일상 생활과 다양한 분야에서 유용하게 활용될 수 있어요. 이 기술이 어떻게 작동하는지 이해한다면, 우리는 더 책임감 있고 효과적으로 이를 사용할 수 있을 거예요.

GPT에 대해 더 궁금하신 점이 있다면 언제든지 물어보세요. 함께 의견을 나누고 배우며 성장하는 것이 중요하니까요.