정보기술(IT)잡기

[Info] 프롬프트 엔지니어링/LLM(Large Language Management) 이 뭘까요 ?

AEUNJOB 2024. 8. 1. 22:33
728x90
SMALL

 

 

AI(Artifical Intelligence)이 출현하면서 엄청난 변화를 겪고 있습니다. 직업, 생활, 번역, 자료조사.작성, 기술연구 및 신변잡기 활용에 이르기까지 인공지능을 사용하여 정보를 얻는 사람들도 늘어나고 있습니다. 챗GTP가 출현하면서 본격적인 인공지능의 서막을 열었다고 할 수 있습니다. 이어서 Google Bard, MicroSoft Bing/Copilot 과 같은 대화형 인공지능 플랫폼이 경쟁적으로 등장하면서 기술진보를 일으키고 있습니다.

이러한 대화형 인공지능에 적응하면서 새롭게 떠오른 단어가 있습니다. 바로 "프롬프트 엔지니어링(Prompt Engineering)"과 "LLM(Large Language Management)" 입니다. 둘 다 쉽게 바로 머리속에 개념잡기가 쉽지 않습니다. 이 엄청난 기술들을 모두 설명 할 수는 없지만 간단히 알아보도록 하겠습니다.

 

 

 

 

■ 프롬프트 엔지니어링(Prompt Engineering)

▶프롬프트 엔지니어링이란?

프롬프트 엔지니어링은 생성형 인공지능 (생성형 AI) 솔루션을 안내하여 원하는 결과를 생성하는 프로세스입니다. 생성형 AI는 스토리, 대화, 동영상, 이미지, 음악 등의 새로운 콘텐츠를 만들어내는 인공지능 솔루션으로, 방대한 양의 데이터로 사전 훈련된 심층 신경망을 사용하는 규모가 아주 큰 기계 학습 (ML) 모델을 기반으로 합니다.

프롬프트 엔지니어링에서는 AI가 사용자와 더 의미 있게 상호 작용하도록 안내하는 가장 적절한 형식, 구문, 단어 및 기호를 선택합니다. 프롬프트 엔지니어는 창의력을 발휘하고 시행착오를 거쳐 입력 텍스트 모음을 생성하므로 애플리케이션의 생성형 AI가 예상대로 작동합니다.

▶ 프롬프트 엔지니어링이 중요한 이유는?

프롬프트 엔지니어링은 AI 애플리케이션의 효율성과 효과를 높입니다. 프롬프트 엔지니어링을 통해 개발자는 사용자와 AI의 상호 작용을 보다 효과적으로 제어할 수 있습니다. 효과적인 프롬프트는 대규모 언어 모델에 의도를 제시하고 컨텍스트를 설정합니다. 이를 통해 AI는 출력을 세분화하고 필요한 형식으로 간결하게 표시할 수 있습니다.

또한 사용자가 AI를 오용하거나, AI가 알지 못하거나 정확하게 처리할 수 없는 것을 요청하지 않게 합니다. 또한 프롬프트 엔지니어링은 사용자 경험을 개선합니다. 사용자는 시행착오를 피하면서도 AI 도구로부터 일관되고 정확하며 적절한 응답을 얻을 수 있습니다.

프롬프트 엔지니어링을 통해 사용자는

첫 번째 프롬프트에서 연관성 높은 결과를 쉽게 얻을 수 있습니다.

두번째로 프롬프트 엔지니어링은 유연성을 향상시킵니다.

프롬프트 엔지니어는 논리적 연결과 광범위한 패턴을 강조하는 도메인 중립적 지침을 포함하는 프롬프트를 만들 수 있습니다. 조직은 기업 전반에서 프롬프트를 간단하게 재사용하여 AI 투자를 확대할 수 있습니다.

▶ 프롬프트 엔지니어링 사용 사례는?

프롬프트 엔지니어링은 다양한 분야에서 AI 애플리케이션을 개선하는 데 사용될 수 있습니다. 예를 들면 다음과 같습니다.

 

 

 

 

 

 

LLM(Large Language Management, 거대언어모델)

▶ LLM(Large Language Management)이란?

LLM(Large Language Management)은 인공지능(AI) 시스템의 한 종류로, 방대한 양의 텍스트 데이터를 처리하고 이해하며 생성할 수 있는 능력을 갖춘 시스템입니다. LLM은 자연어 처리(NLP) 작업의 다양한 범위를 수행할 수 있으며, 챗봇, 텍스트 생성기, 문서 요약 및 번역 등의 다양한 애플리케이션에 사용될 수 있습니다.

LLM은 딥 러닝 기술을 기반으로 하며, 워드 임베딩, 주의 메커니즘, 변환기, 미세 조정, 프롬프트 엔지니어링 등의 고급 기술을 활용합니다. LLM은 책, 웹사이트, 기사 등의 다양한 소스에서 수십억 개의 단어를 포함하는 대규모 데이터 세트에서 훈련됩니다. 이 광범위한 교육을 통해 LLM은 언어, 문법, 문맥 및 일반 지식의 일부 측면의 뉘앙스를 파악할 수 있습니다.

 

 

▶ LLM(Large Language Management)의 장점과 한계는?

LLM은 인간과 유사한 텍스트를 처리하고 생성할 수 있는 놀라운 능력을 보여줍니다. LLM은 다음과 같은 장점을 가집니다.

 

 

LLM은 놀라운 능력을 가지고 있지만, 완벽하지는 않습니다. LLM은 다음과 같은 한계를 가집니다.

 

  • 해석 가능성: LLM의 복잡성을 고려할 때, 특정 결정을 내리거나 특정 결과를 생성하는 이유를 이해하는 것은 어려울 수 있습니다. 해석 가능성으로 알려진 이 특성은 진행 중인 연구의 핵심 영역입니다. 해석 가능성을 높이면 문제 해결 및 모델 개선에 도움이 될 뿐만 아니라 AI 시스템의 신뢰와 투명성도 강화됩니다.

 

  • 자원 소모: LLM은 방대한 양의 텍스트 데이터를 처리하고 생성하기 위해 많은 컴퓨팅 자원을 필요로 합니다. LLM을 훈련하고 실행하는 데는 많은 시간과 비용이 들며, 환경에도 부정적인 영향을 미칠 수 있습니다. LLM의 효율성과 지속 가능성을 향상시키는 것은 또 다른 연구의 주제입니다.

▶ LLM(Large Language Management)의 대표적인 예는?

LLM은 다양한 분야에서 널리 사용되고 있으며, 다음은 LLM의 몇 가지 대표적인 예입니다.

  • ChatGPT: OpenAI에서 개발한 GPT는 LLM의 가장 유명한 예입니다. GPT는 변환기를 기반으로 하며, 수십억 개의 단어로 구성된 웹 코퍼스에서 훈련됩니다. GPT는 GPT-1, GPT-2, GPT-3, GPT-4의 세대로 나뉘며, GPT-4는 현재 가장 크고 강력한 LLM입니다. GPT는 다양한 NLP 작업을 수행할 수 있으며, Microsoft, Duolingo, Stripe, Zapier, Dropbox, ChatGPT 등의 다양한 애플리케이션에 사용됩니다.
  • PaLM: Google에서 개발한 PaLM은 GPT와 경쟁하는 LLM입니다. PaLM은 GPT와 비슷한 아키텍처를 사용하지만, 훈련 데이터와 학습 방법에 차이가 있습니다. PaLM은 책, 웹사이트, 기사뿐만 아니라 Google의 자체 데이터 세트에서도 훈련됩니다. PaLM은 텍스트 생성뿐만 아니라 텍스트 이해에도 뛰어난 성능을 보입니다. PaLM은 Google Bard, Docs, Gmail 등의 Google 앱에 사용됩니다.
  • Coral: Cohere에서 개발한 Coral은 새로운 LLM입니다. Coral은 GPT와 PaLM과 비슷한 아키텍처를 사용하지만, 훈련 데이터와 학습 방법에 차이가 있습니다. Coral은 웹 코퍼스뿐만 아니라 Cohere의 파트너들로부터 수집한 고품질의 데이터에서도 훈련됩니다. Coral은 텍스트 생성과 텍스트 이해에 모두 능숙하며, HyperWrite, Jasper, Notion, LongShot 등의 애플리케이션에 사용됩니다.

어려운 용어일 수 있지만 조금씩 배워가다 보면 미래시대를 준비하는 새로운 도전이 될 수 있습니다. 조금이라도 도움이 되시길 바랍니다.


728x90
SMALL