LLM 은 언어 모델을 사용하여 인공지능으로 문제를 해결하는 방법을 말한다.
대표적인 LLM 모델을 활용하는 예로 번역, 요약, 감정 분석, 대화 등이 있다.
이때 크게 2가지로 나뉘게 되는데 하나는 지시형(명령형) Instruct LLM 이고 다른 하나는 대화형 Chat LLM 이다.
LLM 이라는 용어보다 뜨거운 감자로 우리에게 알려졌던 LLM chat 의 대표주자 Chatgpt 가 더 익숙할 것 같다.
LLM chat 은 다른 말로 chatgpt 는 사용자가 대화 하듯이 사용하는 것이며 학습된 데이터를 토대로 서로가 대화를 이어간다.
사용자의 대화에 다음에 해야할 말을 생성하여 사용자에게 응답을 해준다.
이는 chat LLM 의 대표적인 예시다.
에어팟을 끼고 음악을 들을 때 볼륨을 조절할 수 있는 방법이 아이폰의 볼륨 버튼을 누르는게 가장 직관적이다.
그런데 자전거를 타고 이동중일 때에는 그것이 쉽지 않다.
"시리야, 볼륨을 올려줘" 을 통해 시리가 사용자의 언어를 이해하고 이를 처리하게 된다.
이는 Instruct LLM의 대표적인 예시다.
chat LLM 의 경우는 사용자가 원하는 정보를 학습된 데이터를 기반으로 잘 예측해서 대화를 이끌어 가는 것이 중요할 것이다. 또한 환상(hallucination) 과 거짓 정보, 편향이나 공격성 등에 대해서 사용자던 chat LLM 모델 개발자던 고민해야하는 부분이다.
Instruct LLM 의 경우 지시에 맞는 행동을 하기 위해 수행해야하는 업무의 로직에 대해서 고민해야하는 부분이다.
chat LLM의 경우에는 동일 질문에 대해서 항상 같은 답변을 하지는 않는다.(Repetition penalty 파라미터의 값에 따라 다르겟지만.)
또한 어떻게 질문하는지에 따라서 양질의 답변이 나올 수 있다.
이렇게 양질의 답변을 얻기 위해 질문하는 기술을 chat LLM 에서는 prompt engineering(프롬프트 엔지니어링) 이라고 하고 논문등을 통해서 연구되고 있다.
프롬프트 엔지니어링 가이드 참고할 만한 사이트(https://www.promptingguide.ai/)
'IT > HyperClovaX' 카테고리의 다른 글
[Clova Studio] 플레이그라운드 - 1[챗모드,페르소나] (0) | 2024.06.27 |
---|---|
[Clova Studio] 스킬트레이너에 대한 간략 요약 (0) | 2024.06.24 |
LLM의 훈련 데이터의 한계 (0) | 2024.06.22 |
LLM(Large Language Model) (0) | 2024.06.08 |
[N STUDY] AI 막차 탑승 : HyperCLOVA X 프로젝트 챌린지 (0) | 2024.06.06 |