728x90

2024/06 8

[Clova Studio] 플레이그라운드 - 2 [파라미터]

플레이그라운드에는 총 11 개의 파라미터가 존재 한다. 플레이그라운드에는 2개의 모드가 존재하는데, 하나는 챗 모드, 다른 하나는 일반 모드이며 이 두개를 함께 포함하는 파라미터과 별도로 지원하는 파라미터를 모두 합치면 11개가 된다. 이 파라미터라 함은 LLM 을 통해서 텍스트 생성시에 사용하는 설정 값이다. 이 설정값에 따라 텍스트 생성에 영향을 준다. 아래의 네이버클라우드의 소개를 통해서 각 파라미터의 설정 내용을 확인해 볼 수 있다.(https://guide.ncloud-docs.com/docs/clovastudio-info#파라미터) 그 중 몇 가지만 좀더 이야기를 하고 싶다. LLM은 결국에는 단어를 "예측"하는 것이다. 이러한 예측하는 확률을 어떻게 사용할 것인가를 설정하는 것이 일부 파라미..

IT/HyperClovaX 2024.06.28

[Clova Studio] 플레이그라운드 - 1[챗모드,페르소나]

플레이그라운드는 말그대로 마음껏 뛰어놀 수있는 공간을 의미한다. 클로바 스튜디오에서 언어 모델을 마음껏뛰어 놀 수 있는 공간으로 플레이그라운드를 활용할 수 있다. 크게 2가지 모드로 동작한다. 질의 응답과 같이 서로가 대화를 나누는 듯한 "챗 모드" 작성한 글에 맞춰 다음 단어를 생성해주는 "일반 모드" chatgpt와 같은 사용자 경험을 해보았다면 플레이그라운드의 "챗 모드"를 사용한 것 과 같다. 더 정확하게 말한다면 OPENAI 사에서 제공하는 playground와 동일하다.(https://platform.openai.com/playground)  "챗 모드"에 존재하는 재미난 점은 "시스템"과 "사용자" 라는 부분을 통해서 언어 모델을 통해 얻게 될 결과가 달라지게 된다. 또한 작성한 시스템, 사..

IT/HyperClovaX 2024.06.27

[Clova Studio] 스킬트레이너에 대한 간략 요약

LLM은 학습한 데이터에 한계가 존재한다는 포스트를 지난 시간에 남겼다.2024.06.22 - [IT/NCP[Naver Cloud Platform]] - LLM의 훈련 데이터의 한계 LLM의 훈련 데이터의 한계고맙게도 큰 기업에서 공개한 LLM 모델을 사용하면 우리들은 손쉽게 채팅 기능이 있는 LLM을 사용할 수 있게 된다. 대표적으로 Lama와 같은 모델이다. 그 외에도 모델 자체가 공개되지 않은 경우songsiaix.tistory.com LLM chat 서비스에서 최신의 데이터를 옳바르게 제공 받고 싶을 수도 있고, 회사 고유의 특화된 정보를 LLM chat 을 통해서 제공 받고자 하는 필요사항이 발생할 수 있다. 이러한 경우 모델에 파인 튜닝을 하여 보다 최신의 데이터 또는 고유의 특화된 정보를 제..

IT/HyperClovaX 2024.06.24

LLM의 훈련 데이터의 한계

고맙게도 큰 기업에서 공개한 LLM 모델을 사용하면 우리들은 손쉽게 채팅 기능이 있는 LLM을 사용할 수 있게 된다. 대표적으로 Lama와 같은 모델이다. 그 외에도 모델 자체가 공개되지 않은 경우도 많고 그에 대응하는 채팅 서비스들이 많이 존재한다. chatgpt, gemini, copilot, claude 등등 다양하다. 공개가 되었던 공개가 되지 않았던 LLM 모델은 훈련이라는 과정을 통해서 LLM 모델이 진화할 수 있게 된다. 그중에서도 훈련된 데이터의 시점에 대한 한계를 이야기 하고 싶다. Lama1 -> Lama2 -> Lama3 로 가는 행보와 chatgpt 3.5 turbo -> chatgpt 4.0  turbo 으로 가는 행보에는 언제까지의 데이터로 훈련하였어? 라는 것에 대한 한계라는 ..

IT/HyperClovaX 2024.06.22

Instruct LLM 과 Chat LLM

LLM 은 언어 모델을 사용하여 인공지능으로 문제를 해결하는 방법을 말한다. 대표적인 LLM 모델을 활용하는 예로 번역, 요약, 감정 분석, 대화 등이 있다. 이때 크게 2가지로 나뉘게 되는데 하나는 지시형(명령형) Instruct LLM 이고 다른 하나는 대화형 Chat LLM 이다. LLM 이라는 용어보다 뜨거운 감자로 우리에게 알려졌던 LLM chat 의 대표주자 Chatgpt 가 더 익숙할 것 같다. LLM chat 은 다른 말로 chatgpt 는 사용자가 대화 하듯이 사용하는 것이며 학습된 데이터를 토대로 서로가 대화를 이어간다.  사용자의 대화에 다음에 해야할 말을 생성하여 사용자에게 응답을 해준다. 이는 chat LLM 의 대표적인 예시다. 에어팟을 끼고 음악을 들을 때 볼륨을 조절할 수 있..

IT/HyperClovaX 2024.06.09

LLM(Large Language Model)

LLM의 첫 단계는 LM(언어모델)이다. 언어모델의 크기가 크면 Large 를 붙여셔 LLM 이고, 언어모델이 크기가 작으면 SLM 이다. 인공신경망을 공부하면 문자와 관련해서 문제를 해결하려고 할 때 (물론 CNN 도 사용가능하지만..) RNN 을 사용하게 된다. RNN 의 R 이 Recursive 순환(재귀) 한다는 의미이고 앞에서 처리한 데이터를 다시 순환해서 사용(기억)할 수 있는 장점을 갖고 있다. 우리가 사용하는 언어는 여러 단어의 조합으로 이루어 진다. "배고프다" 라는 단어에 "나는 배고프다", "너는 배고프다", "우리는 배고프다", "배고프다고 말했다" 등등 바로 앞 또는 뒤의 단어에 따라 내용이 달라진다. 앞에 나는 이라는 단어를 기억하고 있어야 또는 배고프다고 를 기억하고 있어야만 ..

IT/HyperClovaX 2024.06.08

openstack API

맡고 있는 고객사는 KT 클라우드를 사용하고 있다. DB 서버의 핫백업이 완료되면 1.9TB 가 NAS에 백업이 된다. 그런데 데이터의 안전성을 위해 반드시 2차로 백업을 해야하는 요건이 있는 고객이다. HDD인 NAS에서 1.9TB 의 약 50개의 파일(다행이도 잔파일은 아님)을 백업솔루션을 네트워크로 전송되는데 1주일 하고도 몇일이 더 지났지만 끝나지 않았다. NAS 의 용량 문제로 1차 백업(DB 핫백업을 통해 NAS 로 저장하는)을 1주일에 1회 하기로 했는데 2차 백업이 2주일 쯤이 되야 한번 백업이 된다면 1차 2차 백업에 대해서 모두 꼬이겠다는 생각이 들었다. 그러던 중 KT Cloud 에도 open api 를 제공하고 있다는 것을 알게 되어 KT cloud 에서 제공해주는 메뉴얼을 참고해보..

IT/Cloud Architect 2024.06.06

[N STUDY] AI 막차 탑승 : HyperCLOVA X 프로젝트 챌린지

우연한 기회로 naver 의 후원을 받은 HCX(= HyperCLOVA X) 를 경험해보고 팀 단위로 공부와 목표를 정해서 멋진 결과물을 만들어야하는 프로젝트에 도전하게 되었다. 이 공간은 HCX 그 잡채에 대한 이야기가 될 수 도 있고 LLM 과 관련된 공부의 이야기가 될 수도 있다. 또는 AI 와 관련된 이야기가 될 것 같다. AI 라는 분야를 공부하고 포기하고 공부하고 포기하고를 수도 없이 해왔다. 한창 공부하다보면 "미래의 먹거리를 만들어 낼꺼야" 라는 생각으로 이론 공부를 즐겁게 하다 이론 공부에 치여서 곧 잘 포기했었다. 이번에는 어쩌면 그동안 조각 조각 모아두었던 이론들을 활용해서 HCX 라는 도구가 내가 AI 의 모든 것을 완전히 이해지 못한다 해도 어떠한 결과물을 만들어 주고 그 경험이 ..

IT/HyperClovaX 2024.06.06
728x90