728x90

전체 글 146

[Clova Studio] 스킬트레이너 -2 [스킬 만들기]

2024.07.04 - [IT/HyperClovaX] - [Clova Studio] 스킬트레이너 - 1 [ 스킬셋 만들기 ] [Clova Studio] 스킬트레이너 - 1 [ 스킬셋 만들기 ]클로바 스튜디오의 언어모델의 한계를 극복하기 위한 방법 중 하나로 스킬트레이너를 사용한다고 이전에 글을 작성한 적이 있다. 2024.06.24 - [IT/HyperClovaX] - [Clova Studio] 스킬트레이너에 대한 간략songsiaix.tistory.com스킬셋을 만들었다면 이제 스킬을 만들 차례다. 하나의 스킬은 하나의 API 와 매칭이 된다. 물론 외부의 openAPI 도 사용할 수 있겠지만 회사 내부에서 사용하는 API 도 사용할 수 있다. 다만 Clova Studio 에서 API로 통신이 되야하기..

IT/HyperClovaX 2024.07.14

[팁] curl 을 호출할 때 가상호스트 도메인을 호출하기!

curl 을 통해서 도메인을 호출하면 DNS 와 연결된 IP 주소로 가게된다. 그런데 가능성이 높은 것은 아니지만 DNS 서비스 자체가 장애가 났는지 웹 서버의 서비스가 장애가 난 것인지 혼란 스러울 때가 있을 수 있다. 그때 보통 서버의 localhost 로 테스트를 하는데 curl localhost 를 통해서 웹 서버의 웹 서비스가 정상인지를 파악해볼 수 있다. 그런데 이게 단일 웹 서비스를 제공한다면 문제가 되지 않는데 vhost 로 하나의 웹서비스에서 여러 가상 호스트를 제공하고 있는 환경이라면 curl localhost 가 내가 원하는 가상 호스트 인지 아닌지를 알 수 없다. 이 경우에는 curl 의 기능을 이용하여 내가 원하는 가상 호스트를 호출할 수 있다. curl --resolve 'vho..

IT/LINUX 2024.07.11

님아 그 루트를(/) 건들지 마소

함께 일하는 동료가 대량의 파일을 옮기기 위해 mv 를 사용했다. 그리고 그 mv 명령어 이후 명령어가 안쳐진다며 얼굴이 상기되었다. [root@rew ~]# ls -al /-bash: /usr/bin/ls: /lib64/ld-linux-x86-64.so.2: bad ELF interpreter: No such file or directory "ls 명령어를 실행하는데 필요한 라이브러리 파일이 없는 것 같아" 라는 메시지다. 명령어 친 내용을 찬찬히 보던 중 mv 명령어에 아주 사소하지만 아주 강력한 실수를 포착하게 되었다. 상대 경로로써 ./ 가 아닌 절대 경로인 / 를 파일 이동의 대상으로 삼은 것이다.  의도는 다음과 같았으리라 mv ./* /target 그리고 실제로는 mv /* /target 이..

IT/LINUX 2024.07.05

[Clova Studio] 스킬트레이너 - 1 [ 스킬셋 만들기 ]

클로바 스튜디오의 언어모델의 한계를 극복하기 위한 방법 중 하나로 스킬트레이너를 사용한다고 이전에 글을 작성한 적이 있다. 2024.06.24 - [IT/HyperClovaX] - [Clova Studio] 스킬트레이너에 대한 간략 요약 [Clova Studio] 스킬트레이너에 대한 간략 요약LLM은 학습한 데이터에 한계가 존재한다는 포스트를 지난 시간에 남겼다.2024.06.22 - [IT/NCP[Naver Cloud Platform]] - LLM의 훈련 데이터의 한계 LLM의 훈련 데이터의 한계고맙게도 큰 기업에서 공개한 LLMsongsiaix.tistory.com API 를 사용하여 최신의 정보 또는 출처가 확실하여 믿을 수 있는 데이터를 토대로 언어모델을 사용할 수 있다. 스킬트레이너에서 가장 중..

IT/HyperClovaX 2024.07.04

[Clova Studio] 플레이그라운드 - 2 [파라미터]

플레이그라운드에는 총 11 개의 파라미터가 존재 한다. 플레이그라운드에는 2개의 모드가 존재하는데, 하나는 챗 모드, 다른 하나는 일반 모드이며 이 두개를 함께 포함하는 파라미터과 별도로 지원하는 파라미터를 모두 합치면 11개가 된다. 이 파라미터라 함은 LLM 을 통해서 텍스트 생성시에 사용하는 설정 값이다. 이 설정값에 따라 텍스트 생성에 영향을 준다. 아래의 네이버클라우드의 소개를 통해서 각 파라미터의 설정 내용을 확인해 볼 수 있다.(https://guide.ncloud-docs.com/docs/clovastudio-info#파라미터) 그 중 몇 가지만 좀더 이야기를 하고 싶다. LLM은 결국에는 단어를 "예측"하는 것이다. 이러한 예측하는 확률을 어떻게 사용할 것인가를 설정하는 것이 일부 파라미..

IT/HyperClovaX 2024.06.28

[Clova Studio] 플레이그라운드 - 1[챗모드,페르소나]

플레이그라운드는 말그대로 마음껏 뛰어놀 수있는 공간을 의미한다. 클로바 스튜디오에서 언어 모델을 마음껏뛰어 놀 수 있는 공간으로 플레이그라운드를 활용할 수 있다. 크게 2가지 모드로 동작한다. 질의 응답과 같이 서로가 대화를 나누는 듯한 "챗 모드" 작성한 글에 맞춰 다음 단어를 생성해주는 "일반 모드" chatgpt와 같은 사용자 경험을 해보았다면 플레이그라운드의 "챗 모드"를 사용한 것 과 같다. 더 정확하게 말한다면 OPENAI 사에서 제공하는 playground와 동일하다.(https://platform.openai.com/playground)  "챗 모드"에 존재하는 재미난 점은 "시스템"과 "사용자" 라는 부분을 통해서 언어 모델을 통해 얻게 될 결과가 달라지게 된다. 또한 작성한 시스템, 사..

IT/HyperClovaX 2024.06.27

[Clova Studio] 스킬트레이너에 대한 간략 요약

LLM은 학습한 데이터에 한계가 존재한다는 포스트를 지난 시간에 남겼다.2024.06.22 - [IT/NCP[Naver Cloud Platform]] - LLM의 훈련 데이터의 한계 LLM의 훈련 데이터의 한계고맙게도 큰 기업에서 공개한 LLM 모델을 사용하면 우리들은 손쉽게 채팅 기능이 있는 LLM을 사용할 수 있게 된다. 대표적으로 Lama와 같은 모델이다. 그 외에도 모델 자체가 공개되지 않은 경우songsiaix.tistory.com LLM chat 서비스에서 최신의 데이터를 옳바르게 제공 받고 싶을 수도 있고, 회사 고유의 특화된 정보를 LLM chat 을 통해서 제공 받고자 하는 필요사항이 발생할 수 있다. 이러한 경우 모델에 파인 튜닝을 하여 보다 최신의 데이터 또는 고유의 특화된 정보를 제..

IT/HyperClovaX 2024.06.24

LLM의 훈련 데이터의 한계

고맙게도 큰 기업에서 공개한 LLM 모델을 사용하면 우리들은 손쉽게 채팅 기능이 있는 LLM을 사용할 수 있게 된다. 대표적으로 Lama와 같은 모델이다. 그 외에도 모델 자체가 공개되지 않은 경우도 많고 그에 대응하는 채팅 서비스들이 많이 존재한다. chatgpt, gemini, copilot, claude 등등 다양하다. 공개가 되었던 공개가 되지 않았던 LLM 모델은 훈련이라는 과정을 통해서 LLM 모델이 진화할 수 있게 된다. 그중에서도 훈련된 데이터의 시점에 대한 한계를 이야기 하고 싶다. Lama1 -> Lama2 -> Lama3 로 가는 행보와 chatgpt 3.5 turbo -> chatgpt 4.0  turbo 으로 가는 행보에는 언제까지의 데이터로 훈련하였어? 라는 것에 대한 한계라는 ..

IT/HyperClovaX 2024.06.22

Instruct LLM 과 Chat LLM

LLM 은 언어 모델을 사용하여 인공지능으로 문제를 해결하는 방법을 말한다. 대표적인 LLM 모델을 활용하는 예로 번역, 요약, 감정 분석, 대화 등이 있다. 이때 크게 2가지로 나뉘게 되는데 하나는 지시형(명령형) Instruct LLM 이고 다른 하나는 대화형 Chat LLM 이다. LLM 이라는 용어보다 뜨거운 감자로 우리에게 알려졌던 LLM chat 의 대표주자 Chatgpt 가 더 익숙할 것 같다. LLM chat 은 다른 말로 chatgpt 는 사용자가 대화 하듯이 사용하는 것이며 학습된 데이터를 토대로 서로가 대화를 이어간다.  사용자의 대화에 다음에 해야할 말을 생성하여 사용자에게 응답을 해준다. 이는 chat LLM 의 대표적인 예시다. 에어팟을 끼고 음악을 들을 때 볼륨을 조절할 수 있..

IT/HyperClovaX 2024.06.09

LLM(Large Language Model)

LLM의 첫 단계는 LM(언어모델)이다. 언어모델의 크기가 크면 Large 를 붙여셔 LLM 이고, 언어모델이 크기가 작으면 SLM 이다. 인공신경망을 공부하면 문자와 관련해서 문제를 해결하려고 할 때 (물론 CNN 도 사용가능하지만..) RNN 을 사용하게 된다. RNN 의 R 이 Recursive 순환(재귀) 한다는 의미이고 앞에서 처리한 데이터를 다시 순환해서 사용(기억)할 수 있는 장점을 갖고 있다. 우리가 사용하는 언어는 여러 단어의 조합으로 이루어 진다. "배고프다" 라는 단어에 "나는 배고프다", "너는 배고프다", "우리는 배고프다", "배고프다고 말했다" 등등 바로 앞 또는 뒤의 단어에 따라 내용이 달라진다. 앞에 나는 이라는 단어를 기억하고 있어야 또는 배고프다고 를 기억하고 있어야만 ..

IT/HyperClovaX 2024.06.08
728x90