본문 바로가기

개발 이야기/AI 인공지능 이야기

LlaMa 모델을 교육하는 실습가이드

728x90

 

Stackllama 라는 모델을 만들어 보는 (llama를 RLHF로 교육하는) 실습가이드 입니다

 

 

입문시에  공부하기 좋은 자료같아서  퍼왔습니다

 

https://huggingface.co/blog/stackllama

 

StackLLaMA: A hands-on guide to train LLaMA with RLHF

StackLLaMA: A hands-on guide to train LLaMA with RLHF Models such as ChatGPT, GPT-4, and Claude are powerful language models that have been fine-tuned using a method called Reinforcement Learning from Human Feedback (RLHF) to be better aligned with how we

huggingface.co

 

 

 

그럼,

    공유합니다.