-
Gemma: 구글의 새로운 경로를 여는 오픈 소스 LLM기술정리 2024. 3. 20. 10:51
시작하며
인공지능의 세계에서 대형 언어 모델(Large Language Models, LLM)의 발전은 지속적으로 사람들의 관심을 끌고 있습니다. ChatGPT의 성공 이후, 초기 오픈 소스 모델인 LLama가 주목받기 시작하면서 오픈 소스 LLM 모델에 대한 관심이 급증했습니다. 이러한 추세 속에서 구글이 최근 공개한 Gemma 모델은 오픈 소스 LLM의 새로운 장을 열었다고 할 수 있습니다.
Gemma 모델의 등장 배경
LLama 모델의 출시를 기점으로, 다양한 오픈 소스 LLM 모델들이 잇따라 등장하며 인공지능 연구와 활용의 영역에서 상당한 발전을 이루었습니다. 이러한 모델들은 기술의 민주화를 촉진하고, 연구자들에게 폭넓은 실험 기회를 제공함으로써, 인공지능 분야의 혁신을 가속화했습니다. META의 발표 이후, 구글이 심혈을 기울여 준비한 Gemma 모델이 공개되었습니다. 이 모델은 기존 LLM 모델들과 비교했을 때 여러 측면에서 뛰어난 성능을 나타내며, 인공지능 기술의 새로운 지평을 열고 있습니다.
오픈 소스 LLM의 중요성
Gemma의 출시는 오픈 소스 LLM의 중요성을 다시 한 번 강조합니다. 오픈 소스 모델의 공개는 AI 연구의 진전을 가속화하고, AI 기술의 더 넓은 접근성을 보장합니다. 또한, 다양한 분야에서의 혁신적인 활용을 가능하게 하여 AI 기술의 사회적, 경제적 영향을 확대합니다.
Gemma의 주요 특징은 다음과 같습니다.(출처: Gemma공식문서)
- 이번에 공개되는 모델은 젬마 2B와 젬마 7B 두 가지로 제공됩니다. 두 유형 모두 각각 사전 훈련(pre-trained) 및 지시 조정(instruction-tuned)된 변형(variants)과 함께 제공됩니다.
- 새로운 책임감 있는 생성형 AI 툴킷(Responsible Generative AI Toolkit)은 젬마를 활용하여 더욱 안전한 AI 애플리케이션을 제작할 수 있도록 가이드와 필수 도구를 제공합니다.
- 네이티브 케라스(Keras) 3.0을 통해 JAX, PyTorch, TensorFlow와 같은 주요 프레임워크에서 추론 및 지도 학습(supervised fine-tuning,SFT)을 위한 툴체인을 제공합니다.
- 바로 이용할 수 있는 코랩(Colab)과 캐글 노트북(Kaggle notebooks)과 함께 허깅 페이스(Hugging Face), 맥스텍스트(MaxText), 엔비디아 네모(NVIDIA NeMo)와 같은 범용적인 툴들과 함께 통합 제공되어 이용자들이 젬마를 쉽게 이용할 수 있습니다.
- 사전 훈련 및 지시 조정된 젬마 모델은 노트북, 업무용 컴퓨터 또는 구글 클라우드에서도 이용 가능하며 버텍스 AI(Vertex AI), 구글 쿠버네티스 엔진(Google Kubernetes Engine, GKE)을 이용해 쉽게 설치할 수 있습니다.