Natural Language
Processing
Connecting the world with natural language processing
글로벌 여러 기업 및 연구기관에서 출시하고 있는 초거대 언어 모델(LLM)은 다양한 NLP 태스크 분야에서 주목할 만한 성능을 보여주고 있습니다. 특히 LLM은 자연어 형태의 프롬프트를 통해 인간과 의사소통이 가능한 수준에 이르렀으며, 차세대 AI를 위한 필수 기술이 되었습니다. 42dot은 'R&D excellence'을 실현하기 위해 LLM 기술을 연구/개발하고 있으며, 이를 통해 새로운 이동의 미래를 만들고 있습니다.

42dot LLM은 사전 학습 언어모델인 '42dot LLM-PLM'과 사용자 지시에 따라 답변하도록 파인튜닝한 모델인 '42dot LLM-SFT'로 구성되어 있으며, 대량의 한국어와 영어 텍스트를 학습해 두 언어를 동시 지원합니다. 우리는 비상업적 목적에 한 해 학생/연구자/개발자가 42dot LLM을 자유롭게 사용할 수 있게 함으로써 언어 모델 기술 개발과 서비스 확산을 통한 생태계 조성에 기여하고 있습니다.
42dot LLM-PLM
42dot LLM-PLM은 한국어 (0.5T 토큰)와 영어 (1T 토큰)로 이루어진 1.5T 규모의 토큰으로 학습한 사전 학습 언어모델입니다. 정교한 모델을 만들기 위해 데이터를 직접 수집 및 정제하는데 많은 노력을 기울였습니다. 42dot LLM-PLM을 자유롭게 사용해보세요.
42dot LLM-SFT
42dot LLM-SFT는 42dot LLM-PLM을 다양한 태스크에 대해 사용자의 지시/질문 등의 프롬프트를 이해 할 수 있도록 파인튜닝한 모델입니다. 이를 위한 싱글턴/멀티턴 데이터셋을 직접 구축했고, 정교화하는데 집중했습니다. 42dot LLM-SFT의 가능성을 경험해보세요.
Download our Models on Hugging Face