2025-08-02 - GitHub Trend Repo
ART ART는 강화학습 기반의 에이전트 훈련 프레임워크로, 실세계 작업에 대응하는 다단계 에이전트를 훈련시키는 목적으로 개발되었습니다. LLM을 활용하여 경험 기반 학습과 강화학습(특히 GRPO 알고리즘)을 지원하며, reward 설계의 자동화 기술인 RULER를 포함하고 있습니다. 클라이언트는 Python 기반으로 메시지 교환, 서버는 GPU 기반 모델 추론과 정책 업데이트를 담당합니다. 주요 사용자는 AI 연구자, 개발자, 엔지니어로, 별도 reward 엔지니어링 없이 다양한 환경에 맞는 RL 에이전트를 손쉽게 개발할 수 있습니다. 최신 업데이트에는 RULER 배포, 실험 노트북 공개, AutoRL 도입이 있으며, 오픈소스로 Apache-2.0 라이선스로 제공됩니다. GitHub 바로가기 ...