오늘 GitHub Trending은 AI 에이전트와 LLM 운영 레이어가 강하게 존재감을 드러냈습니다. 단순히 모델을 호출하는 수준을 넘어, 워크플로를 구조화하고 멀티 에이전트를 오케스트레이션하며 실제 업무 시스템에 연결하려는 프로젝트들이 많았습니다. 그중에서도 Onyx와 Microsoft Agent Framework는 “AI를 제품/조직에 어떻게 붙일 것인가”라는 질문에 꽤 실용적인 답을 보여주는 프로젝트입니다.
mlx-vlm
Mac 환경에서 비전-언어 모델과 멀티모달 모델을 추론·서빙·파인튜닝할 수 있게 해주는 MLX 기반 패키지
- GitHub: mlx-vlm
- 언어/스택: Python, MLX, FastAPI, Gradio
- 카테고리: AI
무엇을 하는 프로젝트인가? mlx-vlm은 Apple Silicon 중심의 MLX 생태계 위에서 VLM(Vision Language Model)과 오디오/비디오를 포함한 멀티모달 모델을 다루기 쉽게 만든 도구입니다. 단순 추론뿐 아니라 CLI, Python API, 채팅 UI, 서버 모드까지 제공해 실험부터 서비스화까지 한 흐름으로 연결됩니다. 특히 Mac에서 로컬 멀티모달 모델을 다루려는 개발자에게 꽤 매력적입니다. OpenAI 호환 엔드포인트까지 제공해 기존 애플리케이션과의 연결 비용도 낮춘 점이 눈에 띕니다.
주요 특징
- 특징 1: 멀티모달 추론 지원 — 이미지뿐 아니라 오디오 입력, 일부 모델의 멀티이미지/비디오 이해까지 지원해 활용 범위가 넓습니다.
- 특징 2: 서빙 친화적 구조 — FastAPI 기반 서버와 OpenAI 호환 API를 제공해 기존 LLM 앱에서 백엔드만 교체해 붙이기 좋습니다.
- 특징 3: 성능 최적화 기능 — Vision Feature Cache, TurboQuant KV Cache, 활성화 양자화 지원 등으로 지연 시간과 메모리 사용량을 줄이려는 시도가 들어가 있습니다.
개발자에게 의미하는 것 Mac에서 멀티모달 모델을 로컬로 돌리고 싶다면 꽤 현실적인 선택지입니다. 연구용 프로토타입부터 사내용 툴의 로컬 추론 백엔드까지 폭넓게 검토해볼 만합니다.
Onyx
RAG, 검색, 코드 실행, 아티팩트 생성까지 포괄하는 오픈소스 LLM 애플리케이션 레이어
- GitHub: Onyx
- 언어/스택: Python, Docker, Kubernetes, Redis, MinIO, 다양한 LLM Provider
- 카테고리: AI
무엇을 하는 프로젝트인가? Onyx는 “LLM을 실제 업무 시스템으로 끌어내리는 플랫폼”에 가깝습니다. 단순 채팅 UI가 아니라 RAG, 웹 검색, 커스텀 에이전트, 코드 실행, 음성 모드, 이미지 생성 같은 기능을 하나의 제품 레이어로 묶어 제공합니다. 온프레미스 모델과 상용 API를 모두 지원하고, 다양한 커넥터를 통해 조직의 데이터 소스를 연결할 수 있다는 점도 강점입니다. 즉, 사내 GPT 포털이나 도메인 특화 AI 워크스페이스를 빠르게 구축하려는 팀에 잘 맞습니다.
주요 특징
- 특징 1: Agentic RAG와 Deep Research — 단순 검색 응답을 넘어서, 여러 단계로 조사하고 결과물을 정리하는 흐름까지 지원합니다.
- 특징 2: 확장성 높은 통합 구조 — MCP, 액션, 웹 검색, 코드 실행, 파일 생성 등 LLM이 외부 시스템과 상호작용할 수 있는 표면이 넓습니다.
- 특징 3: 운영 배포 옵션이 풍부함 — Lite와 Standard 모드, Docker/Kubernetes/Helm/Terraform 지원으로 실험 환경과 운영 환경을 나눠 설계하기 좋습니다.
개발자에게 의미하는 것 사내 지식검색, AI 업무도구, 팀용 에이전트 포털을 만들고 있다면 Onyx는 “기능을 직접 다 조립하지 않아도 되는” 훌륭한 출발점입니다. 특히 RAG와 에이전트 기능을 동시에 요구하는 팀에서 생산성을 크게 끌어올릴 수 있습니다.
oh-my-codex
OpenAI Codex CLI 위에 구조화된 워크플로와 상태 관리 레이어를 얹는 개발자용 런타임 도구
- GitHub: oh-my-codex
- 언어/스택: Node.js, Codex CLI, tmux/psmux
- 카테고리: DevOps
무엇을 하는 프로젝트인가?
oh-my-codex는 Codex 자체를 대체하지 않고, 그 위에 더 나은 작업 흐름을 제공하는 보조 런타임입니다. 핵심은 AI 코딩 세션을 즉흥적으로 쓰는 대신, 명확화(Clarify) → 계획 승인(Plan) → 완료(Completion)라는 구조로 표준화하는 데 있습니다. 프로젝트별 가이드와 메모리, 로그, 계획을 .omx/ 디렉터리에 누적해 세션 간 맥락도 유지할 수 있습니다. AI 도구를 “한 번씩 써보는 장난감”이 아니라 반복 가능한 팀 워크플로로 다듬으려는 시도가 인상적입니다.
주요 특징
- 특징 1: 구조화된 작업 플로우 — 요청을 바로 코드로 바꾸기보다 먼저 범위를 명확히 하고, 구현 계획을 승인받는 흐름을 강제합니다.
- 특징 2: 세션 상태의 영속화 — 가이드, 플랜, 로그, 메모리를 프로젝트 단위로 저장해 장기 작업에 유리합니다.
- 특징 3: 병렬 작업 지원 — 팀 모드와 역할 기반 스킬 호출로, 복잡한 작업을 분업형으로 운영할 수 있습니다.
개발자에게 의미하는 것 AI 코딩 도구를 쓸수록 “실행 능력”보다 “운영 방식”이 중요해집니다. 그런 의미에서 oh-my-codex는 개인 생산성 도구를 팀 수준 워크플로로 끌어올리는 흥미로운 실험입니다.
OpenScreen
데모 영상 제작에 필요한 핵심 기능을 담은 오픈소스 화면 녹화 앱
- GitHub: OpenScreen
- 언어/스택: Electron, React, TypeScript, Vite, PixiJS
- 카테고리: 프론트엔드
무엇을 하는 프로젝트인가? OpenScreen은 제품 데모나 튜토리얼 영상을 빠르게 만들고 싶은 개발자를 위한 오픈소스 앱입니다. 유료 스크린 레코딩 툴의 핵심 경험을 참고하되, 필요한 기능 위주로 단순하고 실용적으로 구성되어 있습니다. 단순 녹화에서 끝나지 않고 자동/수동 줌, 주석, 트림, 속도 조절, 다양한 해상도 export까지 지원해 결과물 완성도를 높일 수 있습니다. 베타 단계이긴 하지만 “개발자가 직접 고쳐 쓸 수 있는 데모 툴”이라는 점에서 충분히 주목할 만합니다.
주요 특징
- 특징 1: 데모 제작 중심 기능 구성 — 줌, 크롭, 주석, 배경 설정, 모션 블러 등 발표용 영상에 필요한 기능이 잘 모여 있습니다.
- 특징 2: 멀티 플랫폼 배포 — Electron 기반이라 macOS, Windows, Linux에서 폭넓게 접근할 수 있습니다.
- 특징 3: 오픈소스 커스터마이징 가능 — 자체 워크플로에 맞는 편집 기능이나 export 옵션을 확장하기 좋습니다.
개발자에게 의미하는 것 개발자 도구, SaaS, 오픈소스 프로젝트를 운영한다면 결국 데모 영상은 필수입니다. OpenScreen은 “보여주는 개발”에 필요한 툴체인을 직접 소유하고 싶은 팀에게 잘 맞습니다.
tdesktop
Telegram의 공식 데스크톱 클라이언트 전체 소스 코드를 공개한 대형 오픈소스 프로젝트
- GitHub: tdesktop
- 언어/스택: C++, Qt, OpenSSL, FFmpeg, WebRTC, CMake
- 카테고리: 시스템
무엇을 하는 프로젝트인가? tdesktop은 Telegram Desktop 클라이언트의 실제 구현체입니다. 공개 저장소를 통해 메신저 클라이언트가 어떻게 UI, 네트워크, 미디어 처리, 보안 통신을 결합하는지 확인할 수 있습니다. Qt 기반의 크로스플랫폼 앱 구조와 MTProto 프로토콜 처리, 멀티미디어 기능이 복합적으로 얽혀 있어 학습 자료로도 가치가 큽니다. 대규모 사용자 기반을 가진 네이티브 앱이 어떻게 유지되는지 볼 수 있다는 점도 큰 매력입니다.
주요 특징
- 특징 1: 실전급 크로스플랫폼 데스크톱 앱 — Windows, macOS, Linux를 대상으로 한 대형 C++ 애플리케이션 구조를 살펴볼 수 있습니다.
- 특징 2: 풍부한 미디어/통신 스택 — OpenSSL, WebRTC, FFmpeg, Opus 등 실제 서비스에 필요한 구성요소가 촘촘하게 들어가 있습니다.
- 특징 3: 공식 클라이언트 소스 공개 — 단순 샘플이 아니라 실제 운영되는 제품 코드를 확인할 수 있다는 점이 중요합니다.
개발자에게 의미하는 것 네이티브 앱 아키텍처, 보안 통신, 멀티미디어 처리에 관심 있다면 tdesktop은 교과서보다 더 실전적인 참고서입니다. 특히 C++/Qt 기반 대형 앱을 설계하거나 유지보수하는 개발자에게 좋은 사례입니다.
goose
로컬에서 실행되며 코드 작성부터 실행·디버깅·오케스트레이션까지 수행하는 확장형 AI 에이전트
- GitHub: goose
- 언어/스택: AI Agent Framework, MCP, Desktop App, CLI
- 카테고리: AI
무엇을 하는 프로젝트인가? goose는 로컬 환경에서 동작하는 자율형 AI 에이전트입니다. 단순히 코드 스니펫을 추천하는 것이 아니라 프로젝트를 구성하고, 코드를 실행하고, 실패를 디버깅하고, 외부 API와 상호작용하는 흐름까지 자동화하려고 합니다. 특정 모델에 종속되지 않고 여러 LLM을 붙일 수 있으며 MCP 연동으로 도구 확장성도 갖췄습니다. “내 컴퓨터에서 믿을 수 있게 돌아가는 개발 에이전트”라는 포지션이 현재 트렌드와 잘 맞습니다.
주요 특징
- 특징 1: 로컬 실행 중심 — 클라우드 의존도를 낮추고, 개발자의 실제 작업 환경 안에서 end-to-end 자동화를 지향합니다.
- 특징 2: 멀티 모델·MCP 통합 — 비용과 성능을 조절하기 위한 모델 조합, 외부 도구 연동을 유연하게 설계할 수 있습니다.
- 특징 3: CLI와 데스크톱 앱 제공 — 자동화 지향 사용자와 인터랙티브 사용자 모두를 포괄합니다.
개발자에게 의미하는 것 개발 에이전트가 진짜 유용해지려면 “코드를 제안하는 수준”을 넘어 “실행과 검증”까지 가야 합니다. goose는 바로 그 방향을 밀고 있는 프로젝트라, 로컬 AI 개발 환경을 구성하는 팀이라면 체크할 가치가 큽니다.
agent-framework
.NET과 Python에서 AI 에이전트를 구성·오케스트레이션·운영할 수 있게 설계된 Microsoft의 멀티언어 프레임워크
- GitHub: agent-framework
- 언어/스택: Python, C#/.NET, OpenTelemetry, Azure/OpenAI 연동
- 카테고리: AI
무엇을 하는 프로젝트인가? agent-framework는 단순 챗봇을 넘어 멀티 에이전트 워크플로를 그래프 구조로 설계할 수 있게 해주는 프레임워크입니다. 에이전트와 결정적 함수, 도구 호출, 스트리밍, 체크포인트, human-in-the-loop 같은 운영 요소를 한 모델 안에 담고 있습니다. 특히 Python과 .NET 양쪽을 지원해 조직 내 기술 스택이 섞여 있어도 도입 장벽이 낮습니다. 여기에 OpenTelemetry 기반 관측성까지 기본 축으로 둔 점이 Microsoft다운 실용성으로 보입니다.
주요 특징
- 특징 1: 그래프 기반 오케스트레이션 — 복잡한 멀티 에이전트 흐름을 노드와 데이터 플로우 관점에서 다룰 수 있습니다.
- 특징 2: 운영 기능 내장 — 체크포인팅, 디버깅, time-travel, human-in-the-loop 등 실제 운영에서 필요한 기능이 강조됩니다.
- 특징 3: Observability 우선 설계 — OpenTelemetry 통합으로 추적과 모니터링을 에이전트 개발의 기본 요소로 포함합니다.
개발자에게 의미하는 것 AI 에이전트가 프로덕션으로 갈수록 중요한 건 프롬프트보다 흐름 제어와 관측성입니다. agent-framework는 그 현실을 정확히 반영한 프로젝트라, 엔터프라이즈 AI 시스템 설계 시 참고할 가치가 높습니다.
sherlock
하나의 사용자 이름으로 수백 개 소셜 네트워크에서 계정 존재 여부를 찾는 OSINT 도구
- GitHub: sherlock
- 언어/스택: Python, CLI, Docker
- 카테고리: 보안
무엇을 하는 프로젝트인가? sherlock은 특정 username이 여러 소셜 플랫폼에 존재하는지 빠르게 찾아주는 도구입니다. 보안 조사, OSINT, 브랜드 모니터링, 계정 점검 같은 맥락에서 많이 활용됩니다. 다양한 출력 포맷과 프록시/Tor 옵션, 특정 사이트만 선별 검색하는 기능까지 제공해 단순한 장난감 수준을 넘었습니다. 오래 사랑받는 이유는 문제 정의가 명확하고, CLI 도구로서의 사용성이 꽤 좋기 때문입니다.
주요 특징
- 특징 1: 광범위한 사이트 지원 — 400개 이상의 소셜 네트워크를 대상으로 username 존재 여부를 확인할 수 있습니다.
- 특징 2: 다양한 출력 포맷 — 텍스트, CSV, XLSX 등 결과 정리와 보고에 유리한 형식을 제공합니다.
- 특징 3: 우회/익명성 옵션 — Tor, 프록시, 타임아웃 설정 등 조사 환경에 맞는 네트워크 제어가 가능합니다.
개발자에게 의미하는 것 보안 팀이나 리서처뿐 아니라, 개인 브랜딩과 서비스 네이밍 검증에도 유용합니다. 작은 CLI 도구지만 OSINT 자동화의 기본기를 잘 보여주는 프로젝트입니다.
오늘의 한 줄 정리: 오늘 트렌딩은 AI를 “모델 호출”이 아니라 “워크플로와 운영”의 문제로 바라보는 흐름이 특히 강했습니다. 동시에 OpenScreen, tdesktop, sherlock처럼 여전히 실용적인 개발 도구와 시스템 프로젝트도 꾸준히 주목받고 있다는 점이 흥미롭습니다.
매일 아침 GitHub Trending을 릿치 블로그에서 만나보세요.