Windows
이 프로젝트는 Docker 컨테이너 환경 내에서 Windows 운영체제를 실행할 수 있도록 설계된 오픈소스 프로젝트입니다. 목적은 별도의 호스트 시스템없이 Docker 만으로 Windows 환경을 손쉽게 설치하고 이용할 수 있게 하는 데 있으며, 자동 설치, 다양한 Windows 버전 선택, 네트워크 설정, 저장소 및 디스크 크기 조절 등 다양한 기능을 제공합니다. 주요 구조는 Docker Compose 파일과 Kubernetes 지원을 통한 배포 방식, CLI 명령어 등이 포함됩니다. 대다수 사용 대상은 Windows를 가상 환경에서 손쉽게 테스트하거나 개발환경을 구축하려는 개발자, 시스템 관리자, 연구원 등입니다. 기술 스택에는 Docker, Docker Compose, Kubernetes, QEMU, KVM 가속 기술이 활용됩니다. 최근 릴리즈 정보는 명확히 명시되어 있지 않지만, 지속적으로 유지보수 및 업데이트 이루어지고 있으며, 최신 Docker 이미지는 다양한 버전의 Windows를 지원합니다. 사용자들은 Docker CLI 또는 Docker Compose를 통해 손쉽게 컨테이너를 배포할 수 있고, RDP를 이용한 접속, 네트워크 구성, 디스크 관리, 자동 스크립트 실행 등 세밀한 설정이 가능하며, Windows 버전 및 언어, 키보드 레이아웃 선택도 지원됩니다. 참고로 ARM64 버전은 별도 프로젝트를 통해 지원하며, Windows 라이선스와 관련된 법적 문제는 없는 오픈소스 기반임을 명시하여 법적 문제 우려를 해소하고 있습니다.
Koog
Koog는 Kotlin을 기반으로 한 프레임워크로, AI 에이전트를 순수한 Kotlin 코드를 사용하여 구축하고 실행할 수 있도록 설계되었습니다. 이 프로젝트의 주목적은 개발자가 자연스럽고 직관적인 Kotlin으로 강력한 AI 에이전트를 개발하는 데 도움을 주는 것이며, 다양한 도구와 워크플로우, 외부 시스템과의 연동 기능을 제공합니다.
주요 기능으로는 모델 컨텍스트 프로토콜(MCP) 연동, 벡터 임베딩을 통한 세만틱 검색, 사용자 정의 도구 개발, 사전 제작된 컴포넌트 제공, 대화 내역 최적화를 위한 정보 압축, 실시간 스트리밍 API, 에이전트의 지속적 메모리, 상세한 트레이싱과 디버깅, 그래프 기반 워크플로우 설계, 모듈러 확장성, JVM, JS, Wasm, iOS 등 다양한 타겟 플랫폼 지원이 포함됩니다. 구조적으로는 Kotlin 라이브러리로 구성되어 있으며, Gradle, Maven과 같은 빌드 시스템을 지원하여 간편한 통합이 가능합니다. 최신 릴리즈와 활동상황, 기여방법은 GitHub 저장소를 참고 해주시기 바랍니다.
Hyperswitch
Hyperswitch는 오픈소스 기반의 결제 인프라스트럭처로, 유연성과 제어력을 제공하는 모듈형 시스템입니다. 이 프로젝트의 목적은 다양한 결제 방법과 프로세서, 플로우를 지원하며, 개발자가 자신들의 기존 결제 스택 위에서 필요한 모듈만 선택적으로 통합할 수 있도록 하는 것에 있습니다.
주요 기능으로는 결제 수단별 모니터링과 비용 최적화, 수익 복구, 결제 수단 저장과 재사용을 위한 Vault, 스마트 라우팅 및 재시도 전략, 정산 자동화, 여러 결제 방식(PayPal, Apple Pay, BNPL 등) 지원이 포함됩니다. 구성 요소는 독립된 모듈로 구분되며, API, CLI, 스키마를 통해 상호작용할 수 있고, 기술 스택은 Rust를 기반으로 하며, 클라우드 환경 배포를 위한 헬름 차트 또는 CDK 스크립트도 제공합니다. 릴리즈 및 변경 이력은 CHANGELOG.md를 참고하세요. 커뮤니티 참여와 버그 수정, 기능 요청을 환영하며, Juspay가 유지보수하고 있습니다.
WhisperLiveKit
WhisperLiveKit는 실시간으로 사용자 브라우저 또는 서버 환경에서 음성을 높은 정확도로 텍스트로 전환하는 오픈소스 프로젝트입니다. 이 프로젝트는 완전 로컬 환경에서 음성 인식과 화자 구별을 실시간으로 수행하는 것을 목표로 하고 있으며, 외부 API 호출 없이 빠른 응답과 개인정보 보호를 중시합니다.
주요 기능으로는 실시간 음성-텍스트 변환, 화자 구별, 웹 브라우저 또는 서버 기반의 프론트엔드와 백엔드 구성을 지원하며, 다양한 언어와 모델 크기를 선택할 수 있습니다. 아키텍처는 VAD와 디아리제이션 백엔드 지원, FastAPI 서버와 WebSocket 통신을 통해 실시간 스트리밍을 처리합니다. 대상은 미팅 기록, 장애인 지원, 콘텐츠 제작, 고객센터 지원 등입니다. 기술 스택은 Python, FastAPI, FFmpeg, Docker, Hugging Face 모델, GPU/CPU 환경이 포함됩니다. 업데이트와 기능 확장에 힘쓰고 있으며, 배포는 Docker, Python 패키지, 자체 서버 환경에서 가능합니다.
Activepieces
Activepieces는 오픈소스 기반의 AI 자동화 플랫폼입니다. 사용자가 손쉽게 서비스 연결과 자동화를 할 수 있도록 설계되었으며, TypeScript를 기반으로 하는 ‘피스’ 프레임워크를 이용합니다. 다양한 서비스(Terraform, Google Sheets, OpenAI, Discord 등)와의 통합을 지원하며, 커뮤니티 기여로 기능 확장이 활발히 진행 중입니다.
구성요소로는 API, CLI, 스키마, 드래그 앤드롭 워크플로우 빌더가 있으며, 개발자가 쉽게 커스터마이징하고 확장할 수 있도록 오픈소스 조각이 제공됩니다. main 기술 스택은 TypeScript, Node.js, npm, REST API입니다. 자율 서버 호스팅도 가능하며, 뛰어난 보안 설계도 갖추고 있습니다. 최신 릴리즈와 기여 가이드는 공식 문서에서 확인하세요.
Fooocus
Fooocus는 오프라인에서 사용할 수 있는 이미지 생성 소프트웨어로, Stable Diffusion XL을 활용하여 고품질 이미지를 생성하는 것이 목표입니다. Gradio를 기반으로 하며, 사용자 친화적인 UI와 다양한 텍스트-이미지 기능, 모델 및 프리셋 자동 다운로드, 세밀한 커스터마이징 옵션 등을 제공합니다.
구조는 명령어 기반과 GUI를 병행하며, 모델, 프롬프트, 인페인팅, 업스케일 등 다양한 기능을 포함합니다. 대상은 디자이너, 일러스트레이터, 연구자, 입문자이며, GPU 가속 지원, 크로스 플랫폼 배포(윈도우, 맥, 리눅스)를 지원합니다. 최신 업데이트로 퍼포먼스 향상, 프리셋, 기능 확장 등이 있으며, 기타 커스터마이징도 가능합니다.
theHarvester
theHarvester는 레드팀 평가 또는 침투 테스트에서 사용하는 강력한 OSINT 도구입니다. 공개 출처 정보를 수집하여 도메인 외부 위협을 평가하는 데 활용하며, 이름, 이메일, IP, 하위도메인, URL 등을 여러 자료원에서 수집합니다.
커맨드라인 기반이며, 구글, 빙, DDG, Shodan, Censys, VirusTotal 등 다양한 검색 엔진과 서비스 연동을 특징으로 합니다. DNS 브루트포스, 서브도메인 스크리닝 등의 액티브 모듈도 포함되어 있습니다. Python 3.12 이상으로 개발되었으며, API 키가 필요한 서비스도 지원됩니다. 자세한 내용은 GitHub 저장소와 Wiki를 참고하세요.
HumanLayer
HumanLayer는 AI 에이전트의 기능 호출과 관리를 돕는 오픈소스 프로젝트입니다. 고위험 작업에서 인간의 감독 하에 안전하게 기능을 호출하도록 설계되어 있으며, @require_approval 데코레이터와 SDK를 통해 AI의 실수 방지와 신뢰성 확보를 지원합니다.
구조는 SDK와 확장 가능한 워크플로우를 포함하며, 인간 승인, 승인 관리, 감시 기능 등을 갖추고 있습니다. Python SDK 및 CLI 도구를 제공하며, 최신 릴리즈와 기여 방향은 GitHub 공식 페이지에서 확인 가능합니다.
MiniCPM-V
MiniCPM-V는 강력한 vision-language 멀티모달 대형 언어모델입니다. 8억 파라미터로, 영상, 텍스트, 비디오 입력을 받아 높은 품질의 텍스트 출력을 제공하며, 96배의 비디오 토큰 압축, 다국어 지원, OCR, 복잡한 문서 이해 등을 특징으로 합니다.
이 모델은 llama.cpp, Ollama, vLLM 등 다양한 프레임워크와 호환되며, 모바일과 데스크탑 환경에서 효율적 배포가 가능합니다. 연구, 엔지니어, 일반 사용자 대상이며, 공개된 모델은 2024년 2월 이후 여러 버전이 있습니다.
🌟 500+ AI Agent Projects / UseCases
이 프로젝트는 여러 산업 분야별 AI 에이전트 활용 사례를 모아놓은 컬렉션입니다. 구체적 목적과 기능 설명, GitHub 구현 예제 등을 포함하며, 건강, 금융, 교육, 소셜 미디어 등 다양한 분야에 적용 중입니다. 최신 업데이트와 기여 가이드 참고 바랍니다.
cognitive-load
이 프로젝트는 ‘인지 부하(cognitive load)‘의 원리와 감소 방법을 정리한 살아있는 문서입니다. 복잡한 조건문, 깊은 모듈화, 불필요한 의존성 제거 등 설계 원칙을 소개하며, 개발자가 이해하기 쉽고 유지보수 용이한 설계를 하는 데 도움을 줍니다. 다양한 실무 사례와 참고 문헌을 포함하고 있으며, 과학적 개념과 실천 방법이 함께 제시되어 있습니다.
abogen
abogen은 ePub, PDF, 텍스트 파일을 고음질 오디오로 변환하는 텍스트-음성 변환 도구입니다. 자연스러운 목소리와 일치하는 자막 생성이 가능하며, 오디오북, 콘텐츠 제작에 적합합니다.
GUI 기반 앱으로, 음성 선택, 속도 조절, 자막 태그, 배치 처리, 챕터 지원 등을 제공하며, Python, PyQt, Kokoro TTS, PyTorch 등을 활용합니다. 크로스 플랫폼 배포와 도커 지원도 특징입니다.