Deep-Live-Cam
Deep-Live-Cam은 실시간 얼굴 교체와 딥페이크 영상 생성을 손쉽게 할 수 있는 오픈소스 소프트웨어입니다. 단 하나의 이미지만으로 간단히 클릭 몇 번으로 원하는 얼굴로 영상이나 실시간 스트림을 변환할 수 있으며, 인물의 얼굴을 다른 사람이나 가상 캐릭터로 자연스럽게 대체합니다.
이 프로젝트는 얼굴 매핑, 입 모양 마스킹, 여러 얼굴 동시에 처리하는 기능 등을 제공하며, 실시간 얼굴 교체, 영상 딥페이크, 영화 출연 효과, Meme 제작, 온라인 채팅(예: Omegle)에서 얼굴 변환, 라이브 쇼 등 다양한 활용 사례를 지원합니다. 사용자는 웹캠 또는 영상 파일을 통해 얼굴을 교체하거나 딥페이크 콘텐츠를 제작할 수 있으며, 명령줄 인터페이스(CLI) 또는 GUI를 사용할 수 있습니다.
구조적으로는 Python 기반으로, onnx 모델을 활용하는 딥러닝 프레임워크와 GPU 가속(CUDA, CoreML, OpenVINO 등)을 지원하는 여러 환경을 지원합니다. 설치는 소스 클론과 모델 다운로드, 의존성 설치 과정을 거치며, Windows, macOS, Linux 환경을 지원합니다. 버전 2.1에서는 성능 향상, 새 기능 추가, 하드웨어 지원 확장 및 사용자 편의성 개선이 이루어졌습니다.
이 소프트웨어는 AI 미디어 산업에서 창작 도구, 엔터테인먼트 콘텐츠, 패션 및 아트플레이션 등에 활용 가능하며, 법적·윤리적 문제와 관련한 사용 정책과 제한사항도 안내하고 있습니다. 불법 또는 비윤리적 용도로 사용하지 않도록 주의가 필요하며, 모델과 함께 제공되는 저작권 및 사용 제한 사항도 참고하세요.
주요 기술 스택은 Python, ONNX, CUDA, CoreML, OpenVINO, FFmpeg, InsightFace, GFPGAN 등이며, 오픈소스 커뮤니티와 다양한 라이브러리를 적극 활용하고 있습니다.
Superpowers
Superpowers는 개발자를 위한 완전한 소프트웨어 개발 워크플로우 도구로, 여러 개의 재구성 가능한 ‘기술(skill)‘과 초기 지침 세트를 기반으로 작동합니다. 이 시스템은 도움을 요청하는 대화형 에이전트가 사용자와 소통하며 요구 목표를 파악한 후, 설계, 계획, 구현, 검증, 리뷰, 배포 등 전 단계를 체계적이고 자동화하여 지원합니다.
특히 TDD, 스크럼, 코드 검토, 브랜치 관리 등의 기능을 자동화 및 최적화하여 협업과 품질 유지에 중점을 둡니다. 기술 스택은 클라우드 기반 플러그인, 확장 가능한 다양한 기술 라이브러리, CLI 도구, 연동 플러그인 등으로 구성되어 있으며, 다양한 개발 플랫폼에서 활용 가능합니다. 최신 릴리즈도 지속적으로 업데이트되고 있으며, 공식 마켓플레이스와 커뮤니티 지원으로 확장성과 참여를 유도합니다.
주 대상은 소프트웨어 개발자, 팀 협업 엔지니어, 자동화 관심 사용자, 개발팀이며, 커뮤니티 활동도 활발히 전개되고 있습니다. GitHub 저장소, 공식 문서, 설치 및 업데이트 명령어 등 관련 정보를 참고하세요.
AI-Scientist-v2
AI-Scientist-v2은 완전 자율적인 과학 연구 시스템으로, AI가 가설 생성, 실험 수행, 데이터 분석, 논문 작성까지 모든 과정을 독자적으로 수행하는 엔드투엔드 시스템입니다. 이 프로젝트는 인공지능이 실질적 학술 논문을 생성하는 최초의 워크숍 발표 논문이 채택되었으며, 기존 버전(v1)을 넘어 템플릿 의존도를 제거하고 머신러닝 분야 전반에 일반화를 시도합니다.
시스템 구조는 실험 아이디어 생성, 탐색, 데이터 분석, 논문 작성 등 각 과정을 지원하는 API와 모델을 포함하며, Linux 환경에서 NVIDIA GPU, CUDA, PyTorch 활용이 필수입니다. 대상은 과학자, AI 연구자, 인공지능을 이용한 자율 실험 및 연구 자동화에 관심 있는 개발자입니다.
주요 기술 스택으로는 PyTorch, CUDA, OpenAI, Gemini, Claude(외 AWS Bedrock), Semantic Scholar API 등이 있으며, 환경 변수로 API 키를 설정하여 사용합니다. 2025년 기준으로 논문 발표, 연구 아이디어 도출, 실험 분석, 결과 보고에 활용할 수 있으며, 최신 연구 결과와 노하우, 업데이트 일정도 공개하고 있습니다.
경고 사항으로 강력한 GPU, 샌드박스 환경 구성이 필요하며, 자율 실험에는 위험이 수반됩니다. 인류 연구 발전에 기여하는 미래 비전의 일환으로, AI와 인간 연구자가 협력하거나 AI만으로 학술 발전을 이끄는 사례입니다.
Dexter 🤖
Dexter는 자율 금융 연구 인공지능 에이전트로, 복잡한 금융 질문을 단계별 연구 계획으로 전환하고 실시간 시장 데이터를 활용하여 분석하며, 검증과 반복 통해 신뢰성 있는 답변 도출을 목표로 합니다.
핵심 기능은 자동 작업 계획, 금융 데이터 수집, 자기 검증, 실시간 데이터 액세스, 안전장치(루프 감지, 단계 제한)입니다. API 연동, CLI 명령어, 평가 스위트, 로그 시스템이 포함되며, 금융 분석가, 연구원, 투자자가 데이터 기반 인사이트 도출 또는 자율 금융 질문 시스템으로 활용됩니다.
기술 스택은 Bun 런타임, OpenAI API, 금융 API 클라이언트, Self-Reflection, Task Planning 알고리즘 등을 포함하며, API 키와 환경설정이 필요합니다. 정기적으로 업데이트되고 있으며, 디버깅과 평가도 수행 가능합니다. MIT 라이선스로 오픈소스 기여도 환영합니다.
twenty
twenty는 오픈소스 CRM 시스템으로, 고객 데이터를 효과적으로 관리하고 자동화하는 데 특화되었습니다. 비용 절감과 데이터 소유권 강화를 위해 개발됐으며, 기존 폐쇄형 CRM보다 유연하고 커스터마이징이 가능합니다.
기능은 필터, 정렬, 그룹화, 칸반 뷰, 테이블 뷰, 객체·필드 커스터마이징, 권한 관리, 워크플로 자동화, 이메일, 일정, 파일 관리 등으로 구성되어 있습니다. TypeScript, React, Nx, NestJS, BullMQ, PostgreSQL, Redis 등을 사용하며, 로컬 또는 도커 환경에서 배포 가능하죠.
대상은 개발자, 기업, 팀이며, 커스터마이징과 셀프 호스팅이 가능하여 유연한 CRM 활용이 가능합니다. 커뮤니티 지원과 기여도 적극 권장하며, 공식 문서와 설치 가이드에서 상세 내용을 확인하세요.
Onyx
Onyx는 오픈소스 기반의 강력한 사용자 맞춤형 채팅 인터페이스 플랫폼입니다. 배포와 사용이 간편한 자기 호스팅 가능한 채팅 UI를 제공하며, LLM과 호환 가능하도록 설계되어 있습니다.
다양한 AI 기능(에이전트, 웹 검색, 지식 그래프 RAG, 커넥터 연동 등)을 내장하고 있으며, Docker, Kubernetes, Terraform로 손쉽게 운영할 수 있습니다. 클라우드와 온프레미스 배포를 지원하며, 보안·권한관리도 갖추고 있습니다.
대상은 연구자, 개발자, 기업 엔터프라이즈로, OpenAI, Anthropic, Gemini 등 다양한 LLM과의 연동도 가능합니다. GitHub, 문서, 배포 가이드와 최신 릴리즈를 참고해 환경에 맞게 배포하세요.
Datalab
Datalab은 최첨단 문서 인텔리전스 모델로, 이미지를 포함한 PDF, 문서 데이터를 구조화된 HTML, Markdown, JSON으로 변환합니다. 레이아웃과 구조를 최대한 유지하며 텍스트, 표, 수식, 그림, 폼 등을 정밀하게 인식하는 것이 목표입니다.
구성은 API, CLI, 웹 애플리케이션으로 되어 있으며, API로 서버와 통신, CLI는 배치 작업, 웹 앱은 Streamlit 기반의 인터랙티브 화면을 제공합니다. HuggingFace Transformers와 vLLM 서버를 활용하며, 다국어, 수식, 표, 손글씨 등을 지원합니다.
2025년 10월과 2026년 3월에 각각 버전 업그레이드되었으며, 연구 개발에 적합하도록 공개되어 있습니다. 상업적 이용 시 별도 라이선스가 필요하며, API와 CLI 방법이 문서화되어 있어 손쉽게 적용 가능합니다.
agentscope
AgentScope는 생산적이고 사용하기 쉬운 에이전트 프레임워크로, 모델의 추론과 도구 활용을 결합합니다. 핵심 기능으로 ReAct 기반 에이전트, 음성 인터페이스, 멀티 에이전트 협업, 실시간 대화, 도구/API 연동, 롱텀 메모리를 갖추고 있습니다.
구조는 에이전트, 도구(toolkit), 메시지 허브, 메모리, 포매터, API 또는 CLI 모듈로 구성되었으며, Python 3.10 이상, asyncio, 자연어 모델 연동, WebSocket, Docker/K8s 지원 등을 활용합니다. 2026년 3월 기준 여러 실험과 워크플로우 예제, 커뮤니티 활동이 활발하며, 연구 목적으로도 유용하게 쓰이고 있습니다.
GitHub와 공식 문서, 튜토리얼, API 문서와 함께 오픈소스 라이선스 Apache 2.0을 따릅니다. 연구 성과도 공개되어 있습니다.