last30days-skill

GitHub 바로가기

이 프로젝트는 최근 30일간의 Reddit, X(트위터), Bluesky, 유튜브, TikTok, Instagram, Hacker News, Polymarket 등 다양한 소셜과 웹 플랫폼에서의 커뮤니티 활동 데이터를 수집, 분석, 그리고 요약하는 AI 기반 연구 및 트렌드 분석 도구입니다. 이 스킬은 트렌드 조사, 커뮤니티 반응 파악, 실시간 이슈 진단, 바이럴 트렌드 탐지 등에 활용할 수 있으며, 최신 정보와 커뮤니티 감정을 빠르게 파악하여 관련 인사이트를 제공하는 것이 목적입니다.

기능으로는 30일 이내의 자료 수집(검색, 스크래핑, transcript 추출 포함), 정제 및 우선순위 평가, 다양한 주제에 대한 자연어 요약, 크로스 플랫폼 컨텐츠 검증과 시각화, 실시간 예측 시장 데이터 통합 등을 제공합니다. 사용자 대상은 연구자, 콘텐츠 제작자, 마케터, 개발자, 법률 전문가 등으로, 예를 들어 트렌드 분석, 기업 경쟁사 분석, 바이럴 마케팅 전략, 최근 뉴스/이슈 파악 등 다양한 적용 사례가 가능합니다.

구성요소는 크게 API 통합 모듈, CLI 도구, 마켓플레이스 플러그인, 웹 검색 연동, 커스터마이징 환경 설정, 테스트 및 디버깅 유틸리티로 이루어져 있으며, 주로 Python, Node.js 환경에서 동작합니다. 최근 업데이트 내역을 보면 v2.9.5 버전에서는 Bluesky/AT 프로토콜 소스 통합, 비교 분석 모드, 프로젝트별 환경설정 강화, 결과 저장 및 데이터 구조 개선 등의 기능이 추가되었고, 이전 버전들에서도 유튜브 transcripts, 자동 저장, 다양한 소스 확장, 웹 검색 기능 강화 등이 나타납니다.

특이사항으로는 455개 이상의 테스트 커버리지, 크로스 소스 신뢰도 향상, API 키 보안 강화, 사용자 맞춤 구성 지원 등이 있으며, 웹 검색 API 키 설정, handle resolution 등 사용자별 세팅에 유의해야 합니다. 공식 문서와 GitHub 저장소 링크를 통해 상세 설치 방법, 사용법, 스크립트 예제, 추천 커맨드, 도입 가이드, 유의사항 등을 참고하는 것이 좋습니다.


Deep-Live-Cam

GitHub 바로가기

Deep-Live-Cam은 실시간 얼굴 교체와 딥페이크 기술을 활용하여 하나의 이미지만으로 다양한 영상 및 얼굴 변환 효과를 제공하는 오픈소스 프로젝트입니다. 이 프로젝트의 목표는 인공지능을 이용한 미디어 제작을 보다 간편하게 만들고, 창작자들이 영상 제작, 캐릭터 애니메이션, 의상 디자인 등에 활용할 수 있게 돕는 것입니다.

주요 기능으로는 실시간 얼굴 교체, 딥페이크 영상 제작, 다양한 얼굴 맵핑, 가상 공연 및 밈 생성, 영상 내 얼굴 애니메이션 등이 있으며, 이를 통해 사용자들은 3단계의 간단한 과정(얼굴 선택, 카메라 선택, 라이브 시작)으로 딥페이크 영상과 스트리밍을 즉시 생성할 수 있습니다. 구조는 Python 기반의 CLI와 GUI 환경, 여러 딥러닝 모델들(GFPGAN, InsightFace, InSwapper 등)을 활용하며, GPU 가속(CUDA, CoreML, OpenVINO 등) 옵션도 지원하여 성능 향상이 가능합니다. 대상 사용자는 영상 제작자, 유튜버, 개발자, 엔터테인먼트 산업 종사자 등이며, 실시간 영상 스트리밍, 소셜 미디어 콘텐츠 제작, 디지털 아바타, 밈 생성 등에 활용됩니다.

기술 스택에는 Python, PyTorch, OpenCV, ffmpeg, 다양한 딥러닝 프레임워크 및 모델들이 포함되어 있고, Windows, macOS, Linux 환경에서 설치 및 실행이 가능합니다. 프로젝트는 최신 버전 2.1로 유지보수중이며, 빠른 속도를 위한 사전 빌드 버전과 상세 설치 방법, 여러 실행 환경에 따른 가이드, 그리고 모델 다운로드 링크 등 사용자가 쉽게 활용할 수 있도록 지원하고 있습니다. 또한, 윤리적 사용 방침과 법적 준수, 부적절 콘텐츠 차단 기능 등이 포함되어 있어 책임감 있는 활용이 요구됩니다.


AI-Scientist-v2

GitHub 바로가기

AI-Scientist-v2는 완전 자율적인 과학 연구 시스템으로, AI가 가설 생성, 실험 수행, 데이터 분석, 논문 작성까지 전 과정을 자동화하는 종단 간 시스템입니다. 이 프로젝트는 워크숍 레벨의 과학적 발견을 목표로 하며, 특히 Agentic Tree Search 방식을 통해 탐색과 실험 과정을 수행합니다.

이전 버전인 AI Scientist-v1과는 달리, 인간이 작성한 템플릿에 의존하지 않고 다양한 머신러닝 분야에 일반화되어 있으며, 진행형 에이전트린 트리 탐색자로 구성된 구조를 갖추고 있습니다. 주요 사용 대상은 과학 연구자, AI 연구자, 그리고 자동화된 과학적 탐구에 관심이 있는 개발자들이며, 실험 설계와 논문 생성, 아이디어 브레인스토밍 등 다양한 단계에 적용 가능합니다.

기술 스택은 Linux 환경, CUDA 기반 NVIDIA GPU, PyTorch, OpenAI 및 Gemini 모델, AWS Bedrock, Semantic Scholar API 등을 포함하며, GPT-4, Claude, Gemini와 같은 대형 언어 모델을 지원합니다. 최근 릴리즈에서는 워크숍 논문 게재와 함께 시스템의 일반화 성과와 실험 구조 개선이 이루어졌으며, 일정 단계에서 사용자 설정을 통한 다양한 모델 및 API 키 지원이 가능하게 업데이트 되었습니다. 이 시스템 사용 시 강력한 GPU와 제어된 실행 환경이 필요하며, 일부 위험성과 보안 우려에 대한 주의가 요구됩니다.

참고 링크와 사용법 상세 설명, API 키 설정 안내, 실험 진행 방법 등을 포함해 과학적 탐구 자동화 분야의 핵심 도구로 활용할 수 있습니다.


VibeVoice

GitHub 바로가기

VibeVoice는 오픈소스 기반의 첨단 음성 인공지능 모델 집합으로, 텍스트-음성 변환(TTS)과 자동 음성 인식(ASR) 모델을 포함합니다. 핵심 기술은 초저프레임(7.5Hz)의 연속적 음성 토크나이저(음향적, 의미론적)를 활용해 오디오 품질은 유지하면서 긴 시퀀스 처리의 계산 효율을 크게 향상시킨 점입니다.

이 프로젝트는 사용자 맞춤형 도메인 별 hotwords 지원, 긴 형식의 연속 오디오 처리(최대 60분), 다중 화자 인식과 생성, 자연스러운 감정 표현 등의 기능을 제공하며, 다국어 지원(50개 이상의 언어 포함) 또한 특징입니다. 구성요소로는 ASR 모델(예: VibeVoice-ASR-7B), 긴 형식 TTS 모델(예: VibeVoice-TTS 1.5B), 실시간 스트리밍 TTS 모델(예: VibeVoice-Realtime 0.5B)이 있으며, 모두 Hugging Face와 연계되어 쉽게 활용할 수 있도록 설계되었습니다.

최근에는 모델들이 Microsoft의 Transformers 릴리즈와 연동되었으며, 각종 데모와 API playground를 통해 실험과 연구가 가능하도록 지원하고 있습니다. 이 프로젝트는 음성 인식과 생성 분야의 연구 발전과 커뮤니티 협업을 목적으로 하며, 책임 있는 AI 활용과 관련된 주의사항과 윤리적 고려도 함께 제시하고 있습니다.


twenty

GitHub 바로가기

twenty는 오픈소스 기반의 고객 관계 관리(CRM) 시스템으로, 비용 부담을 줄이고 사용자에게 더 나은 경험을 제공하는 것을 목표로 합니다. 데이터 락인 없이 유연하게 활용할 수 있도록 설계되어 있으며, Notion, Airtable, Linear 등과 유사한 사용자 경험(UX) 패턴을 적용하고자 개발되었습니다.

주요 기능으로는 레이아웃 커스터마이징, 객체 및 필드 설정, 사용자 역할별 권한 관리, 워크플로우 자동화, 이메일, 일정, 파일 관리 등이 포함됩니다. 기술 스택은 TypeScript, Nx, NestJS, React 등을 사용하며, 데이터 저장에는 PostgreSQL과 Redis, 메시지 큐에는 BullMQ를 활용합니다. 최근 릴리즈 및 업데이트는 사용자 요청에 따라 기능 개선과 정기적인 버전 배포가 이루어지고 있으며, 커뮤니티와 협업을 중요시하여 기여 코드, 문서, 번역 멤버들의 참여를 적극 장려하고 있습니다.

공식 문서와 도구, 프로젝트 로드맵, 커뮤니티 링크들도 제공되어 사용자와 개발자의 참여를 이끕니다.


Datalab - Chandra

GitHub 바로가기

Datalab의 Chandra는 최첨단 문서 인텔리전스 모델로서, 이미지를 비롯한 PDF 문서에서 구조화된 HTML, Markdown, JSON 형식으로 레이아웃 정보를 유지하며 텍스트와 내용을 추출하는 기능을 제공합니다. OCR, 문서 구조 복원, 다국어 지원, 표와 수식, 손글씨 인식 등 다양한 문서 처리요구를 충족시키기 위해 설계되었습니다.

구성 요소는 Python CLI, API, Streamlit 기반 웹 인터페이스이며, Inferene Mode에서는 로컬(Huggingface) 또는 원격(vLLM 서버) 방식으로 지원됩니다. 최신 AI 라이브러리(TF, VLLM, PyTorch)를 활용하며, 다국어 및 수식 인식 성능 향상에 중점을 두고 있습니다. 최근 성능이 크게 향상된 버전이 발표되었으며, 연구용 무료 이용과 함께 상업적 사용 시 라이선스와 API 비용 조건이 적용됩니다.

이 프로젝트는 문서 자동화, 디지털 아카이빙, 검수, 콘텐츠 분석 등에 활용 가능합니다.


Superpowers

GitHub 바로가기

Superpowers는 코드 에이전트를 위한 완전한 소프트웨어 개발 워크플로우를 제공하는 시스템입니다. 재성 가능한 ‘스킬’과 초기 지시사항을 기반으로 하며, 체계적이고 효율적으로 작업을 수행할 수 있도록 설계되었습니다. 협력, 계획, 테스트 주도 개발, 자율적 작업 등을 지원하며, 오픈소스이고 확장성이 뛰어납니다.

사용자는 브레인스토밍, 설계 검증, 작업 분할, 서브에이전트 활용, 코드 리뷰, 병합 등을 자연스럽게 진행할 수 있습니다. GitHub, CLI, 플러그인 마켓플레이스(Claude Plugin Marketplace) 등으로 확장 가능하며, 커뮤니티 지원과 기여도 활발합니다.

개발 프로세스를 과학적이고 협력적으로 만들어주는 이 프로젝트는 다양한 릴리즈와 업데이트가 이루어지고 있습니다.


Dexter 🤖

GitHub 바로가기

Dexter는 자율적으로 금융 연구를 수행하는 인공지능 에이전트입니다. 복잡한 금융 질문을 체계적인 연구 계획으로 전환하고, 실시간 시장 데이터를 분석하며, 작업을 검증하고 반복하는 기능을 갖추고 있습니다.

태스크 플래닝, 데이터 수집, 자율 수행, 자기검증, 반복 학습 등이 통합된 구조로 되어 있으며, OpenAI API, 다양한 금융 API, 웹 검색 API 등을 활용합니다. CLI와 환경 설정 파일을 통해 사용하며, 금융 데이터 및 웹 검색 API 키 필요와 환경 변수 세팅이 요구됩니다. 프로젝트는 MIT 라이선스이며, 기여와 수정이 자유롭습니다.


oh-my-claudecode

GitHub 바로가기

oh-my-claudecode는 클로드(Claude) 코드를 위한 다중 에이전트 오케스트레이션 도구입니다. 복잡한 작업을 자동으로 분산 수행하고 모니터링하는 오픈소스 프로젝트로, 여러 에이전트(팀, Codex, Gemini, Claude)를 활용하여 자연어 명령 처리, 병렬 처리, 비용 최적화, 작업 재사용을 지원합니다.

tmux와 연동되어 실시간 작업 제어와 관찰이 가능하며, 다양한 오케스트레이션 모드와 커스텀 스킬, 알림 기능이 포함되어 있습니다. 최근 버전 v4.4.0에서는 업그레이드된 서버 제거와 확장 기능이 도입되어 사용자 편의성을 높였습니다. Node.js 기반 패키지와 다양한 AI 제공자 연동, 알림 통합 지원됩니다.

AI 워크플로우 자동화와 효율성을 위한 최신 오케스트레이션 솔루션입니다.