2025-09-17 - GitHub Trend Repo
MarkItDown 바로가기 MarkItDown은 다양한 파일 형식을 Markdown으로 변환하는 파이썬 기반의 경량 유틸리티입니다. 이 프로젝트의 목적은 대규모 언어 모델(LLM)과 텍스트 분석 파이프라인에서 유용하게 활용될 수 있도록, 문서 구조와 내용을 보존하며 Markdown 포맷으로 변환하는 기능을 제공하는 것입니다. PDF, PowerPoint, Word, Excel, 이미지(Exif 메타데이터 및 OCR 처리), 오디오(메타데이터 및 화자 인식), HTML, CSV, JSON, XML, ZIP 내 항목, 유튜브 URL, EPUB 등 다양한 입력 형식을 지원하며, 구조화된 문서 콘텐츠를 사람이 읽기 쉬운 Markdown으로 전달합니다. ...