VideoToText
는 비디오 또는 오디오 파일에서 오디오를 추출하고, 이를 텍스트로 변환하여 요약하는 도구입니다. 이 도구는 강의나 프레젠테이션의 내용을 텍스트로 변환하여 쉽게 요약하고 정리할 수 있도록 도와줍니다.
- 오디오 추출: 다양한 비디오 포맷에서 오디오를 추출합니다.
- 텍스트 변환: 추출된 오디오를 텍스트로 변환합니다.
- 요약 저장: 변환된 텍스트를 프롬프트와 함께 요약하여 파일로 저장합니다.
- 비디오/오디오 파일 준비: 변환할 비디오 또는 오디오 파일을 준비합니다.
- 스크립트 실행:
video_to_text.py
스크립트를 실행합니다. - 파일 경로 입력: 처리할 파일의 절대 경로를 입력합니다.(realpath *.mp4)
- 결과 확인: 변환된 텍스트는
lecture_text_*.txt
파일로 저장됩니다. - GPT 요약 활용: 강의정리를 위한 프롬프트와 함께 저장된 텍스트파일을 전체 복사해 GPT에 바로 붙여넣습니다.
- Python 3.x
- 필요한 라이브러리: moviepy, speech_recognition, pydub
pip install -r requirements.txt
python video_to_text.py
- 변환 과정에서 임시 파일이 생성되며, 처리가 완료되면 자동으로 삭제됩니다.
- 지원하는 파일 형식: .mp4, .mov, .avi, .mkv, .m4a, .mp3, .wav