VideOCR을 사용하여 비디오에서 하드코딩된 자막을 SRT로 추출하는 방법
때로는 비디오에서 숨겨진 하드코딩된 자막을 가져오는 것이 마치 연기를 잡는 것처럼 느껴집니다.별도의 자막 트랙이 아니라 영상에 직접 내장되어 있기 때문에 기존 방식은 효과가 없습니다.다행히 VideOCR 과 같은 도구를 사용하면 비디오를 스캔하여 내장된 자막을 편집 가능한 SRT 파일로 변환할 수 있습니다.번역, 재편집 또는 접근성을 위해 텍스트 버전을 얻고 싶을 때 이 모든 과정이 매우 유용합니다.
항상 매끄럽게 진행되는 것은 아닙니다.특히 화질이 좋지 않거나 빠르게 움직이는 영상의 경우 시행착오가 있을 수 있습니다.하지만 몇 가지 설정을 조정하고 나중에 빠르게 수동 수정을 할 의향이 있다면 자막을 살리고 프로젝트를 훨씬 더 유연하게 만들 수 있습니다.
VideOCR에서 하드코딩된 자막 추출을 수정하는 방법
방법 1: 더 나은 OCR 결과를 위해 GPU 모드를 사용하고 있는지 확인하세요.
처리 속도가 느리거나 인식률이 일정하지 않은 경우, GPU 가속으로 전환하면 큰 효과를 볼 수 있습니다.일부 환경에서는 CPU 모드로 실행하는 것이, 특히 고해상도 비디오나 복잡한 장면의 경우 충분히 빠르지 않을 수 있습니다.왜 도움이 될까요? OCR(광학 문자 인식)은 프레임을 빠르고 정확하게 분석하기 위해 처리 능력에 크게 의존하기 때문입니다. GPU를 활성화하면 VideOCR이 그래픽 카드를 활용하여 프로세스를 더 빠르고 안정적으로 수행할 수 있습니다.
- VideOCR 내에서 환경 설정 이나 설정 으로 이동합니다 (일반적으로 3개 점 메뉴나 기어 아이콘 아래에 있음).
- GPU 가속 사용 또는 이와 유사한 옵션을 찾아 켜세요.
- 해당 옵션이 보이지 않으면 GPU 드라이버가 최신 상태인지 확인하세요. Nvidia 또는 AMD 드라이버는 최신 상태여야 합니다.오래된 드라이버 때문에 문제가 발생하지 않도록 주의하세요.
한 설정에서는 전환 후 훨씬 더 원활하게 작동했지만, 다른 컴퓨터에서는 여전히 약간 느려질 수 있지만 전반적으로 확실히 빨라졌습니다.이상하게도, 어떤 컴퓨터에서는 처음에는 실패하다가 재부팅이나 재시작 후에 다시 작동합니다. Windows는 모든 것을 더 복잡하게 만들어야 하는 거 아닌가요?
방법 2: 더 나은 정확도를 위해 정확한 자막 영역 그리기
또 다른 문제는 소프트웨어가 자막 영역이 아닌 전체 프레임을 스캔하려고 하기 때문에 인식률이 떨어진다는 것입니다.이 경우 자막 영역을 수동으로 정의하는 것이 도움이 됩니다.자막이 실제로 나타나는 위치(일반적으로 하단 중앙)를 클릭하여 상자를 그리면 VideOCR이 해당 영역에만 집중하게 됩니다.이렇게 하면 오탐(false positive)을 줄이고 OCR 신뢰도를 높일 수 있습니다.
- 자막이 있는 장면에서 비디오를 일시 정지한 다음 자막 영역 정의 버튼을 클릭합니다(때로는 마우스 오른쪽 버튼 클릭 메뉴나 도구 모음을 통해서만 접근할 수 있습니다).
- 마우스를 사용하여 자막 영역 주위에 사각형을 그립니다.최대한 정확하게 그리세요.나중에 정리 작업을 줄이는 데 도움이 됩니다.
- 참고: 영상에 움직이는 자막이 있거나 영상 내용이 많이 다를 경우, 각 섹션별로 이 영역을 다시 정의해야 할 수도 있습니다.이상적이지는 않지만 도움이 될 수 있습니다.
자르지 않고 추출하려고 했는데 텍스트가 깨지거나 줄이 누락된 경우 이 설정이 정말 유용합니다.시행착오를 거치는 것처럼 느껴지지만, 몇 번 수정하면 인식률이 눈에 띄게 향상되는 것을 느낄 수 있을 겁니다.물론 Windows나 VideOCR 같은 소프트웨어는 이런 과정을 복잡하게 만들 수밖에 없잖아요?
방법 3: 더 나은 결과를 위해 추출 설정 조정
추출 품질이 만족스럽지 않다면 신뢰도 임계값이나 프레임 건너뛰기 같은 설정을 조정하면 도움이 될 수 있습니다.신뢰도 임계값이 낮으면 더 많은 텍스트를 포착할 수 있지만, 오탐지율이 높아질 위험이 있습니다.반면 임계값이 높으면 더 엄격해져 일부 자막을 놓칠 수 있습니다.이는 균형을 맞추는 작업입니다.
- 설정에서 신뢰 임계값 이나 프레임 건너뛰기 와 같은 옵션을 찾으세요.
- 기본값(예: 신뢰도 70%)으로 시작하여 짧은 구간에서 테스트합니다.
- 인식이 너무 모호하면 신뢰도를 높이세요.자막이 불완전하면 신뢰도를 약간 낮추세요.
- 비디오가 매우 길거나 빠르게 움직이는 경우 프레임 건너뛰기를 늘릴 수 있습니다.이렇게 하면 처리되는 프레임 수가 줄어들어 속도가 빨라지지만 일부 텍스트가 누락될 수 있습니다.
솔직히 말해서, 특히 모든 영상이 다르기 때문에 여러 가지 방법을 시도해 봐야 할 수도 있습니다.그리고 videOCR이 처음부터 항상 완벽한 결과를 내는 것은 아니지만, 설정을 조정하면 결과물을 더 유용하게 만들 수 있습니다.
요약
- 더 빠른 OCR과 더 안정적인 감지를 위해 GPU 가속을 켜세요.
- 자막 영역 주위에 상자를 그려 인식을 집중시킵니다.
- 인식 결과를 최적화하려면 신뢰 임계값과 프레임 건너뛰기를 조정합니다.
결국, 하드코딩된 자막을 추출하는 것은 100% 자동으로 이루어지는 것이 아니라, 약간의 미세 조정이 필요한 반수동적인 과정에 가깝습니다.하지만 꾸준히 노력하면, 수정 가능하고 번역이나 편집에 바로 사용할 수 있는 꽤 괜찮은 SRT 파일을 얻을 수 있습니다.
마무리
이 과정을 제대로 진행하는 것은 다소 어려울 수 있습니다.여러 번 수정해야 하는 번거로움이 있을 수 있습니다.어떤 영상에서는 OCR의 정확도에 놀라실 수도 있지만, 어떤 영상에서는 나중에 수동으로 정리해야 할 수도 있습니다.그럼에도 불구하고 VideOCR과 같은 도구가 이 정도까지 발전하여 이전에는 불가능했던 작업들을 훨씬 더 쉽게 수행할 수 있게 되었다는 점은 인상적입니다.이 도구가 자막 작업에서 시간과 번거로움을 줄이는 데 도움이 되기를 바랍니다.