일상 생활 중에 텍스트를 일일이 입력하는 것이 효율성이 떨어질 수 있어, 사진이나 캡처 이미지 등에서 텍스트를 추출해야 할 필요성이 많습니다. 그런데 사용하는 디바이스가 PC인지 아니면 핸드폰과 같은 모바일 기기인지, 텍스트 추출 프로그램의 성능은 어느 정도인지, 이미지 파일이 워드처럼 정형화된 텍스트 이미지인지 아니면 손글씨인지, 손글씨라도 날려 쓴 정도에 따라 텍스트 추출 결과가 많이 차이가 납니다.
핸드폰과 같은 모바일 기기에서 이미지 파일의 텍스트를 추출하는 대표적인 앱과 추출 방법, 이미지 상태에 따른 추출 결과는 아래의 링크를 참고하세요.
핸드폰에서 이미지의 텍스트 추출 방법 (tistory.com)
이번 포스팅에서는 우선 PC에서 이미지 파일의 텍스트를 추출하는 대표적인 프로그램 소개와 추출 방법, 사진이나 캡처 이미지 파일 등의 이미지 상태에 따른 추출 결과에 대하여 자세히 알아보겠습니다.

1. 광학 문자 인식 기술(OCR)
광학 문자 인식(Optical Character Recognition) 기술은 이미지나 스캔한 문서에서 문자와 텍스트를 인식하고 이를 디지털 텍스트로 변환하는 기술입니다. OCR은 주로 다음과 같은 과정으로 이루어집니다.
- 이미지 캡처 - 문서나 이미지를 스캐너나 카메라를 사용하여 디지털 형식으로 캡처합니다.
- 전처리 - 이미지의 품질을 향상시키기 위해 노이즈 제거, 대비 조정, 회전 및 기울기 보정 등의 전처리 작업을 수행합니다. 이 단계는 인식 정확도를 높이는 데 중요합니다.
- 문자 인식 - 전처리된 이미지에서 각 문자의 형태를 분석하여 어떤 문자에 해당하는지를 식별합니다. 이 과정에서는 패턴 인식 알고리즘이 사용되며, 기계 학습(머신 러닝) 및 딥 러닝 기술이 적용될 수 있습니다.
- 텍스트 출력 - 인식된 문자를 디지털 텍스트 형태로 변환하여 사용자가 읽거나 편집할 수 있도록 합니다.

2. 윈도우에 내장된 Microsoft 앱을 사용한 텍스트 추출 방법
1) 윈도우에 기본 장착된 MS ‘사진 앱’으로 텍스트 추출
노트북과 같은 PC에 내장된 카메라로 이미지를 찍는 것은 그 자체로 매우 불편하고 제약이 많아, 보통 핸드폰 카메라로 찍어서 ‘카톡’ 등으로 공유한 후 노트북과 같은 PC에 다운로드하여 저장하는 것이 보편적인 방식입니다. 이렇게 저장된 이미지에서 텍스트를 추출하는 방법을 알아보겠습니다.
윈도우 사진 앱에서 텍스트를 추출하는 순서는 다음과 같습니다.
① 이미지 열기
- 텍스트를 추출하고 싶은 이미지를 더블클릭하여 사진 앱으로 엽니다.
- 상단에 있는 아이콘 메뉴 중에 ‘3점(자세히 보기)’을 클릭합니다.
- 팝업 메뉴 중에 ‘Bing을 사용한 비주얼 검색’을 클릭합니다.
② ‘비주얼 검색 범위’ 설정과 ‘Tt 텍스트’ 실행
- ‘비주얼 검색' 범위 설정 버튼을 눌러서 텍스트를 추출할 범위를 드래그하여 설정하면, 해당 영역의 텍스트가 하이라이트됩니다.
- ‘Tt 텍스트’ 버튼을 눌러서 텍스트를 추출합니다.
③ ‘텍스트 복사’
- 하이라이트된 텍스트 추출 범위가 오른쪽 창에서 텍스트로 추출되어 나타납니다.
- ‘텍스트 복사’ 버튼을 눌러서 디지털화된 텍스트를 복사하여 다른 문서에 붙여넣기를 하면 됩니다.
④ Bing 이미지 검색
위에서 언급한 MS의 윈도우 사진 앱의 텍스트 추출은 MS의 Bing 이미지 검색 기술을 사용한 것이므로 Microsoft Edge 브라우저에서 ‘Bing 검색 엔진’의 ‘Bing 이미지 검색’을 사용하여도 동일한 결과를 얻을 수 있습니다.
- 이미지 검색 아이콘을 클릭합니다.
- 이미지를 끌어 넣거나 찾아보기를 클릭하거나, 이미지나 또는 URL 붙여넣기를 사용하거나, 사진 찍기를 사용할 수도 있습니다.
- 그리고 위의 ②와 ③의 과정을 거치면 됩니다.
※ 참고로 ‘Bing AI’인 ‘코파일럿’과의 채팅으로도 텍스트를 추출할 수 있습니다. 이미지를 업로드하고 ‘이 이미지에서 텍스트를 추출해줘’라고 요청하면 Bing AI가 거의 정확하게 텍스트를 추출해줍니다.

2) 윈도우에 기본 장착된 MS ‘캡처 도구’로 텍스트 추출
※ 캡처 도구의 전반적이고 구체적인 사용 방법을 알고 싶은 분은 아래의 링크를 참조하세요.
윈도우 11의 ‘캡처 도구’ 앱 사용 방법 (tistory.com)
현재 열려 있는 페이지나 이미지, 웹 화면 등에서 즉시 이미지에 있는 텍스트를 추출하고자 할 때 캡처 도구를 활용하면 매우 편리합니다. Windows에 기본으로 장착된 MS '캡처 도구'를 사용하여 이미지에서 텍스트를 추출하는 방법은 다음과 같습니다.
① 캡처 도구 열기
캡처할 이미지나 웹 화면 등을 띄워 놓고 ‘캡처 도구’를 실행시킵니다.
② 이미지 선택
추출하고자 하는 영역(직사각형 혹은 전체화면 등)을 선택하면 캡처 도구 편집화면이 생성됩니다. 편집 화면의 상단 가운데에 있는 아이콘 중에서 ‘텍스트 작업’을 클릭합니다.
③ 텍스트 추출
이미지에서 텍스트 부분이 하이라이트되면 ‘모든 텍스트 복사’ 버튼이 생깁니다. 이 버튼은 이미지에서 추출된 모든 텍스트를 복사할 수 있으며, 일부분만 복사할 경우에는 하이라이트가 된 이미지에서 마우스로 드래그한 후에 우클릭하여 팝업 메뉴에서 ‘텍스트 복사’를 클릭하면 됩니다. 이후 필요한 문서에 붙여넣기를 하면 됩니다.

3) 윈도우에 기본 장착된 MS ‘원노트 앱’으로 텍스트 추출
윈도우 10과 11에 기본으로 장착된 MS ‘원노트 앱’을 사용하여 이미지에서 텍스트를 추출하는 방법은 다음과 같습니다.
① 화면 캡처 또는 파일에서 불러오기
OneNote 앱을 실행하여 해당 전자필기장의 섹션에 새로운 페이지를 추가합니다.
상단의 탭 메뉴에서 삽입을 클릭하고 팝업 메뉴 중에 화면 캡처를 선택하면, 직전 창에서 띄워 놓은 페이지나 이미지, 웹 화면 등에서 즉시 이미지 캡처할 수 있는 화면이 뜨고, 해당 영역을 캡처하면 원노트의 새로운 페이지에 이미지가 삽입됩니다. 또는 그림을 클릭하여 팝업 메뉴의 ‘파일에서’를 선택하여 저장된 이미지를 불러와서 삽입해도 됩니다. ‘카메라에서’라는 항목이 있지만 PC에서는 사용에 불편이 많습니다.
② 텍스트 추출
캡처한 이미지나 불러온 이미지에서 마우스를 우클릭하여 팝업 메뉴가 뜨면 ‘그림에서 텍스트 복사’를 클릭합니다.
③ 붙여 넣기
이미지가 삽입된 바로 그 페이지에서 붙여 넣고 싶은 위치를 선택하거나, 다른 문서로 이동하여 마우스를 우클릭하여 ‘붙여넣기 옵션’ 중에 적당한 것을 선택하여 붙여 넣으면 됩니다.
④ 디지털 텍스트화
원노트에서 이미지가 삽입된 바로 그 페이지 우측에 붙여 넣은 결과물입니다. 추출한 텍스트에서 필요한 텍스트를 복사하여 다른 문서에 붙여 넣기를 할 수 있습니다.

3. 구글 크롬 브라우저 프로그램을 사용한 텍스트 추출 방법
1) 구글 드라이브를 사용한 텍스트 추출
① 크롬 브라우저에서 구글 드라이브 열기
크롬 브라우저를 열어 우측 상단의 구글 앱 아이콘(9점)을 클릭하여 팝업 창에서 드라이브 아이콘을 클릭합니다.
② 구글 드라이브에 업로드 및 Google 문서 연결
구글 드라이브에 이미지 파일을 업로드한 후, 해당 파일을 우클릭 하여 팝업창에서 'Google 문서‘로 연결을 선택합니다.
③ 이미지에서 택스트 추출
이미지와 함께 텍스트를 인식하여 추출해줍니다. 추출한 텍스트에서 필요한 텍스트를 복사하여 다른 문서에 붙여 넣기를 할 수 있습니다.
2) 구글 렌즈를 사용한 텍스트 추출
이미지에서 텍스트를 추출하는 순서는 다음과 같습니다.

① 크롬 브라우저에서 구글 렌즈 열기
크롬 브라우저를 열어, 구글 검색란 우측에 있는 카메라 모양의 아이콘(이미지 검색)을 클릭합니다.

② 이미지 업로드 창
’렌즈로 이미지 검색‘ 창이 열리면 이미지를 드래그하거나 이미지 파일을 업로드하거나 이미지 링크를 붙여 넣습니다.


③ 텍스트 선택
이미지가 하이라이트되고, 아래의 선택 메뉴 중에 ’텍스트‘를 선택하여 ’모든 텍스트 선택‘을 할 수도 있고, 마우스로 필요한 영역을 드래그할 수도 있습니다.
④ 텍스트 복사
선택한 영역은 푸른색으로 강조되고, ’복사‘ 버튼과 ’텍스트 복사‘ 버튼이 만들어지며 이것을 클릭하여 필요한 문서에 붙여 넣기를 하면 됩니다.

4. 텍스트 추출 결과 비교
PC에서 이미지 파일의 텍스트를 추출하는 프로그램을 비교하기 위해 위의 5가지 유형의 이미지 파일에서 텍스트를 추출한 결과를 제시하겠습니다. 이것을 바탕으로 자신에게 맞는 텍스트 추출 프로그램을 선택하는 데 도움이 되었으면 합니다.
1) A. 서시(워드) 유형 텍스트 추출 결과
텍스트 이미지가 워드프로세스로 작성된 유형입니다.
- MS ‘사진 앱’ - 100% 정확히 텍스트를 추출함.
- MS ‘캡처 도구’ - 100% 정확히 텍스트를 추출함.
- MS ‘원노트 앱’ - 100% 정확히 텍스트를 추출함.
- 구글 드라이브 - 100% 정확히 텍스트를 추출함.
- 구글 렌즈 - 100% 정확히 텍스트를 추출함.
2) B. 서시(배경 포함 워드) 유형 텍스트 추출 결과
그림을 배경으로 한, 흰색으로 된 텍스트 이미지가 워드프로세스로 작성된 유형입니다.
- MS ‘사진 앱’ - 100% 정확히 텍스트를 추출함.
- MS ‘캡처 도구’ - 1자 오타 발생함.
- MS ‘원노트 앱’ - 7자 오타 발생함
- 구글 드라이브 - 100% 정확히 텍스트를 추출함.
- 구글 렌즈 - 100% 정확히 텍스트를 추출함.
3) C. 서시(손글씨) 유형 텍스트 추출 결과
일반인이 쓴 손글씨 이미지입니다.
- MS ‘사진 앱’ - 1자 오타 발생함.
- MS ‘캡처 도구’ - 36자 오타 발생함.
- MS ‘원노트 앱’ - 모든 텍스트를 잘못 추출함.
- 구글 드라이브 - 100% 정확히 텍스트를 추출함.
- 구글 렌즈 - 100% 정확히 텍스트를 추출함.

4) D. 서시(세로쓰기 육필 원고) 유형 텍스트 추출 결과
세로 쓰기를 한 윤동주 시인의 육필 원고 이미지입니다. 가장 오타가 많이 발생한 유형입니다.
- MS ‘사진 앱’ - 텍스트 추출 실패함.
- MS ‘캡처 도구’ - 모든 텍스트를 잘못 추출함.
- MS ‘원노트 앱’ - 모든 텍스트를 잘못 추출함.
- 구글 드라이브 - 14자 오타 발생함.
- 구글 렌즈 - 6자 오타 발생함.
5) E. 서시(캘리그라피) 유형 텍스트 추출 결과
서시의 1 ~ 4행만을 캘리그라피로 쓴 이미지입니다.
- MS ‘사진 앱’ - 14자 오타 발생함.
- MS ‘캡처 도구’ - 16자 오타 발생함.
- MS ‘원노트 앱’ - 모든 텍스트를 잘못 추출함.
- 구글 드라이브 - 1자 오타 발생함.
- 구글 렌즈 - 1자 오타 발생함.
결론적으로 텍스트 이미지가 워드프로세스로 작성된, 정형화된 유형은 윈도우에 기본으로 장착된 MS 프로그램 앱이나 구글 프로그램이나 큰 차이가 발생하지 않았습니다. 그러나 손글씨나 세로쓰기 같은 경우에는 구글 프로그램이 우수하다는 것을 알 수 있습니다. 이런 점을 감안하여 편리성과 정확성을 고려하여 이미지의 텍스트를 추출하는 프로그램을 선택하여 익숙하게 사용하시기 바랍니다.
이상으로 PC에서 이미지 파일의 텍스트 추출 방법을 여러 사례에 적용하고 비교하여 알아보았습니다.
'알면 알수록 쓸모 있는 디지털 정보' 카테고리의 다른 글
파파고 번역기 웹버전 사용법 (14) | 2024.10.20 |
---|---|
핸드폰에서 이미지 파일의 텍스트 추출 방법 (1) | 2024.10.14 |
삼성 갤럭시 핸드폰 카메라 기능과 사용법(2/2회) (11) | 2024.10.06 |
삼성 갤럭시 핸드폰 카메라 기능과 사용법(1/2회) (5) | 2024.10.05 |
MS 원노트의 PC 전용 앱 버전 사용법 (4) | 2024.10.03 |