알면 알수록 쓸모 있는 디지털 정보

핸드폰에서 이미지 파일의 텍스트 추출 방법

보리마음 2024. 10. 14. 02:55

때에 따라 사진이나 캡처 이미지에서 텍스트를 추출해야 할 경우가 있습니다. 하지만 PC인지 아니면 모바일 기기인지, 텍스트 추출 프로그램의 성능은 어떤지, 이미지 파일이 정형화된 텍스트인지 손글씨인지, 손글씨의 상태가 어떤지에 따라서도 추출 결과가 크게 달라집니다.
직전 포스팅에서는, PC에서 이미지의 텍스트를 추출하는 대표적인 프로그램과 방법을 소개하고, 이미지 상태에 따른 추출 결과를 자세히 살펴보았습니다. 그 내용은 아래의 링크를 참고하세요.
PC에서 이미지 파일의 텍스트 추출 방법 (tistory.com)
 

삼성 빅스비 / 네이버 스마트 렌즈 / 네이버 파파고 / 구글 렌즈 로고

 
이번 포스팅에서는 핸드폰과 같은 모바일 기기에서 이미지의 텍스트를 추출하는 앱과 추출 방법, 그리고 이미지 상태에 따른 추출 결과에 대해 자세히 알아보겠습니다.

1. 삼성 갤럭시 핸드폰의 앱으로 텍스트 추출

삼성 갤럭시 핸드폰의 ‘카메라’ 앱과 ‘갤러리’ 앱과 ‘빅스비 비전’에서 이미지의 텍스트 추출 방법을 알아보겠습니다. 앱의 버전에 따라 약간의 차이가 있습니다.

1) 카메라 앱 사용

삼성 갤럭시 핸드폰에서 카메라 앱을 사용하여 텍스트를 추출하는 방법은 다음과 같습니다.

 
① 카메라 앱 열기와 ‘눌러서 스캔’ 터치

카메라 앱을 실행하여 텍스트가 포함된 피사체를 비추면 화면에 이미지 주위로 노란색의 경계선과 ‘문서 모양 아이콘’과 ‘눌러서 스캔’이라는 버튼이 생깁니다. 텍스트를 추출하고자 한다면 ‘눌러서 스캔’ 버튼을 터치합니다.
스캔을 하지 않은 일반적인 사진 이미지가 필요하다면 ‘노란색의 문서 모양 아이콘’을 터치하여 ‘문서 스캔 꺼짐’으로 전환하여 촬영 버튼을 누르면 됩니다.
다른 버전에서는 ‘문서 모양 아이콘’과 ‘눌러서 스캔’이라는 버튼 대신에 화면에 ‘노란색 [T] 아이콘’이 나타나면 이를 터치합니다.
 

② 스캔 영역 설정

사각형의 외곽선으로 스캔 영역을 설정하고, [T] 아이콘을 터치합니다. 영역을 스캔한 이미지만 필요한 경우에는 ‘저장’ 버튼을 터치하면 됩니다.
다른 버전에서는 ‘텍스트 추출’ 버튼을 터치합니다. 영역을 스캔한 ‘문서 이미지’만 필요한 경우에는 ‘스캔’ 버튼을 터치하여 사각형의 외곽선으로 스캔 영역을 설정하고, ‘저장’ 버튼을 터치하면 됩니다.
 

③ 텍스트 인식 화면

자동으로 화면 하단에 ‘텍스트’ 버튼이 뜨면서 텍스트가 하이라이트로 강조되며, 추출할 수 있는 상태가 됩니다.
 

④ 복사 및 붙여 넣기

강조된 텍스트를 길게 누르면, 팝업 메뉴가 뜨면서 복사할 영역을 선택할 수 있습니다. 선택한 영역은 푸른 색으로 강조되며, 팝업 메뉴에서 ‘복사’를 터치하여 다른 문서에 ‘붙여 넣기’를 하면 됩니다.
참고로, 아래에 있는 ‘갤러리 앱’ 아이콘은 캘러리에 있는 이미지를 불러와서 텍스트를 추출하는 버튼입니다.

 

2) 갤러리 앱의 [T] 아이콘 사용

일부 앱의 버전에는 이 아이콘 기능이 없습니다.
 

① 텍스트 추출 아이콘 터치

갤러리 앱에서 텍스트 이미지를 열면, 자동으로 우측 하단에 검은색 원 바탕에 노란색 ‘T’ 아이콘이 생성됩니다. 이 아이콘을 터치합니다.
 

② 텍스트 인식 화면

텍스트가 하이라이트로 강조되며, 추출할 수 있는 상태가 되면서 노란색 원 바탕에 검은색 ‘T’ 아이콘으로 전환됩니다.
 

③ 복사 및 붙여 넣기

강조된 텍스트를 길게 누르면, 팝업 메뉴가 뜨면서 복사할 영역을 선택할 수 있습니다. 선택한 영역은 푸른 색으로 강조되며, 팝업 메뉴에서 ‘복사’를 터치하여 다른 문서에 ‘붙여 넣기’를 하면 됩니다.

 

3) 빅스비 비전 사용

① 빅스비 비전 아이콘 터치

갤러리 앱에서 텍스트 이미지를 열면, 자동으로 자동으로 우측 상단에 눈 모양의 ‘빅스비 비전’ 아이콘과, 우측 하단에 검은색 원 바탕에 노란색 ‘T’ 아이콘이 생성됩니다. 이 중에서 ‘빅스비 비전’ 아이콘을 터치합니다.
 

② 텍스트 인식 화면

자동으로 화면 하단에 ‘텍스트’ 버튼이 뜨면서 텍스트가 하이라이트로 강조되며, 추출할 수 있는 상태가 됩니다.
 

③ 복사 및 붙여 넣기

강조된 텍스트를 길게 누르면, 팝업 메뉴가 뜨면서 복사할 영역을 선택할 수 있습니다. 선택한 영역은 푸른 색으로 강조되며, 팝업 메뉴에서 ‘복사’를 터치하여 다른 문서에 ‘붙여 넣기’를 하면 됩니다.
참고로, 우측 하단에 있는 ‘갤러리' 앱 아이콘은 캘러리에 있는 이미지를 불러와서 텍스트를 추출하는 버튼입니다.

 

2. 네이버 핸드폰 앱의 스마트 렌즈로 텍스트 추출

네이버 스마트 렌즈는 네이버 앱에서 제공하는 이미지 기반 검색 도구로서, 스마트폰 카메라로 촬영한 이미지나 기기에 저장된 이미지를 분석하여 관련 정보를 제공합니다. OCR 기능이 있어 사진 속 텍스트를 인식하여 정보를 추출하거나 번역할 수 있습니다.
 

① 네이버 검색창 그린닷

스마트폰에서 네이버 앱의 스마트 렌즈를  실행하려면 네이버 검색창 오른쪽에 있는 하얀 작은 원을 가진 녹색 동그라미(그린닷)를 터치합니다.
 

② 스마트 렌즈 선택

큰 동그라미에 있는 아이콘 중에 렌즈를 터치합니다.
 

③ 이미지 스캔

카메라 화면에서 텍스트를 추출하고 싶은 이미지나 문서를 화면에 띄우고 촬영 버튼을 터치합니다.
 

④ 텍스트 인식 화면

텍스트가 하이라이트로 강조되어 추출할 수 있는 상태가 되면, 전체 선택을 하거나 하이라이트된 부분을 터치하여 텍스트 추출 영역을 설정하면 하단의 창에 텍스트가 추출되고, 복사 버튼을 눌러 다른 문서에 붙여 넣기를 하면 됩니다.
 

⑤ 번역 화면

필요하다면 ④에서 번역 버튼을 누르면 파파고 앱과 연동되어 원본 텍스트와 함께 번역 텍스트가 제시됩니다.

 

3. 구글 핸드폰 앱으로 텍스트 추출

1) ‘구글 렌즈’ 핸드폰 앱 사용

참고로 ‘구글 번역’ 앱에서도 텍스트를 추출할 수 있는데, 바로 ‘구글 렌즈’가 그 기능을 담당하고 있습니다.
‘구글 렌즈(Google Lens)’는 핸드폰 카메라를 이용해 주변의 사물, 텍스트, 장소 등을 인식하고 다양한 정보를 제공하는 인공지능 기반의 이미지 인식 도구입니다. 여기에서는 이미지를 스캔하거나 저장된 이미지를 불러와서 텍스트를 추출하는 순서에 대하여 알아보겠습니다,
 

① 구글 렌즈 앱 설치 및 열기

구글 플레이스토어에서 구글 렌즈(Google Lens) 앱을 설치하고 앱을 실행하여 ‘사용 기기의 갤러리 액세스를 허용’하면 위의 첫 번째 화면이 뜹니다.
텍스트가 포함된 이미지를 촬영하여 추출하려면 카메라 아이콘을 터치합니다.
갤러리에 저장된 이미지에서 텍스트를 추출하려면 아래의 스크린 샷과 이미지에서 선택합니다. (이미지가 선택이 되면 아래의 ②와 ③의 과정은 생략되고, 바로 ④와 ⑤의 과정으로 진행됩니다.)
 

② 검색 아이콘 터치

텍스트가 포함된 피사체를 비추어 화면에 이미지 주위로 둥근 사각 모서리가 생기면 ‘검색 아이콘’을 터치합니다,
좌측의 ‘미리보기 썸네일’은 갤러리에서 이미지를 선택하는 버튼입니다.
 

③ 텍스트 인식 화면

텍스트가 하이라이트로 강조되며, 추출할 수 있는 상태가 됩니다.
 

④ 텍스트 추출 영역 선택

텍스트 인식 영역 중, 텍스트를 복사할 영역을 둥근 사각 모서리로 선택하고 ‘텍스트 선택’ 버튼을 터치합니다.
 

⑤ 복사 및 붙여 넣기

선택한 영역은 푸른 색으로 강조되며, 팝업 메뉴에서 ‘복사’를 터치하여 다른 문서에 ‘붙여 넣기’를 하면 됩니다.
 

2) ‘구글 드라이브’ 핸드폰 앱 사용

구글 드라이브(Google Drive)는 구글이 제공하는 클라우드 스토리지 서비스입니다. 이 서비스를 통해 파일을 온라인으로 저장하고, 어디서나 인터넷 연결만 있으면 접근할 수 있어 공유와 협업 및 안전한 백업을 할 수 있습니다.
핸드폰에서 이 앱을 사용하여 이미지에서 텍스트를 추출하는 방법은 번거롭습니다만, 그 순서는 다음과 같습니다.
 

① 구글 드라이브 앱 첫 화면

구글 드라이브 앱이 기본 내장되어 있습니다. 없다면 구글 플레이스토어에서 구글 드라이브 앱을 설치하고 실행하면 위의 첫 화면이 뜹니다. 구글 드라이브에 저장된 파일 목록과 바로 ‘스캔’할 수 있는 카메라 아이콘과 새 파일을 만들 수 있는 ‘+ 신규’ 버튼이 있습니다.
 

② ‘+ 신규’ 팝업 창

‘+ 신규’ 버튼을 터치하면 팝업창이 뜨는데, 여러 형식의 새 파일을 만들 수 있는 버튼들이 있습니다. 해당 기기의 저장 공간에서 텍스트를 추출할 이미지 파일을 ‘업로드’하거나, 텍스트가 있는 피사체를 ‘스캔’하여 구글 드라이브에 업로드할 수 있습니다.
 

③ 피사체 캡처

카메라 모양의 아이콘인 ‘스캔’을 터치하면 텍스트가 있는 피사체를 비추면 파란색의 사각 영역으로 자동 캡처가 됩니다. 필요에 따라 수동을 선택해도 됩니다, 캡처된 이미지는 ‘완료’와 ‘저장’ 버튼을 터치하면 구글 드라이브에 업로드됩니다.
 

④ PC에서 크롬 브라우저의 구글 드라이브에서 텍스트 추출

자세한 내용은 직전에 포스팅한 'PC에서 이미지 파일의 텍스트 추출 방법'을 참고하세요. 대강의 과정은 다음과 같습니다.

  • 핸드폰 앱의 구글 드라이브에서는 텍스트 추출을 할 수 없으므로, 추출이 가능한 PC로 이동해야 합니다. 
  • 다음은 PC에서 ‘크롬’ 브라우저를 열어서  ‘구글 드라이브’ 프로그램을 실행하면 뜨는 첫 화면에서, 핸드폰에서 업로드한 파일을 찾아 우클릭하여 팝업창의 'Google 문서‘로 연결을 선택하면, 자동으로 이미지와 함께 텍스트를 인식하여 추출해줍니다.
  • 추출한 텍스트에서 필요한 텍스트를 복사하여 다른 문서에 붙여 넣기를 할 수 있습니다.

4. 마이크로소프트 핸드폰 앱으로 텍스트 추출

다음에서 언급될 MS 앱들은 클라우드 기반의 파일 저장 및 공유 서비스인 원드라이브와 연동된 MS 오피스와 밀접한 상호 관련성을 갖고 있다 보니 과정이 중복되는 경우가 많습니다.

1) ’마이크로소프트 렌즈(오피스 렌즈)‘ 핸드폰 앱 사용

마이크로소프트 렌즈(Microsoft Lens) 앱은 종이 문서나 보드나 사진 등을 스마트폰 카메라로 찍어 텍스트를 추출하거나 디지털 파일로 변환합니다.
첫 번째 화면인 ‘문서 캡처’ 창에서 하단 메뉴 바의 ‘문서’ 대신에 ’조치‘로 바꾸어도 텍스트를 추출할 수 있습니다.
여기서는 ‘문서 캡처’ 창에서 텍스트를 추출하는 방법을 알아보겠습니다.
 

① ’문서 캡처‘ 창 열기

구글 플레이스토어에서 ’마이크로소프트 렌즈‘ 앱을 설치하고 실행하면, 첫 번째 화면처럼 ‘문서 캡처’ 할 수 있는 창이 뜨고, 이미지 주변으로 붉은 사각 스캔 경계가 적절하면 촬영 버튼을 터치합니다.
갤러리에서 업로드하여 텍스트를 추출할 경우에는, 좌측 하단의 사진 모양의 아이콘을 터치하여 업로드하고 ‘완료’를 터치하고, 저장 위치를 반드시 Word(OCR 문서)로 설정하여 ‘저장’을 눌러 스캔 이미지와 함께 텍스트를 추출합니다.
 

② 텍스트 추출 영역 설정

스캔한 이미지에는 흰색의 사각형 경계가 생기고, 경계를 움직여서 하이라이트된 추출 영역이 설정되면 ‘확인’ 버튼을 누릅니다.
 

③ 완료

추출 영역을 다시 한번 더 확인하고 ‘완료’ 버튼을 터치합니다.
 

④ 저장 위치 및 텍스트 추출

스캔을 완료한 이미지는 반드시 저장 위치를 ‘Word(OCR 문서)’로 설정해야 텍스트를 추출할 수 있으며, ‘저장’을 터치하면 스캔 이미지와 함께 텍스트가 추출된 Word 파일이 만들어지고, 텍스트를 복사하여 다른 문서에 붙여 넣기를 할 수 있습니다.

 

2) 원노트 핸드폰 앱 사용

① 새 캡처 페이지 만들기

핸드폰에서 원노트 앱을 실행하여 하단의 카메라 아이콘을 터치하여 새 캡처를 할 수 있는 페이지를 만듭니다.
 

② ’조치‘ 창 바꾸기

’문서 캡처‘ 창이 뜨면 하단의 메뉴 바에서 텍스트를 캡처하여 추출하는 ’조치‘로 바꾸고, 이미지 주변으로 붉은 사각 스캔 경계가 적절하면 텍스트 추출 촬영 버튼을 터치합니다.
갤러리에서 업로드하여 텍스트를 추출할 경우에는, 좌측 하단의 사진 모양의 아이콘을 터치하여 업로드하여 아래의 ③과 ④의 과정을 거치면 됩니다.
 

③ 텍스트 추출 영역 설정

스캔한 이미지에는 흰색의 사각형 경계가 생기고, 경계를 움직여서 하이라이트된 추출 영역이 설정되면 ‘계속’ 버튼을 누릅니다.
 

④ 완료 및 복사

텍스트가 추출이 된 상태에서 ‘완료’를 터치하면 원노트의 새 페이지에 추출된 텍스트가 입력되며, ‘복사’를 터치하면 다른 문서에 붙여 넣기를 할 수 있습니다.

 

3) MS 워드(Word) 핸드폰 앱 사용

① 빈 문서 만들기

워드 앱을 실행하여 좌측 상단에 있는 ‘+’ 버튼을 터치하여 빈 문서를 새롭게 만듭니다.
 

② 팝업 메뉴 열기

우측 하단에 있는 삼각형의 팝업 메뉴 버튼을 터치합니다.
 

③ 문서 스캔 터치

‘삽입’ 탭에서 ‘문서 스캔’ 메뉴를 터치합니다.
 

④ 문서 스캔 창

’문서 스캔‘ 창이 뜨면, 이미지 주변으로 파란 사각 스캔 경계가 적절하면 촬영 버튼을 터치합니다.
갤러리에서 업로드하여 텍스트를 추출할 경우에는, 좌측 하단의 사진 모양의 아이콘을 터치하여 업로드하여 아래의 ⑥의 과정을 거치면 됩니다.
 

⑤ 텍스트 추출 영역 설정

스캔한 이미지에는 흰색의 사각형 경계가 생기고, 경계를 움직여서 하이라이트된 추출 영역이 설정되면 ‘확인’ 버튼을 누릅니다.
 

⑥ 완료

추출 영역을 다시 한번 더 확인하고 ‘완료’ 버튼을 터치하면 새 MS 워드(Word) 문서에 텍스트가 추출되어 있습니다.
 

5가지 유형의 이미지 파일

5. 텍스트 추출 결과 비교

핸드폰에서 이미지의 텍스트를 추출하는 프로그램을 비교하기 위해 위의 5가지 유형의 이미지 파일에서 텍스트를 추출한 결과를 제시하겠습니다. 구글 드라이브 앱의 텍스트 추출은 PC로 이동해야 가능하므로 직전 포스팅에서 다룬 결과를 참고하시기 바랍니다.

1) A. 서시(워드) 유형 텍스트 추출 결과

텍스트 이미지가 워드프로세스로 작성된 유형입니다.

  • 갤럭시 ‘카메라’ 앱 - 100% 정확히 텍스트를 추출함.
  • 갤럭시 ‘갤러리’ 앱 - 100% 정확히 텍스트를 추출함.
  • 갤럭시 ‘빅스비 비전’ - 100% 정확히 텍스트를 추출함.
  • 네이버 앱 ‘스마트 렌즈’ - 100% 정확히 텍스트를 추출함.
  • ‘구글 렌즈’ 앱 - 100% 정확히 텍스트를 추출함.
  • ‘마이크로소프트 렌즈’ 앱 - 100% 정확히 텍스트를 추출함.
  • ‘원노트’ 앱 - 100% 정확히 텍스트를 추출함.
  • ‘MS 워드’ 앱 - 100% 정확히 텍스트를 추출함.

2) B. 서시(배경 포함 워드) 유형 텍스트 추출 결과

그림을 배경으로 한, 흰색으로 된 텍스트 이미지가 워드프로세스로 작성된 유형입니다.

  • 갤럭시 ‘카메라’ 앱 - 100% 정확히 텍스트를 추출함.
  • 갤럭시 ‘갤러리’ 앱 - 100% 정확히 텍스트를 추출함.
  • 갤럭시 ‘빅스비 비전’ - 100% 정확히 텍스트를 추출함.
  • 네이버 앱 ‘스마트 렌즈’ - 100% 정확히 텍스트를 추출함.
  • ‘구글 렌즈’ 앱 - 100% 정확히 텍스트를 추출함.
  • ‘마이크로소프트 렌즈’ 앱 - 16자 오타 발생함.
  • ‘원노트’ 앱 - 16자 오타 발생함.
  • ‘MS 워드’ 앱 - 16자 오타 발생함.

3) C. 서시(손글씨) 유형 텍스트 추출 결과

일반인이 쓴 손글씨 이미지입니다.

  • 갤럭시 ‘카메라’ 앱 - 2자 오타 발생함.
  • 갤럭시 ‘갤러리’ 앱 - 2자 오타 발생함.
  • 갤럭시 ‘빅스비 비전’ - 100% 정확히 텍스트를 추출함.
  • 네이버 앱 ‘스마트 렌즈’ - 100% 정확히 텍스트를 추출함.
  • ‘구글 렌즈’ 앱 - 100% 정확히 텍스트를 추출함.
  • ‘마이크로소프트 렌즈’ 앱 - 모든 텍스트를 잘못 추출함.
  • ‘원노트’ 앱 - 모든 텍스트를 잘못 추출함.
  • ‘MS 워드’ 앱 - 모든 텍스트를 잘못 추출함.

D. 서시(세로쓰기 육필 원고) 유형 텍스트 추출 결과

4) D. 서시(세로쓰기 육필 원고) 유형 텍스트 추출 결과

세로 쓰기를 한 윤동주 시인의 육필 원고 이미지입니다. 가장 오타가 많이 발생한 유형입니다.

  • 갤럭시 ‘카메라’ 앱 - 모든 텍스트를 잘못 추출함.
  • 갤럭시 ‘갤러리’ 앱 - 모든 텍스트를 잘못 추출함.
  • 갤럭시 ‘빅스비 비전’ - 10자 오타 발생함.
  • 네이버 앱 ‘스마트 렌즈’ - 4자 오타 발생함. 그러나 시행이 뒤죽박죽임.
  • ‘구글 렌즈’ 앱 - 6자 오타 발생함.
  • ‘마이크로소프트 렌즈’ 앱 - 텍스트 추출 실패함.
  • ‘원노트’ 앱 - 텍스트 추출 실패함.
  • ‘MS 워드’ 앱 – 텍스트 추출 실패함.

5) E. 서시(캘리그라피) 유형 텍스트 추출 결과

서시의 1 ~ 4행만을 캘리그라피로 쓴 이미지입니다.

  • 갤럭시 ‘카메라’ 앱 - 6자 오타 발생함.
  • 갤럭시 ‘갤러리’ 앱 - 6자 오타 발생함.
  • 갤럭시 ‘빅스비 비전’ - 1자 오타 발생함.
  • 네이버 앱 ‘스마트 렌즈’ - 1자 오타 발생함.
  • ‘구글 렌즈’ 앱 - 1자 오타 발생함.
  • ‘마이크로소프트 렌즈’ 앱 - 텍스트 추출 실패함.
  • ‘원노트’ 앱 - 텍스트 추출 실패함.
  • ‘MS 워드’ 앱 - 텍스트 추출 실패함.

6. 맺음말

1) 동일 기술 적용

삼성 갤럭시 폰의 ‘카메라’ 앱과  ‘갤러리’ 앱에서  [T] 아이콘 사용은 동일한 기술이 적용된 것으로 파악됩니다.
‘마이크로소프트 렌즈’ 앱과 ‘원노트’ 앱과 ‘MS 워드’ 앱은 마이크로소프트의 동일한 기술이 적용된 것으로 파악됩니다.
 

2) 결론

텍스트 이미지가 워드프로세스로 작성된, 정형화된 유형은 모든 앱이 완벽하게 텍스트화했습니다. 그러나 손글씨나 세로쓰기 같은 경우에는 갤럭시 ‘빅스비 비전’과 네이버 앱의 ‘스마트 렌즈’와 ‘구글 렌즈’ 앱의 성능은 거의 비슷하게 우수하다는 것을 알 수 있습니다. 이런 점을 감안하여 편리성과 정확성을 고려하여 핸드폰에서 이미지의 텍스트를 추출하는 앱을 선택하는 데 도움이 되었으면 합니다.
 
이상으로 핸드폰에서 이미지 파일의 텍스트 추출 방법을 여러 사례에 적용하고 비교하여 알아보았습니다.