HWP 프로그램에는 HWP 파일을 PDF로 내보내는 기능이 있습니다. 하지만 내보내는 포맷이 기록물을 염두에 둔 보존용 포맷 즉 PDF/A 이므로 이 문서를 다시 편집하기 위해서는 일반 PDF 1.7 로 전환하여야 합니다.
하지만 HWP 프로그램에서는 이에대한 언급이 없어서 많은 분들이 아직도 PDF는 편집을 할 수 없는 문서 포맷으로 오해하고 있기도 합니다. 또한 HWP 자매품인 아래아한PDF에는 '편집' 기능이 존재하지 않아서 '편집'이 불가하다는 잘못된 정보를 가지게 할 우려가 있습니다.
자세한 내용 알아보기
아래아한글과 PDF/A 변환 문제
외부에서 받은 PDF 파일을 아래아한글로 역변환하기 위해서는 기본으로 제공하는 '변환' 기능에서 HWP 혹은 HWPX를 선택하여 변환합니다. 변환 품질은 다른 어느 벤더보다 우수한 수준을 유지하고 있습니다.
HWP 역변환에 대해 자세히 알아보기:
PDF의 HWP 파일 지원
장애를 가진 누구라도 정부 문서를 열람하거나 처리하는데 차별이 있어서는 안되는 것이 '장애인차별금지법'의 취지 입니다. 미국에서는 이미 오래전 부터 모든 정부 문서들이 접근성을 준수하도록 하고 그렇지 않은 문서들은 아예 외부에 공개하지 못하게 하고 있습니다.
PDF 문서가 접근성을 지원하는 지는 간단하게 프로그램으로 체크를 하고 수정할 부분을 수정하면 됩니다. 예를 들어 대체텍스트 설명이 누락되었거나 아예 읽을 수 없는 스캔 문서인 경우에는 OCR을 거치도록 합니다. 접근성의 세계 공통 규격은
PDF/UA-1 으로서 이 표준을 준수하도록 PDF 문서가 제작되어야합니다.
이제 우리 정부 문서도 100% PDF/UA-1 을 충족하도록 노력을 기울여야할 것입니다.
접근성 지원에 대해 자세히 알아보기:
PDF의 접근성 지원
PDF 문서안에서 외부에 노출되어서는 안되는 기밀 정보를 블랙마킹하여 공개할 필요가 있습니다. 물론 수동으로 일일이 찾아서 검은 칼라를 씌워도 되지만 완벽하게 처리하는데는 무리가 따릅니다.
패턴을 지정해놓고 민감한 개인정보를 검색해서 자동으로 처리하도록 해주는 기능을 사용하면 한결 안심이 될 것입니다. 이제는 인공지능의 힘을 빌어 보다 완벽하게 보호를 할 수가 있습니다.
특히 민원인들의 민감한 정보가 외부에 노출되지 않도록 각별히 신경을 써야할 때, 자유PDF의 블랙마키 기능이 긴요하게 쓰여질 것입니다.
블랙마킹 기능에 대해
자세히 알아보기:
개인정보 보호를 자동으로 처리하기
자유PDF에는 글로벌하게 가장 성능이 좋다고 평가되는 OCR 프로그램이 내장되어 있습니다. 클라우드에 연결되어 있지 않아도 언어팩만 설치되어 있으면 정확한 OCR이 가능합니다.
여기에 더하여 특정 부분(영역)만을 지정하여 문자 인식할 수 있는 영역OCR 기능이 추가되어 전체 문서중 특정 부분 이미지만을 지정하여 텍스트를 추출할 수 있게 되었습니다.
OCR 자세히 보기
OCR 기능 활용
초거대 언어를 처리하는 LLM의 등장으로 이제 문서처리 시장에 지각변동이 생겼습니다. 그간 시도하지 않았던 내부 문서더미들에서 데이터를 추출하여 사전 훈련시킨 다음 자사 AI 엔진에 적용해야할 필요성이 생겼습니다.
DOCX 문서는 물론이고 HWP 문서, 그리고 PDF와 이미지 문서에서 텍스트 데이타를 추출하는 작성하는 모든 작업이 이제 가능하게 되었습니다.
문서처리 솔루션에 대해 자세히 알아보기:
AI 엔진을 위한 문서분석 솔루션
한국부동산원
지능정보사회진흥원
진도군청
서울시 성동구청
Shared Services Canada
North Carolina State Bureau of Investigation
County of Fairfax
State of Wyoming
Commonwealth of Pennsylvania
Utah County Attorney General