단순 텍스트 추출 넘어 표·차트·문서구조까지 정밀 인식
AI 에이전트에 활용 가능한 고품질 지식 DB 구축 핵심 역할
전국 최초의 광역지자체 생성형 AI 도입 사례
공공 부문 문서 처리 자동화 확산 기대
[이슈앤비즈 김하성 기자]공공·기업용 시각지능 AI 통합 솔루션 기업 한국딥러닝은 경기도청의 '2025년 생성형 AI 플랫폼 구축사업'에 VLM 기반 문서 구조 분석 솔루션 'DEEP Parser'을 공급했다고 26일 밝혔다.
이번 프로젝트는 AI·빅데이터 및 클라우드 전문기업 엠티데이타와 협력해 진행된다.
총 131억 원 규모의 이번 사업은 전국 광역지자체 행정업무에 생성형 AI 기술을 본격 적용하는 사례다. 약 11개월간 진행되는 프로젝트를 통해 경기도청은 문서작성, 회의관리, 정보검색 등 실 무 중심의 AI 업무 지원 체계를 구축할 예정이다.
이번 사업의 핵심은 경기도청 문서의 90% 이상을 차지하는 HWP, PDF 등 AI가 직접 활용하기 어려운 문서 형식을 구조화된 데이터로 변환하는 것이다. 이를 위해 DEEP Parser는 행정문서·정책자료 등을 정확히 디지털화하고 구조화해 문서작성·회의관리·정보검색 등 실무 AI 업무의 기반 데이 터를 제공하는 역할을 담당한다.
기존 OCR 솔루션이 단순한 텍스트 추출에 그쳤다면, DEEP Parser는 VLM(Vision Language Model. 영상언어모델) 기술을 활용해 문서의 의미와 구조까지 동시에 분석한다. 한국딥러닝의 시각지능 기술을 통해 표, 차트, 계층구조, 병합 셀까지 정밀 인식하고, AI 에이전트가 활용할 수 있는 고품질 지식 데이터 베이스를 구축한다.
이를 통해 ▲HWP, PDF 등 비정형 문서의 정밀 디지털화 및 구조화▲정책 문서·보고서의 정보 추 출 및 정제▲회의록의 문단 요약과 주요 키포인트 자동 추출▲공무원 대상 문서 검색·질의응답 AI 서비스 등을 실현할 수 있다.
DEEP Parser는 한국딥러닝이 지난 5년간 대규모의 텍스트·이미지 문서를 학습한 자체 VLM 모델을 기반으로 개발됐다. 별도의 데이터 수집이나 라벨링 없이도 다양한 문서 유형을 즉시 처리할 수 있는 Document AI로 초기 도입 부담이 거의 없다는 것이 장점이다. 자체 데이터셋 OCR 테스트에서 문서 항목 인식 정확도 97.3%, 데이터 추출 정확도 96%를 기록했다.
한국딥러닝 김지현 대표는 "경기도청 생성형 AI 플랫폼 프로젝트를 통해 공공 부문의 디지털 전 환에 실질적으로 기여할 수 있게 되어 의미가 크다"며 "DEEP Parser의 문서 구조 분석 기술은 단 순한 문서 인식을 넘어 AI가 진정으로 이해하고 활용할 수 있는 지식 데이터 베이스 구축의 핵심이다. 앞으로도 생성형 AI 생태계 발전에 기여하겠다"고 밝혔다.
