검색결과 총 7건
-
파수 AI, N2SF 등급 분류 대응 'FDR' 업데이트 출시
[경제일보] 파수 AI가 국가 망 보안체계(N2SF) 전환에 대응하는 데이터 식별·분류 솔루션을 고도화했다. 공공기관이 AI와 클라우드를 활용하기 위해서는 데이터의 중요도와 민감도를 먼저 식별하고 등급별 보안 정책을 적용해야 하는 만큼, 데이터 분류 자동화가 공공 보안 시장의 핵심 과제로 떠오르고 있다. 파수 AI는 데이터 식별·분류 솔루션 ‘파수 데이터 레이더(Fasoo Data Radar, FDR)’의 신규 업데이트 버전을 출시하고 공공기관의 N2SF 전환 지원을 강화한다고 밝혔다. N2SF는 기존 공공부문 망분리 정책을 보완·전환하기 위해 추진되는 새로운 보안 프레임워크다. AI와 클라우드 등 신기술을 안전하게 활용할 수 있도록 데이터와 시스템을 중요도·민감도에 따라 기밀(Classified), 민감(Sensitive), 공개(Open) 등급으로 구분하고, 등급별로 차등화된 보안대책을 적용하는 것이 핵심이다. 파수는 지난해 ‘범정부 초거대 AI 공통기반 대상 국가 망 보안체계 시범 실증’에 참여해 N2SF의 데이터 식별·분류·통제 부문을 맡은 바 있다. 이번 FDR 업데이트는 N2SF 전환의 출발점인 데이터 식별과 등급 분류 기능을 강화한 것이 특징이다. FDR은 윈도, 맥, 파일서버 등 다양한 저장소에 흩어진 데이터를 파악하고 민감정보 포함 여부를 자동으로 탐지·분류하는 솔루션이다. 이후 분류 결과에 따라 암호화, 레이블링, 격리, 권한 회수, 파기 등 후속 조치를 적용할 수 있다. 새 버전에는 OCR 기능이 추가됐다. 일반 이미지 파일이나 문서 안에 삽입된 이미지에서 텍스트를 추출해 민감정보 포함 여부를 검사한다. 기존 텍스트 기반 탐지로는 확인하기 어려웠던 스캔본, 캡처 이미지, 이미지형 PDF 등에 포함된 개인정보와 민감정보까지 식별할 수 있다는 설명이다. 문서 작업 중 등급 인식을 돕는 기능도 강화됐다. 한글, MS 오피스, PDF 등 주요 문서 작업 환경에서 기밀·민감·공개 분류 라벨을 화면에 지속적으로 표시해 사용자가 해당 문서의 보안 등급을 직관적으로 확인할 수 있도록 했다. 공공기관 업무 환경에서는 문서 작성·검토·공유 단계마다 등급 인식이 필요한 만큼, 사용자 실수로 인한 자료 유출을 줄이는 효과가 기대된다. AI 기반 문맥 분석 기능도 더했다. FDR은 파수 AI의 AI 기반 개인정보보호 솔루션 ‘AI-R Privacy’와 연동해 복잡한 문장 속 개인정보를 탐지하고 마스킹할 수 있다. 단순 키워드나 정규식 기반 탐지를 넘어 자연어처리와 딥러닝 기술로 문맥을 해석해 민감정보를 찾아내는 방식이다. 이번 업데이트는 공공기관의 N2SF 전환 수요를 정면으로 겨냥한 것으로 풀이된다. 기존 망분리 체계에서는 내부망과 외부망의 물리적·논리적 분리가 보안의 중심이었다. 그러나 생성형 AI와 클라우드 서비스를 공공 업무에 활용하려면 모든 데이터를 같은 방식으로 막는 구조만으로는 한계가 있다. 어떤 데이터가 기밀이고, 어떤 데이터가 민감하며, 어떤 데이터는 공개 가능한지를 먼저 구분해야 AI 활용과 보안 통제를 동시에 설계할 수 있다. 특히 초거대 AI 기반 행정서비스가 확산되면 데이터 분류의 중요성은 더 커진다. AI 모델에 입력되는 문서와 데이터셋에 개인정보, 내부 정책 문건, 보안 정보가 섞여 있을 경우 유출이나 오남용 위험이 발생할 수 있다. N2SF가 데이터 등급 분류를 전제로 하는 이유도 여기에 있다. 관련 시범 실증 사업 역시 공공부문에 적합한 AI 보안 적용 모델과 확산 방안을 마련하기 위해 추진됐다. 업계에서는 N2SF 전환 과정에서 데이터 보안 시장이 확대될 것으로 보고 있다. 공공기관이 AI와 클라우드를 도입하려면 데이터 발견, 분류, 권한 관리, 암호화, 반출 통제, 로그 추적, 개인정보 마스킹까지 전 주기 관리 체계가 필요하다. 이 가운데 데이터 식별·분류는 모든 보안 정책의 출발점이다. 분류가 부정확하면 과도한 차단으로 업무 효율이 떨어지거나, 반대로 민감정보가 낮은 등급으로 처리돼 유출 위험이 커질 수 있다. 파수 AI는 FDR 외에도 데이터 보안 솔루션 ‘파수 엔터프라이즈 DRM(Fasoo Enterprise DRM, FED)’과 AI 활용을 위한 민감정보 관리 솔루션 ‘AI-R DLP’ 등을 통해 N2SF 대응 포트폴리오를 강화하고 있다. 데이터 등급을 식별한 뒤 문서 암호화와 접근권한 통제, AI 입력 데이터 차단·마스킹까지 연결하는 구조를 구축하겠다는 전략이다. 향후 관건은 실제 공공기관 업무 환경에서의 적용성과 정확도다. 공공기관 데이터는 문서 형식이 다양하고 오래된 스캔본이나 이미지형 자료, 비정형 문서가 많다. OCR과 AI 문맥 분석 기능이 현장 데이터에서 얼마나 높은 탐지율과 낮은 오탐률을 보이느냐가 솔루션 경쟁력을 가를 전망이다. 또 N2SF 전환이 공공기관 전체로 확산되면 보안 등급 분류 기준의 표준화도 중요해진다. 기관마다 다른 방식으로 기밀·민감·공개 등급을 적용하면 시스템 연계와 클라우드 활용 과정에서 혼선이 생길 수 있다. 데이터 분류 솔루션은 기술 기능뿐 아니라 정부 보안 기준과 기관별 업무 특성을 반영한 정책 설계 역량까지 요구받게 된다. 고동현 파수 AI 상무는 “파수 AI는 FDR 외에도 FED와 AI-R DLP 등 N2SF를 위한 포트폴리오를 지속적으로 강화하고 있다”며 “N2SF의 시작이 등급 분류인 만큼 FDR을 통해 공공기관의 디지털 혁신을 지원할 것”이라고 말했다. 이번 FDR 업데이트는 공공 AI 확산 국면에서 보안의 무게중심이 ‘망을 나누는 방식’에서 ‘데이터를 이해하고 통제하는 방식’으로 이동하고 있음을 보여준다. AI와 클라우드 활용이 공공 업무의 효율성을 높일 수 있다면, 그 전제는 데이터가 어디에 있고 어떤 등급인지 정확히 아는 것이다. 파수 AI가 N2SF 전환 시장에서 데이터 분류·통제 솔루션을 앞세워 공공 보안 수요를 얼마나 확보할지 주목된다.
2026-05-20 16:38:59
-
-
IBM, 마스터스와 손잡고 스포츠 AI 확대…데이터 분석 시장 겨냥
[경제일보] 스포츠 산업 전반에 인공지능(AI) 도입이 확산되면서 데이터 기반 경기 분석과 팬 경험 혁신 경쟁이 본격화되고 있다. 단순 중계와 하이라이트 제공을 넘어 생성형 AI와 에이전트형 AI를 활용해 경기 흐름을 분석하고 맞춤형 정보를 제공하는 '스포츠 AI'가 새로운 산업 영역으로 부상하는 것으로 분석된다. 8일 IBM은 골프 메이저 대회인 마스터스 토너먼트와 협력해 AI 기반 디지털 팬 경험 기능을 확대한다고 밝혔다. IBM은 마스터스 디지털 플랫폼에 생성형 AI 기반 분석 기능을 적용해 전 세계 골프 팬들에게 데이터 기반 경기 분석과 맞춤형 콘텐츠를 제공할 계획이다. IBM은 이번 협력의 핵심으로 AI 기반 영상 분석 기능인 '마스터스 볼트 서치'를 꼽았다. 해당 기능은 50년 이상 축적된 마스터스 경기 영상 아카이브를 기반으로 팬들이 자연어로 검색하면 원하는 장면을 즉시 찾아 제공하는 방식으로 설계됐다. 영상 분석에는 광학 문자 인식(OCR), 음성 텍스트 변환, 장면 감지 기술 등이 활용되며 지난 1968년까지의 경기 데이터와 지난 2015년 이후 개별 샷 데이터 등 방대한 메타데이터를 통해 AI가 분석한다. '홀 인사이트' 기능도 강화됐다. AI는 선수의 샷 위치를 실시간으로 분석하고 과거 데이터와 비교해 버디, 파, 보기 등 스코어 확률을 산출한다. 이를 통해 팬들은 단순 결과뿐만 아니라 선수들의 전략적 판단 과정까지 경기 상황에 대한 데이터 기반 분석이 가능해질 전망이다. 이번 기능에는 IBM의 기업용 AI 플랫폼인 '왓슨x'와 소형 언어 모델 그래니티가 적용됐다. AI 에이전트 기반 자동 분석 기능을 지원하는 '왓슨x 오케스트레이트'가 함께 활용되며 데이터 분석 자동화가 강화된 것으로 알려졌다. 스포츠 산업에서 AI 기반 분석 기술은 새로운 경쟁 영역으로 빠르게 확대되고 있다. 네이버 등 클라우드 기업들은 경기 데이터 분석, 팬 경험 개인화, 영상 자동 생성 등 다양한 영역에서 AI 기술을 적용하고 있다. 스포츠 산업은 실시간 데이터와 글로벌 팬 기반을 동시에 확보할 수 있어 AI 기술 실증과 확산에 유리한 분야로 평가된다. 특히 스포츠 데이터 분석 기술은 기업용 데이터 분석 시장으로 확장 가능성이 높다는 점에서 주목받고 있다. 경기 데이터 분석에 활용된 AI 기술은 금융, 유통, 제조 등 다양한 산업의 데이터 분석에도 적용할 수 있다. IBM 역시 스포츠 플랫폼을 AI 기술 검증 환경으로 활용해 기업 고객 대상 AI 솔루션 확대에 나서는 전략으로 풀이된다. IBM은 스포츠 및 엔터테인먼트 분야 협력을 지속적으로 확대하고 있다. '스쿠데리아 페라리 HP', '윔블던', 'US 오픈', 'ESPN 판타지 풋볼', '그래미 어워즈', 'UFC' 등 다양한 글로벌 콘텐츠 플랫폼과 협력하며 AI 기반 디지털 경험 구축을 추진하고 있는 것으로 알려졌다. IBM의 스포츠 및 엔터테인먼트 분야 협력은 단순 이벤트 지원을 넘어 AI 하이브리드 클라우드와 데이터 분석 플랫폼 확산 전략의 일환으로 풀이된다. 스포츠와 엔터테인먼트 산업을 통해 AI 기술 활용 사례를 확보하고 이를 기업 시장으로 확장하는 구조다. 스포츠 AI 시장이 빠르게 성장하면서 향후 AI 에이전트 기반 데이터 분석 경쟁도 더욱 치열해질 전망이다. IBM도 스포츠 산업을 중심으로 AI 플랫폼 활용 범위를 넓히며 새로운 데이터 기반 산업 경쟁에 대응할 것으로 분석된다. 조나단 아다셰크 IBM 마케팅 및 커뮤니케이션 담당 수석 부사장은 "마스터스 볼트 서치와 홀 인사이트의 이번 업데이트는 생성형 AI와 에이전틱 AI가 방대한 데이터를 어떻게 의미 있는 인사이트로 전환할 수 있는지를 보여준다"며 "이는 실시간으로 단 한 번의 샷이 갖는 의미를 이해하고자 하는 골프 팬뿐 아니라 수백만 건의 거래 데이터를 분석해 패턴을 도출하고 의사결정을 내리는 금융 기관에도 동일하게 적용될 수 있다"고 말했다.
2026-04-08 14:49:33
-
오피스 기업에서 AI 인프라로…한컴, PDF 기술로 깃허브 트렌딩 1위
[경제일보] 한글과컴퓨터가 인공지능(AI) 개발 과정에서 핵심 병목으로 지목돼 온 데이터 전처리 영역에서 존재감을 드러내고 있다. 한글과컴퓨터가 공개한 PDF 데이터 추출 오픈소스가 글로벌 개발자 커뮤니티에서 빠르게 확산되며 자사의 기술 경쟁력을 입증하고 있다. 23일 한글과컴퓨터는 자사의 오픈소스 프로젝트 '오픈데이터로더 PDF v2.0'이 오픈소스 개발 플랫폼 깃허브에서 전체 개발 언어 기준 트렌딩 1위를 기록했다고 밝혔다. 공개 직후 하루 만에 1800개 이상의 스타가 증가했고 오후 2시 기준 누적 스타 수는 8400개, 포크 수는 500개를 넘어섰다. 이번 성과는 단순한 인기 지표를 넘어 AI 개발 생태계에서 해결되지 않은 문제를 겨냥했다는 점에서 의미가 큰 것으로 분석된다. PDF는 전 세계에서 가장 널리 활용되는 문서 형식 중 하나로 기업 문서와 보고서, 연구 자료 등 주요 데이터가 집중된 포맷이다. 다만 텍스트와 표, 이미지가 혼합된 복잡한 구조로 인해 AI가 바로 활용할 수 있는 형태로 변환하기 어려워 데이터 전처리 단계의 대표적인 병목으로 꼽혀 왔다. 이에 한글과컴퓨터는 해당 문제를 해결하기 위해 AI 기반 분석 방식과 규칙 기반 직접 추출 방식을 결합한 하이브리드 엔진을 자사의 오픈데이터로더 PDF v2.0에 적용했다. 특히 외부 서버로 데이터를 전송하지 않고 로컬 환경에서 처리할 수 있도록 설계해 보안성을 높였고 처리 속도를 유지하도록 설계했다. 또한 광학문자인식(OCR), 표·수식 추출, 차트 분석 등 다양한 AI 기능을 기본 제공해 복합 문서 처리 범위를 넓혔다. 성능 측면에서도 경쟁력을 강조하고 있다. 자체 벤치마크 테스트에서 읽기 순서, 표 구조 인식, 제목 추출 등 주요 항목 전반에서 기존 오픈소스 대비 높은 정확도를 기록했으며 테스트 데이터와 재현 코드를 함께 공개해 결과의 신뢰성을 높였다. 해당 방식은 단순 기능 제공을 넘어 기술 검증 과정까지 공개해 글로벌 개발자 커뮤니티의 신뢰를 확보하려는 전략으로 풀이된다. 한글과컴퓨터는 200개의 실제 PDF 파일(다단 구성 문서 및 과학 논문 포함)을 기반으로 한 자체 벤치마크에서 전체 정확도 0.90, 표 추출 정확도 0.93을 기록하며 복잡한 문서 구조에서도 높은 인식 성능을 보였다고 설명했다. 특히 복잡한 페이지에 대응하기 위해 규칙 기반의 결정론적 로컬 모드와 AI 기반 하이브리드 모드를 병행 적용한 점이 성능 개선의 핵심으로 꼽혔다. 스캔 문서 처리 기능도 강화됐다. 80개 이상의 언어를 지원하는 내장 OCR 기능이 하이브리드 모드에서 동작하며 300DPI 이상의 저해상도 스캔 파일에서도 안정적인 텍스트 추출이 가능하다. 또한 테두리가 없는 표나 복잡한 레이아웃, LaTeX 수식, 이미지 및 차트까지 함께 인식하고 구조화할 수 있어 비정형 데이터 처리 범위를 확장했다. 오픈소스 정책 역시 확산을 염두에 둔 선택으로 해석된다. 해당 프로젝트에는 상업적 활용이 가능한 아파치 2.0 라이선스가 적용돼 기업과 개발자가 별도 제약 없이 서비스에 도입할 수 있도록 구성됐다. 이에 초기 사용자 기반을 빠르게 확보하고 생태계를 확장하려는 의도로 풀이된다. AI 개발 생태계와의 연계도 강화되고 있다. 앞서 오픈데이터로더 PDF는 지난해 글로벌 AI 개발 프레임워크 랭체인의 공식 구성요소로 등록됐으며 올해에는 '라마인덱스', '제미나이 CLI' 등 주요 AI 프레임워크와의 연동 확대가 예정돼 있다. 다양한 AI 개발 도구와의 호환성을 확보함으로써 데이터 전처리부터 모델 활용까지 이어지는 흐름 속에 자연스럽게 편입시키겠다는 전략이다. 또한 AI 에이전트 환경을 겨냥한 기능 확장도 추진된다. 한글과컴퓨터는 모델 간 맥락을 연결하는 'MCP' 기능을 도입해 AI가 문서 데이터를 보다 효율적으로 이해하고 활용할 수 있도록 지원할 계획이다. 단순한 데이터 추출 도구를 넘어 AI 활용의 기반 인프라로 역할을 확장하려는 시도로 풀이된다. 최근 고성능 모델이 보편화되면서 실제 서비스 구현 단계에서는 데이터 품질과 처리 효율이 핵심 경쟁력으로 부상하고 있는 것으로 분석된다. 이에 한글과컴퓨터의 오픈데이터로더 PDF v2.0 확산을 통해 기존 오피스 소프트웨어 기업에서 AI 데이터 인프라 기업으로 영역을 넓힐 전망이다. 김연수 한컴 대표는 "이번 성과는 한컴의 문서 데이터 추출 기술의 완성도와 실용성이 글로벌 개발자 커뮤니티에서 직접적인 검증을 받은 결과로 다양한 활용을 통한 기술 생태계 확장 가능성도 확인했다"며 "아파치 2.0 라이선스 전환을 통해 전 세계 기업과 개발자가 자유롭게 활용하고 확장할 수 있는 개방형 PDF 데이터 플랫폼으로 발전시켜 나가겠다"고 말했다.
2026-03-23 14:34:05
-
-
-