검색결과 총 13건
-
-
오피스 기업에서 AI 인프라로…한컴, PDF 기술로 깃허브 트렌딩 1위
[경제일보] 한글과컴퓨터가 인공지능(AI) 개발 과정에서 핵심 병목으로 지목돼 온 데이터 전처리 영역에서 존재감을 드러내고 있다. 한글과컴퓨터가 공개한 PDF 데이터 추출 오픈소스가 글로벌 개발자 커뮤니티에서 빠르게 확산되며 자사의 기술 경쟁력을 입증하고 있다. 23일 한글과컴퓨터는 자사의 오픈소스 프로젝트 '오픈데이터로더 PDF v2.0'이 오픈소스 개발 플랫폼 깃허브에서 전체 개발 언어 기준 트렌딩 1위를 기록했다고 밝혔다. 공개 직후 하루 만에 1800개 이상의 스타가 증가했고 오후 2시 기준 누적 스타 수는 8400개, 포크 수는 500개를 넘어섰다. 이번 성과는 단순한 인기 지표를 넘어 AI 개발 생태계에서 해결되지 않은 문제를 겨냥했다는 점에서 의미가 큰 것으로 분석된다. PDF는 전 세계에서 가장 널리 활용되는 문서 형식 중 하나로 기업 문서와 보고서, 연구 자료 등 주요 데이터가 집중된 포맷이다. 다만 텍스트와 표, 이미지가 혼합된 복잡한 구조로 인해 AI가 바로 활용할 수 있는 형태로 변환하기 어려워 데이터 전처리 단계의 대표적인 병목으로 꼽혀 왔다. 이에 한글과컴퓨터는 해당 문제를 해결하기 위해 AI 기반 분석 방식과 규칙 기반 직접 추출 방식을 결합한 하이브리드 엔진을 자사의 오픈데이터로더 PDF v2.0에 적용했다. 특히 외부 서버로 데이터를 전송하지 않고 로컬 환경에서 처리할 수 있도록 설계해 보안성을 높였고 처리 속도를 유지하도록 설계했다. 또한 광학문자인식(OCR), 표·수식 추출, 차트 분석 등 다양한 AI 기능을 기본 제공해 복합 문서 처리 범위를 넓혔다. 성능 측면에서도 경쟁력을 강조하고 있다. 자체 벤치마크 테스트에서 읽기 순서, 표 구조 인식, 제목 추출 등 주요 항목 전반에서 기존 오픈소스 대비 높은 정확도를 기록했으며 테스트 데이터와 재현 코드를 함께 공개해 결과의 신뢰성을 높였다. 해당 방식은 단순 기능 제공을 넘어 기술 검증 과정까지 공개해 글로벌 개발자 커뮤니티의 신뢰를 확보하려는 전략으로 풀이된다. 한글과컴퓨터는 200개의 실제 PDF 파일(다단 구성 문서 및 과학 논문 포함)을 기반으로 한 자체 벤치마크에서 전체 정확도 0.90, 표 추출 정확도 0.93을 기록하며 복잡한 문서 구조에서도 높은 인식 성능을 보였다고 설명했다. 특히 복잡한 페이지에 대응하기 위해 규칙 기반의 결정론적 로컬 모드와 AI 기반 하이브리드 모드를 병행 적용한 점이 성능 개선의 핵심으로 꼽혔다. 스캔 문서 처리 기능도 강화됐다. 80개 이상의 언어를 지원하는 내장 OCR 기능이 하이브리드 모드에서 동작하며 300DPI 이상의 저해상도 스캔 파일에서도 안정적인 텍스트 추출이 가능하다. 또한 테두리가 없는 표나 복잡한 레이아웃, LaTeX 수식, 이미지 및 차트까지 함께 인식하고 구조화할 수 있어 비정형 데이터 처리 범위를 확장했다. 오픈소스 정책 역시 확산을 염두에 둔 선택으로 해석된다. 해당 프로젝트에는 상업적 활용이 가능한 아파치 2.0 라이선스가 적용돼 기업과 개발자가 별도 제약 없이 서비스에 도입할 수 있도록 구성됐다. 이에 초기 사용자 기반을 빠르게 확보하고 생태계를 확장하려는 의도로 풀이된다. AI 개발 생태계와의 연계도 강화되고 있다. 앞서 오픈데이터로더 PDF는 지난해 글로벌 AI 개발 프레임워크 랭체인의 공식 구성요소로 등록됐으며 올해에는 '라마인덱스', '제미나이 CLI' 등 주요 AI 프레임워크와의 연동 확대가 예정돼 있다. 다양한 AI 개발 도구와의 호환성을 확보함으로써 데이터 전처리부터 모델 활용까지 이어지는 흐름 속에 자연스럽게 편입시키겠다는 전략이다. 또한 AI 에이전트 환경을 겨냥한 기능 확장도 추진된다. 한글과컴퓨터는 모델 간 맥락을 연결하는 'MCP' 기능을 도입해 AI가 문서 데이터를 보다 효율적으로 이해하고 활용할 수 있도록 지원할 계획이다. 단순한 데이터 추출 도구를 넘어 AI 활용의 기반 인프라로 역할을 확장하려는 시도로 풀이된다. 최근 고성능 모델이 보편화되면서 실제 서비스 구현 단계에서는 데이터 품질과 처리 효율이 핵심 경쟁력으로 부상하고 있는 것으로 분석된다. 이에 한글과컴퓨터의 오픈데이터로더 PDF v2.0 확산을 통해 기존 오피스 소프트웨어 기업에서 AI 데이터 인프라 기업으로 영역을 넓힐 전망이다. 김연수 한컴 대표는 "이번 성과는 한컴의 문서 데이터 추출 기술의 완성도와 실용성이 글로벌 개발자 커뮤니티에서 직접적인 검증을 받은 결과로 다양한 활용을 통한 기술 생태계 확장 가능성도 확인했다"며 "아파치 2.0 라이선스 전환을 통해 전 세계 기업과 개발자가 자유롭게 활용하고 확장할 수 있는 개방형 PDF 데이터 플랫폼으로 발전시켜 나가겠다"고 말했다.
2026-03-23 14:34:05
-
-
-
NC AI, 산업용 AI '배키' 공개... "비용은 83% 낮추고 한국어 성능은 2배로"
[이코노믹데일리] 국가대표 AI 기업 NC AI가 대한민국 주력 산업의 지능형 전환을 이끌 독자적인 파운데이션 모델을 전격 공개했다. 8일 NC AI는 산업 현장에 특화된 멀티모달 생성형 AI 모델 ‘배키(VAETKI)’를 발표하고, 글로벌 빅테크 중심의 AI 패권 경쟁 속에서 한국의 ‘소버린 AI(Sovereign AI)’ 주권을 확보하겠다는 비전을 제시했다. 이번 발표는 20여 년간 ‘리니지’ 등 대형 게임 개발 과정에서 축적해 온 AI 기술 DNA를 게임 산업에 국한하지 않고 국가 기간산업 전반으로 확장하겠다는 엔씨소프트의 전략적 선언으로 해석된다. 배키는 과학기술정보통신부가 추진한 ‘독자 AI 파운데이션 모델 프로젝트’의 핵심 결과물로, 범용성과 확장성에 방점을 둔 글로벌 빅테크 모델과 달리 제조·국방·유통 등 산업 현장의 구체적인 요구를 충족하는 데 초점을 맞췄다. ◆ “비용은 낮추고 성능은 높였다”…기술적 완성도 ‘합격점’ 배키의 가장 큰 경쟁력은 효율성이다. 1000억 개(100B) 파라미터급 초거대 모델임에도 불구하고 ‘전문가 혼합(MoE)’ 아키텍처를 적용해 실제 추론 과정에서는 110억 개(11B) 파라미터만 활성화하도록 설계했다. 여기에 차세대 어텐션 기술인 MLA(Multi-Latent Attention)를 결합해 메모리 사용량을 기존 대비 약 83% 절감했다. 이는 기업들이 AI 도입 과정에서 가장 부담을 느끼는 인프라 구축 및 운영 비용을 획기적으로 낮출 수 있는 구조적 강점으로 평가된다. 성능 지표에서도 글로벌 오픈소스 모델 대비 경쟁력을 입증했다. NC AI의 자체 평가에 따르면 배키는 오픈AI의 GPT 계열 오픈소스 모델과 메타의 ‘라마(Llama)4 스카우트’ 등 주요 경쟁 모델 대비 한국어 벤치마크 3종에서 평균 101% 우수한 성능을 기록했다. 특히 지시 이행 능력을 평가하는 IFEval에서는 265%, 박사급 추론 능력을 가늠하는 HLE에서는 137% 높은 점수를 나타내며 복잡한 산업 현장의 문제 해결에 적합한 ‘실전형 AI’임을 강조했다. 옛말과 고어 처리까지 가능한 한글 조합 기능은 국방·법률 분야 등 특수 데이터 처리 영역에서 차별화 요소로 작용할 전망이다. NC AI의 이번 행보는 게임사 산하 조직이라는 한계를 넘어 국가대표 AI 기업으로 도약하려는 중장기 전략과 맞닿아 있다. 게임 개발 과정에서 축적한 AI 기술 노하우를 ‘도메인 옵스(DomainOps)’라는 체계로 고도화해 전 산업군으로 확장하겠다는 구상이다. 도메인 옵스는 범용 거대언어모델(LLM)의 한계를 보완해 특정 산업군에 특화된 데이터를 최적화하고 안정적으로 운용하는 NC AI만의 독자 기술로 소개됐다. 구체적으로 제조 현장에서는 로봇과 설비를 제어하는 ‘피지컬 AI’로, 국방 분야에서는 전술 판단을 지원하는 참모형 AI로, 콘텐츠 산업에서는 창작을 보조하는 지능형 도구로 배키를 활용할 수 있다는 설명이다. NC AI는 이를 위해 △초고성능 100B △범용 20B △온디바이스용 7B 등 멀티 스케일 라인업을 구축해 기업 규모와 적용 목적에 맞는 맞춤형 솔루션을 제공할 계획이다. 이와 함께 NC AI는 롯데이노베이트(유통), 포스코DX(제조), MBC(콘텐츠), 육군본부(국방) 등 14개 산학연 기관과 컨소시엄을 구성했다. 범용 모델을 단순 도입하는 방식이 아니라, 각 산업의 핵심 데이터를 함께 학습시켜 초기 단계부터 ‘맞춤형 두뇌’를 공동 설계하는 전략이다. ◆ 미 에포크AI ‘주목할 모델’ 등재…글로벌 확장 교두보 이 같은 기술적 성과는 해외에서도 주목받고 있다. 배키는 미국 비영리 연구기관 에포크AI(Epoch AI)가 선정하는 ‘주목할 만한 AI 모델’ 리스트에 이름을 올렸다. 학습 데이터 규모와 연산 효율성, 기술적 혁신성을 엄격히 평가하는 이 리스트에 등재됐다는 점은 한국형 AI 모델이 글로벌 시장에서도 경쟁력을 확보할 가능성을 시사한다. 업계 전문가는 “AI 시장이 범용 모델 중심 경쟁에서 산업별 특화 모델 경쟁으로 재편되는 국면”이라며 “NC AI가 비용 효율성과 한국어 특화 성능을 앞세워 B2B 시장을 선점할 경우 구글이나 마이크로소프트 등 글로벌 빅테크에 대한 기술 종속을 줄이고 독자적인 생태계를 구축할 수 있을 것”이라고 내다봤다. 이연수 NC AI 대표는 “배키는 단순히 글로벌 기술을 추격하는 모델이 아니라 대한민국 주력 산업이 AI를 무기로 글로벌 시장을 선도하도록 돕는 전략 자산”이라며 “독자적인 도메인 옵스 기술력을 바탕으로 산업 현장에서 실질적 가치를 창출하는 소버린 AI 생태계를 구축해 나가겠다”고 밝혔다. 업계에서는 2026년 배키를 중심으로 국내 기업들의 AX(AI 전환)가 본격화되고, 2027년을 전후해 중동과 동남아 시장을 겨냥한 글로벌 확장도 가시화될 것으로 보고 있다.
2026-01-08 09:27:09
-
-
-
-
컬리가 준비한 연말선물 '컬리푸드페스타 2025'
[이코노믹데일리] 컬리가 세 번째 푸드페스타를 선보였다. '홀리데이 테이블(Holiday Table)'을 콘셉트로 컬리가 차린 만찬을 함께 즐기는 기분을 느낄 수 있다. 18일 컬리는 마곡 코엑스센터에서 '컬리푸드페스타 2025'를 개최했다. 시작 시간에 맞춰 줄을 길게 늘어선 고객들이 복도를 메웠다. 짧은 기다림 끝에 입장하자 영화 '해리포터'를 떠올리게 하는 기다란 만찬 테이블과 거대한 트리가 시선을 사로잡았다. 다른 방문객 입에서는 "진짜 신경 많이 썼나보다"라는 이야기가 나왔다. 내부도 매력적이다. 총 160여 개 브랜드가 참가했다. 크리스마스 만찬 테이블을 중심으로 그로서리, 디저트·유제품, 간편식 코너와 축수산물, 신선식품, 건강식품, 음료·간식 코너로 나눠져 있다. 이번 '컬리푸드페스타 2025'에는 삼양식품, 롯데호텔, 윤서울, 온하루 등 50여 개 파트너사가 새롭게 참가했다. 특히 삼양식품을 비롯한 8개 브랜드는 특색을 살린 코너를 따로 마련해 보는 즐거움을 더했다. 풀무원이 내년 1월 선보이는 '고농도 두부'는 컬리푸드페스타 2025에서 먼저 만나볼 수 있었다. 차기 제품 개발을 위한 설문조사를 받는 브랜드도 있었다. '쉐프스푸드'는 입장과 함께 지역맛집, 셰프레시피, 건강 한 끼 중 가장 마음에 드는 키워드에 투표를 부탁했다. 이후 각 키워드에 맞는 식품 3가지를 직접 맛 볼 수 있었다. 살아있는 전복을 배달해주는 '보물섬'에서는 수족관에 가득한 전복과 함께 냉장 배송 포장 상태를 볼 수 있었다. 보물섬 직원은 "바닷물에 담가 살아있는 상태로 보내드린다"며 신선함을 강조했다. '스텔라마리스'와 '성이시돌목장'은 보물섬과 마찬가지로 컬리의 풀콜드체인 시스템의 강점을 보여줬다. '스텔라마리스'는 페스타 기간 당일 아침 산지에서 따 온 개체굴을 선보이고 '성이시돌목장'은 제주도에서 착유한 우유를 다음 날 페스타 현장에서 선보인다. 160여 개 브랜드 중 다섯 개 브랜드를 채 방문하기도 전에 컬리 푸드페스타의 강점은 명확해진다. 어떤 맛인지, 어떻게 배송이 오는지 알 수 없는 온라인 제품을 직접 눈으로 보고 궁금한 점을 묻고 맛도 볼 수 있다. 미슐랭에서 별을 받은 쉐프의 음식점이나 레시피 개발에 참여한 밀키트, SNS상에서 유명한 브랜드를 한 곳에서 만날 수 있다. 큐레이션을 강점으로 내세우는 컬리인 만큼 다른 곳에선 쉽게 보기 힘든 브랜드가 즐비한 것이 큰 장점이다. 1차 얼리버드 티켓은 컬리 멤버스 회원만 구매가 가능한 만큼 보다 저렴한 가격으로 체험 기회를 주는 만큼 기존 고객 충성도도 제고할 수 있다. 컬리의 큐레이션을 경험할 수 있는 '라이스 테이블', '셰프 테이블', '드림 테이블' 등 세가지 코너도 마련했다. 셰프 테이블에서는 넷플릭스 '흑백요리사:요리 계급 전쟁'에 출연한 김도윤, 정지선, 안유성 등 유명한 셰프들이 직접 나서 컬리 제품으로 쿠킹쇼를 선보인다. 라이스 테이블에서는 '쌀 도슨트'라는 독특한 경험을 할 수 있다. '드림 테이블'에서는 음식 소품으로 나만의 테이블을 만들고 경품을 받아갈 수 있다. 컬리 최재훈 최고커머스책임자는 "올해로 3회째를 맞는 컬리푸드페스타에서 대표 미식 축제에 걸맞은 큐레이션과 풍성한 콘텐츠를 만나보실 수 있을 것"이라며 "컬리와 160여 개 브랜드가 준비한 다채로운 맛은 물론 오감으로 즐기는 체험을 통해 행복한 연말의 추억을 남기시길 바란다"고 말했다.
2025-12-18 17:40:31
-
-
-
-