검색결과 총 5건
-
LG유플러스, AWS 기반 AI 운영 플랫폼 구축…GPU 효율화·운영 자동화
[경제일보] 국내 이동통신사들이 인공지능(AI) 서비스 경쟁력 확보를 위해 인프라 고도화에 속도를 내고 있다. 생성형 AI 서비스 확대와 함께 모델 운영 비용과 인프라 부담이 커지면서 AI 개발부터 서비스 운영까지 전 과정을 통합하려는 움직임이 본격화되는 모습이다. 10일 LG유플러스는 최근 AWS가 주최한 '2026 모던 에이전틱 애플리케이션 데이' 행사에서 AI 모델을 실제 서비스로 안정적으로 운영하기 위한 플랫폼 구축 사례를 공개했다고 밝혔다. 이번 행사는 생성형 AI와 에이전트 기술을 활용한 인프라 운영 자동화를 주제로 진행됐다. LG유플러스는 기존 온프레미스 중심의 AI 개발 환경을 클라우드와 연계한 하이브리드 구조로 전환하고 AI 개발부터 서비스 운영까지 전 과정을 효율적으로 연결한 플랫폼 구축을 진행했다고 설명했다. 이를 통해 AI 서비스 품질과 운영 안정성을 동시에 높일 수 있는 기반을 마련한 것으로 나타났다. 이번 플랫폼은 AI 모델 개발과 서비스 운영 단계 간 단절을 줄이는 데 초점을 맞췄다. 기존에는 AI 모델 학습, 평가, 배포, 운영이 각각 분리돼 진행되면서 서비스 전환 과정에서 반복적인 작업과 시간이 소요된 것으로 알려졌다. 이에 LG유플러스는 하나의 흐름으로 통합해 AI 모델을 보다 빠르게 서비스에 적용할 수 있도록 구조를 설계했다. LG유플러스는 AI를 한 번 개발하고 끝나는 방식이 아닌, 언제든 서비스에 적용할 수 있는 '모델 준비 상태'를 유지하는 구조를 목표로 플랫폼을 구축했다고 설명했다. 데이터 수집부터 학습, 평가, 배포, 운영까지 전 과정을 하나의 파이프라인으로 연결해 개발자와 운영자가 일관된 환경에서 AI를 활용할 수 있도록 구성했다. 이를 위해 AWS의 관리형 쿠버네티스(컨테이너화된 애플리케이션의 배포, 확장, 관리를 자동으로 처리해주는 플랫폼) 서비스인 '아마존 EKS' 기반의 하이브리드 인프라 아키텍처를 도입했다. 자체 온프레미스 GPU 인프라를 아마존 EKS 클러스터의 하이브리드 노드로 통합하고 클러스터 전체 제어 기능인 쿠버네티스 컨트롤 플레인은 AWS 완전관리형 서비스로 운영하는 구조다. 인프라 운영 부담을 줄이고 서비스 안정성과 품질 개선에 집중할 수 있는 환경을 구축한 것이다. GPU 자원 활용 방식도 개선했다. 기존에는 GPU를 장비 단위로 고정 할당하는 방식이 일반적이었지만 LG유플러스는 필요에 따라 자원을 유연하게 배분하는 구조를 적용했다. GPU 미사용 시간을 줄여 AI 모델 학습과 서비스 운영에 필요한 자원을 보다 효율적으로 활용할 수 있도록 설계했다. 최근 생성형 AI 서비스가 확대되면서 AI 모델 운영과 인프라 관리 중요성도 커지고 있다. 특히 AI 모델이 실제 서비스에 적용되는 과정에서 운영 안정성과 비용 효율성이 주요 경쟁 요소로 떠오르면서 AI 운영 플랫폼 구축이 통신사 경쟁력 확보의 핵심 요소로 부상하고 있다. 통신사들은 기존 통신 서비스 중심 사업 구조에서 벗어나 AI 기반 서비스 확대를 추진하고 있다. 이에 AI 모델 개발뿐 아니라 서비스 운영과 인프라 관리까지 포함한 통합 플랫폼 구축이 중요한 과제로 떠오르고 있다. LG유플러스는 이번 플랫폼 구축을 통해 AI 서비스를 보다 빠르게 제공하고, 운영 안정성과 품질 개선을 동시에 추진한다는 계획이다. 특히 데이터 수집부터 모델 개발, 배포, 운영, GPU 자원 관리까지 아우르는 AI 기반 개발 환경을 통해 AI 서비스 경쟁력을 강화한다는 전략이다. 권기덕 LG유플러스 AX엔지니어링Lab장은 "LG유플러스는 AX 서비스 가속화를 위해 데이터 수집부터 모델 개발·배포·운영, GPU 운영까지 아우르는 AI-DLC(AI 주도 개발 라이프사이클) 기반의 엔지니어링 플랫폼 역량을 강화하고 있다"며 "앞으로도 AWS와의 기술 협력을 통해 AI 서비스 품질과 운영 안정성을 지속적으로 높여 나가겠다"고 말했다.
2026-04-10 09:34:12
-
"휴먼에러 막는다"…SK AX, 에이전틱AI 기반 운영 자동화 시장 공략
[경제일보] 인공지능(AI) 인프라 확산으로 산업 현장의 시스템 운영 복잡성이 급격히 증가하면서 장애 예방을 위한 AI 기반 운영 자동화 경쟁이 본격화되고 있다. 이에 기업들이 서비스 중단에 따른 손실을 줄이기 위해 선제적 장애 예방 체계 구축에 나서면서 AI 기반 자율 운영 기술 도입이 빠르게 확대되고 있다. 2일 SK AX는 에이전틱AI 기반 인프라 운영 서비스 'AXgenticWire NPO(New Paradigm for Operation)'를 공개하며 AI 운영 자동화 시장 공략에 나선다고 밝혔다. 해당 서비스는 시스템 장애를 사전에 감지하고 자동으로 대응하는 자율 운영 체계로 GPU 기반 AI 인프라와 클라우드 환경의 확대로 인해 기존 인력 중심 운영 방식으로는 대응이 힘든 점을 파악해 설계된 것이다. AI 기반의 통합 보안 플랫폼 기업 스플렁크와 옥스포드 이코노믹스가 발표한 보고서에 따르면 글로벌 대기업들은 시스템 장애로 인해 연간 약 4000억 달러 규모의(약 600조원) 손실을 입는 것으로 나타났다. 이는 기업 이익의 약 9%에 해당하는 규모다. AI 학습과 추론 환경이 확대되면서 GPU 자원 관리, 워크로드 변동 대응, 복잡한 인프라 운영 등 관리 요소가 늘어나고 있어 글로벌 시장에서도 AI 기반 운영 자동화 수요는 빠르게 증가하고 있다. 특히 AI 서비스는 장애 발생 시 서비스 전체에 영향을 미칠 가능성이 높아 사전 탐지와 자동 대응 기술의 중요성이 커지고 있다. 이에 기업들은 기존 모니터링 중심 운영에서 벗어나 AI가 문제를 탐지하고 조치까지 수행하는 자율 운영 체계 구축을 추진하고 있다. 'AXgenticWire NPO'는 에이전틱AI가 선제적으로 문제 상황을 탐지하고 분석한 뒤 조치까지 수행하는 구조로 설계됐다. AI 에이전트가 시스템 로그, 메트릭, 이벤트 데이터를 실시간으로 분석해 이상 징후를 감지하면 분석 에이전트가 원인을 추론하고 영향 범위를 판단한다. 이후 조치 에이전트가 복구 작업, 설정 변경, 자원 재할당 등을 자동으로 실행하는 방식이다. SK AX는 기존 운영 인력이 수행하던 반복 작업과 휴먼 에러를 줄이고 장애 발생률을 낮출 수 있다고 설명했다. 또한 GPU 자원 관리 기능도 포함됐다. AI 워크로드가 급격히 증가하면서 GPU 활용률 관리와 자원 재배치가 운영 핵심 요소로 떠오르고 있다. 이에 AXgenticWire NPO는 GPU 자원을 통합 관리하는 'GPU 애즈 어 서비스(GPU-as-a-Service)' 구조를 적용해 AI 학습과 추론 환경을 안정적으로 운영할 수 있도록 설계됐다. 산업별 적용 범위도 확대되고 있다. 해당 서비스를 통해 제조업에서는 설비와 공정 데이터를 분석해 이상 징후를 사전에 감지할 수 있으며, 금융 분야에서는 거래와 인증 시스템의 무중단 운영 체계를 구축할 수 있을 전망이다. 공공 분야에서도 대국민 서비스 안정성을 강화하는 데 활용될 수 있다. 기업들은 설치형, 운영 아웃소싱(BPO), 통합 운영(ITO) 방식 등 필요에 따라 도입 방식을 선택할 수 있다. 향후 AI 인프라 확대와 함께 에이전틱 AI 기반 자율 운영 체계 도입이 더욱 가속화될 것으로 분석된다. 기업들이 장애 대응 중심에서 사전 예방 중심으로 운영 전략을 전환하면서 AI 기반 운영 자동화 시장도 빠르게 성장할 전망이다. 차지원 SK AX CAIO는 "운영 전반에서 AI가 먼저 움직여 대응하는 구조이기 때문에 휴먼 에러로 인한 장애 위험을 최소화할 수 있다"며 "'AXgenticWire NPO' 도입으로 기업들은 다운타임 없는 운영 체계에서부터 애플리케이션의 지능화된 서비스까지 AX 실행 전환 속도를 높이는 것은 물론, AX 전체 영역에서 운영비용 구조 혁신과 프로세스 재설계도 가능할 것"이라고 말했다.
2026-04-02 10:00:46
-
-
-