IT테크

화면 보고 직접 클릭한다…제논, ‘훈민 VLM 235B’로 AI 실행력 한계 넘다

2026.02.04 16:10 3분 읽기

By 이현숙

화면 보고 직접 클릭한다…제논이 컴퓨터 화면을 인식·조작하는 VLM 모델 ‘훈민 VLM 235B’를 공개하며 실무형 AI 경쟁력을 강화했다.(사진제공: 제논)

AI 기술기업 제논(대표 고석태)은 컴퓨터 화면 속 요소를 정밀하게 인식하고 직접 조작할 수 있는 시각·언어 모델(VLM) ‘훈민(Hunmin) VLM 235B’를 공개했다고 4일 밝혔다.

이번에 공개된 훈민 VLM 235B(Hunmin_vlm_235b_v0.11_merged_cua)는 지난해 7월 선보인 ‘훈민 32B’의 후속 모델이다. 기존 범용 지능을 유지하면서 시각 인지와 실행 능력을 대폭 강화한 것이 특징이다.

제논은 자사 AI 솔루션 ‘원에이전트(OneAgent)’의 실무 수행 역량을 높이기 위해 이번 모델을 고도화했다. 특히 컴퓨터 화면을 인식해 원하는 위치를 클릭하는 ‘컴퓨터 유즈(Computer Use)’와 웹사이트를 넘나들며 작업을 수행하는 ‘브라우저 유즈(Browser Use)’ 기능 강화에 초점을 맞췄다.

훈민 VLM 235B는 알리바바의 Qwen3-VL(235B) 모델을 기반으로 UI 이해, 마우스 이동 경로 등 1000여 개의 실무 시나리오를 학습했다. 이를 통해 문서 작업, 웹 탐색 등 실제 업무 환경에서의 실행력을 높였다.

또한 제논의 생성형 AI 플랫폼 ‘제노스(GenOS)’의 멀티테넌트 서빙 기능을 활용해, 별도의 인프라 확장 없이 단일 GPU 환경에서도 기존 서비스와 동시 구동이 가능하도록 설계됐다.

정교한 튜닝을 통해 특정 기능 강화 과정에서 범용 지능이 저하되는 ‘치명적 망각(Catastrophic Forgetting)’ 현상도 완화했다. 내부 테스트 결과, 한국어 VLM 벤치마크 점수를 유지하면서 정밀 조작 영역에서 기존 대비 3.9% 성능이 향상됐다.

일상 업무 수행(Daily Apps)에서는 6.0%, 미디어 도구 조작(VLC)에서는 13.5%의 성능 개선을 기록하며 실무 활용 가능성을 입증했다는 설명이다.

제논은 이번 모델을 기반으로 시각 인지 기술을 고도화해 향후 피지컬 AI 영역으로 확장할 계획이다. 소프트웨어 환경에서 축적한 업무 수행 능력을 공정 자동화 기기나 서비스 로봇 등 물리적 환경으로 전이하는 ‘피지컬 원에이전트’ 개발이 목표다.

명대우 제논 부사장(CTO)은 “향후 풀 파라미터 학습과 강화학습, 시뮬레이션 기반 데이터 생성 파이프라인을 통해 자율 수행 능력을 지속 고도화할 것”이라며 “액셔너블 AI를 넘어 산업 현장의 AI 전환을 이끄는 피지컬 AI까지 기술 영역을 확장하겠다”고 말했다.

한편 제논은 ‘훈민 VLM 235B’를 글로벌 AI 커뮤니티 허깅페이스(Hugging Face)에 오픈소스로 공개했다. 모델 가중치뿐 아니라 학습 데이터 구성과 방법론까지 투명하게 공개해 국내외 AI 연구 생태계 발전에 기여한다는 방침이다.

추천 검색어

카테고리

화면 보고 직접 클릭한다…제논, ‘훈민 VLM 235B’로 AI 실행력 한계 넘다

KGM 뉴 토레스 가격표 공개, 2,905만 원부터 달라진 점 총정리

카카오모빌리티·LG이노텍 손잡았다…자율주행 기술 동맹 확대

SK텔레콤 숲캉스 데이 경쟁률 863대1…장기 가입자 마케팅 확대

네이버페이로 고유가 피해지원금 신청 가능…7월 3일까지 진행

이어서 읽기

기자의 다른 글

오늘 밤부터 내일 새벽 강한 비, 서울·경기·강원산지 예상 강수량 총정리

쿠팡 티셔츠 페스티벌, 2026년 5월 24일까지 뉴발란스·마르디 할인

더 많은 이슈

키움 vs KIA 프리뷰, 고척에서 펼쳐지는 타격 흐름 대결

NC vs 한화 프리뷰, 창원에서 펼쳐지는 마운드 대결

다음부터 바로 접속하세요

빠른 접속 설정 방법

KGM 뉴 토레스 가격표 공개, 2,905만 원부터 달라진 점 총정리

카카오모빌리티·LG이노텍 손잡았다…자율주행 기술 동맹 확대

SK텔레콤 숲캉스 데이 경쟁률 863대1…장기 가입자 마케팅 확대

네이버페이로 고유가 피해지원금 신청 가능…7월 3일까지 진행

오늘 밤부터 내일 새벽 강한 비, 서울·경기·강원산지 예상 강수량 총정리

쿠팡 티셔츠 페스티벌, 2026년 5월 24일까지 뉴발란스·마르디 할인

LG유플러스, 50만원대 ‘갤럭시 버디5’ 단독 출시…스펙·가격 정리

“서울을 하늘에서 본다” 네이버 플라잉뷰 3D 핵심 기능 정리

네이버페이로 고유가 피해지원금 신청 가능…7월 3일까지 진행

키움 vs KIA 프리뷰, 고척에서 펼쳐지는 타격 흐름 대결

NC vs 한화 프리뷰, 창원에서 펼쳐지는 마운드 대결