중국 AI 모델 딥시크 R1, 한국어 공격에 18% 더 취약

0
딥시크 R1, AI 보안 취약성, 한국어 공격 취약, 인공지능 탈옥, 생성형 AI 보안
(사진 출처-AI이미지 생성)
 딥시크 R1, AI 보안 취약성, 한국어 공격 취약, 인공지능 탈옥, 생성형 AI 보안
(사진 출처-AI이미지 생성)

중국이 개발한 인공지능(AI) 추론 모델 딥시크 R1 이 보안성 평가에서
한국어 공격에 더 취약한 것으로 나타났다.

10일 생성형 AI 보안업체 이로운앤컴퍼니는
자사 ‘세이프엑스 레드팀’이 딥시크 R1의 안전성과 보안성을 평가한 결과,
탈옥(제일브레이킹) 공격 성공률이 63%에 달하며 심각한 보안 취약성이 드러났다고 밝혔다.

AI 모델의 탈옥이란 기본적으로 설정된 가이드라인을 우회해,
모델이 의도하지 않은 작업을 수행할 수 있도록 공격하는 것을 의미한다.

이번 연구에서 딥시크 R1은 역할극 기반 공격에서 83%의 높은 취약성을 보였으며,
허위 정보 생성 위험도는 89%로 나타났다. 이는 다른 AI 모델과 비교했을 때도 높은 수준이다.

이러한 결과는 딥시크 R1이 정교한 보안 우회 공격을 효과적으로 차단하지 못하며,
사이버 공격, 범죄 실행 방법, 악성 코드 생성 등 유해 콘텐츠를
쉽게 출력할 가능성이 크다는 것을 의미한다.

사이버 보안 관련 취약성도 문제로 지적됐다.

딥시크 R1의 사이버 보안 취약성은 54.6%로,
특정 프로그램의 취약점을 악용하는 방법이나 허가되지 않은 시스템 접근 기법 등
사이버 범죄에 악용될 가능성이 있는 정보를 제공하는 사례가 다수 발견됐다.

또한, 이로운앤컴퍼니는 한국어를 포함한 다국어 기반으로 보안성을 테스트한 결과,
한국어 공격에서 평균적으로 18% 더 높은 취약성이 나타났다고 밝혔다.

이는 딥시크 R1 의 한국어 데이터 학습이 부족하거나,
다국어 대응이 미흡할 가능성을 시사하는 결과로 분석됐다.

특히 한국어로 혐오 발언을 생성하도록 했을 때 41.7%의 높은 취약성이 발견되며,
한국어 사용자에게 유해한 발언을 제공할 위험이 있는 것으로 파악됐다.

윤두식 이로운앤컴퍼니 대표는 “일반 기업이 오픈소스인 딥시크 모델을 쉽게 도입해 고성능 AI 서비스를 개발할 수 있는 환경이 조성되고 있다”면서도
“이러한 환경에서 AI 모델의 보안성과 안전성을 담보하는 것이 필수적”이라고 강조했다.

다른기사보기

신혜연 (karung2@sabanamedia.com) 기사제보

0 0 votes
Article Rating
Subscribe
Notify of
0 Comments
Inline Feedbacks
View all comments