안녕하세요, 아이엔마케팅 허휘영입니다.
2026년 6월 24일 구글이 제미나이 3.5 플래시(Gemini 3.5 Flash)에 컴퓨터 사용(computer use) 기능을 기본 도구로 추가했다고 발표했습니다. AI가 사람처럼 화면을 보고 판단해, 웹 브라우저와 모바일, 데스크톱 환경에서 직접 작업을 수행하는 기능입니다.
기존에는 이 기능이 별도의 모델(제미나이 2.5 컴퓨터 사용 모델)로만 제공되었습니다. 이번 업데이트로 컴퓨터 사용 기능이 제미나이 플래시 모델 자체에 내장되어, 한층 안정적으로 작동하게 되었습니다. 발표된 주요 내용을 차례대로 살펴보겠습니다.
화면을 보고 스스로 작업하는 AI 에이전트

제미나이는 이미 함수 호출이나 구글 검색, 구글 지도 같은 기본 도구를 잘 활용해 왔습니다. 여기에 컴퓨터 사용 기능이 더해지면서, 개발자는 제미나이 3.5 플래시로 화면을 직접 다루는 AI 에이전트를 만들 수 있게 되었습니다.
컴퓨터 사용 기능을 갖춘 AI 에이전트는 사람처럼 세 단계로 작업을 처리합니다. 화면을 보고(see), 무엇을 해야 할지 추론하고(reason), 실제로 행동에 옮기는(take action) 방식입니다. 이를 통해 웹 브라우저, 모바일, 데스크톱 환경을 넘나들며 작업을 수행할 수 있습니다.
구글은 이번 모델이 이러한 에이전트 작업에서 지금까지 선보인 모델 가운데 가장 뛰어난 성능을 보인다고 밝혔습니다. 실제로 제미나이 3.5 플래시는 컴퓨터 사용 기능으로 제미나이 앱 화면을 분석해 기능 목록을 정리하거나, 자체 문서를 검토해 접근성 문제를 점검하는 작업을 수행했습니다.
긴 작업과 업무 자동화로 넓어지는 활용

컴퓨터 사용 기능은 여러 단계를 거쳐야 하는 긴 작업과 기업 업무 자동화에서 특히 가치를 발휘합니다.
대표적인 활용 분야는 다음과 같습니다.
- 지속적인 소프트웨어 테스트: 사람이 일일이 화면을 클릭하며 점검하던 작업을 AI가 대신 수행합니다.
- 전문 프로그램을 활용한 업무: 여러 업무용 프로그램을 오가며 처리해야 하는 작업을 자동화할 수 있습니다.
이처럼 컴퓨터 사용 기능은 사람의 손이 많이 가던 반복 작업을 줄여, 여러 단계를 거치는 복잡한 업무까지 AI가 맡을 수 있도록 돕습니다. 개발자와 기업은 제미나이 API(Gemini API)와 제미나이 엔터프라이즈 에이전트 플랫폼(Gemini Enterprise Agent Platform)을 통해 이 기능을 사용할 수 있습니다.
안전하게 사용하기 위한 보안 장치

AI 에이전트가 실제 환경에서 작동할 때는 보안이 중요합니다. 특히 외부에서 악의적인 명령을 몰래 끼워 넣는 공격(프롬프트 주입)에 대비해야 합니다. 구글은 이러한 위험을 줄이기 위해, 제미나이 3.5 플래시의 컴퓨터 사용 기능에 표적 적대적 훈련(targeted adversarial training)을 적용했습니다. 이는 예상되는 공격 상황을 미리 학습시켜, 모델이 위험에 대응하도록 만드는 방식입니다.
또한 기업이 선택해 사용할 수 있는 두 가지 보안 장치도 함께 공개했습니다.
- 중요한 작업 전 사용자 확인: 민감하거나 되돌릴 수 없는 작업을 실행하기 전에, 이용자의 명시적인 확인을 받도록 설정할 수 있습니다.
- 의심스러운 명령 자동 차단: 외부에서 간접적으로 악의적인 명령이 끼어든 것이 확인되면, 작업을 자동으로 멈추도록 할 수 있습니다.
구글은 여러 겹의 방어를 갖추는 ‘심층 방어’ 방식을 권장합니다. 이러한 기능을 안전한 격리 환경(샌드박싱), 사람이 직접 검토하는 절차, 엄격한 접근 권한 관리와 함께 활용하라는 것입니다.
AI가 화면을 직접 보고 작업하는 기술은, 앞으로 업무 자동화의 폭을 크게 넓힐 전망입니다. 사람이 일일이 처리하던 반복 작업을 AI가 맡게 되면, 사업자는 더 중요한 일에 집중할 수 있습니다. AI 기술을 자사 서비스나 마케팅에 어떻게 활용할지 고민하는 기업이라면, 이러한 변화의 흐름을 눈여겨볼 만합니다. 한국 도입이나 활용 방안은 구글의 추후 공지에 따라 안내드리겠습니다.



