폭발적인 사용자 증가로 서비스 일시 중단
인공지능 스타트업 앤트로픽이 개발한 ‘클로드’의 사용자가 급증하면서 서비스가 잠시 멈추는 상황이 발생했습니다. 이러한 인기 폭발의 배경에는 회사가 고집스럽게 지켜온 ‘안전 우선 원칙’이 있었습니다.
독특한 학습 방식의 비밀
앤트로픽은 인공지능을 훈련시킬 특별한 방법을 사용합니다. 먼저 인공지능이 반드시 따라야 안전 규칙인 ‘헌법’을 만들어 처음부터 입력합니다. 그런 다음 인공지능 스스로 자신의 답변을 점검하고 고치도록 하는 방식으로 학습시킵니다.
기존 방식은 사람이 직접 가르치기 때문에 편향된 시각이 섞일 있지만, 클로드는 스스로 검증하며 배우기에 예상치 못한 답변이 적고 위험한 상황에서는 협조를 거부합니다.
핵심 원칙들
클로드에 입력된 헌법에는 다음과 같은 내용이 포함되어 있습니다:
• 인간의 권리를 존중할 것
• 증오나 폭력을 부추기지 것
• 해로운 행동은 거부할 것
• 민주주의를 해치는 일을 경계할 것
전문가들은 클로드가 신뢰성 평가에서 항상 최고 점수를 받는다고 설명합니다. 민감한 정보에 대한 지식은 가지고 있지만, 상황이 위험하다고 판단되면 답변을 제공하지 않는 특성 덕분입니다.
실전에서 검증된 성능
회사가 군사 목적의 전면 개방 요구를 거절했음에도, 실제 작전에서 클로드가 활용되며 능력이 입증되었습니다. 안전을 중시한 설계가 오히려 가장 믿을 만한 인공지능으로 인정받는 역설적 결과를 만들어냈습니다.
또한 클로드는 악의적인 명령어를 주입해 시스템을 조작하려는 공격에도 강한 저항력을 보입니다.
대중의 선택
회사 대표가 “자국민 대규모 감시나 대량 살상 무기에는 사용될 없다”는 입장을 분명히 직후, 클로드는 앱스토어에서 1위에 올랐고 사용자 수가 크게 증가했습니다.
무료 사용자는 60% 이상, 유료 구독자는 2배로 늘어나며 소비자들이 회사의 원칙에 호응하고 있음을 보여주었습니다.