"AI가 스스로 다음 세대의 AI를 설계하고 개발하는 시대, 우리는 얼마나 준비되어 있을까요?"
인공지능 역사의 대부분 동안 AI를 발전시킨 것은 언제나 '인간'이었다. 하지만 글로벌 AI 연구소 Anthropic은 이미 개발 프로세스의 상당 부분을 AI 자체에 위임하기 시작했으며, 그 결과 엔지니어들의 코드 배포량이 과거 대비 무려 8배나 급증하는 놀라운 생산성 혁명을 마주하였다.
이번 포스팅에서는 Anthropic 의 블로그 글 When AI Builds itself 의 내용을 보며, AI가 인간의 개입 없이 스스로를 고도화하는 '재귀적 자기 개선(Recursive Self-Improvement)'의 현주소를 알아보자.

1. 챗봇에서 자율 에이전트로: AI 개발의 역사
Anthropic은 AI 개발 과정을 총 5가지 단계로 분류하며, 우리가 생각보다 빠르게 최종 단계에 진입하고 있다고 경고하였다.
2021~2023년 (초기 클로드 개발)
초창기 Anthropic의 작업은 다른 테크 기업과 다르지 않았다.
일반적인 테크 기업처럼 인간 엔지니어가 노트북으로 모든 코드와 문서를 직접 작성하던 시기이다.
2023~2025년 (챗봇의 등장)
사람들은 프로세스의 일부를 돕기 위해 초기 챗봇을 사용했다.
초기 챗봇을 활용해 짧은 코드 스니펫을 생성하고, 인간이 이를 복사·붙여넣기하며 도움을 받았다.
2025~2026년 (코딩 에이전트)
에이전트 더 유능해짐에 따라, AI가 스스로 코드를 작성하고 수정하며, 때로는 파일 전체를 혼자서 빌드하는 수준으로 발전했다.
현재 (자율 에이전트)
에이전트가 스스로 코드를 실행하고, 다른 AI 에이전트에게 수 시간 분량의 업무를 위임(Delegate)하는 단계에 이르렀다.
미래 (루프의 완성 - 20XX?)
AI가 모델 자체를 스스로 구축하고 훈련하는 단계이다. 인간의 개입 없이 클로드가 클로드를 지속해서 진화시키는 '재귀적 자기 개선'의 완성이다.
이 일이 일어난다면, 향후 버전의 Claude는 Claude 자체에 의해 지속적으로 개선될 수 있다.

2. 외부 지표가 보여주는 경이로운 성장 속도 (Evidence from the outside world)
AI가 스스로 작업을 수행하는 능력의 유효 기간(성장 속도)은 무시무시할 정도로 빨라지고 있습니다. AI가 스스로 안정적으로 완료할 수 있는 작업의 길이는 과거에는 7개월마다 2배로 늘어났지만, 최근에는 4개월마다 2배씩 뛰고 있다.
(reliably complete on their own)
- 2024년 3월 (Claude 3 Opus): Claude 3 Opus는 인간 기준으로 약 4분 걸리는 소프트웨어 작업 수행 가능.
- 2025년 3월 (Claude 3.7 Sonnet): Claude 3.7 Sonnet은 약 1시간 반 분량의 작업 수행.
- 2026년 현재 (Claude 4.6 Opus): Claude 4.6 Opus는 무려 12시간 동안 지속해야 하는 복잡한 작업을 스스로 완수.
이 추세가 유지된다면, 숙련된 사람이 며칠씩 걸리는 작업이 올해 안에 가시권에 들어올 수 있으며, 2027년에는 AI 시스템이 사람이 몇 주 동안 해야 하는 작업을 수행할 수 있게 될 것이라고 한다.
실제 오픈소스 코드의 버그를 고치는 벤치마크(SWE-bench)와 기존 학술 연구를 스스로 재현해내는 벤치마크(CORE-Bench)는 이미 AI 점수가 100%에 근접하며 '벤치마크 포화(Saturation)' 상태에 이르렀습니다.
- SWE-bench: 실제 오픈소스 코드베이스와 실제 버그 리포트를 모델에 제공하고, 문제를 해결하며 프로젝트 자체 테스트를 통과하는 코드 변경 사항을 작성하도록 요구하는 실제 소프트웨어 엔지니어링 표준 테스트이다. 모델들의 점수는 한 자릿수 초반에서 시작해 불과 2년 만에 벤치마크를 포화 상태로 만들었다.
- CORE-Bench: 모델이 독창적인 연구를 수행하기 위한 전제 조건인 '기존 연구를 재현할 수 있는지'를 테스트한다. 게시된 논문의 이면에 있는 코드와 데이터를 AI 모델에 제공하고, 모든 것을 재실행하여 논문의 결과를 복제할 수 있는지 확인하도록 요청한다. AI 시스템은 2024년에 결과를 재현하는 성공률이 약 20%에 불과했으나, 15개월 만에 벤치마크를 포화 상태로 만들었다.
모델이 장시간 작업을 얼마나 잘 완료할 수 있는지 측정하는 벤치마크를 운영하는 METR의 발표에 따르면, Claude Mythos Preview는 "최소" 16시간 동안 작동할 수 있었으며, "새로운 작업 없이는 [METR가] 측정할 수 있는 최상위 한계"에 도달했다.
공개 벤치마크는 이러한 시스템의 능력에 대해 많은 것을 말해준다. 하지만 AI 시스템이 AI 개발 자체를 가속화하는 데 미치는 영향까지는 밝혀내지 못하였다. 이를 위해서는 Anthropic과 같은 AI 기업 내부의 직접적인 증거가 필요하다고 한다.
3. Anthropic 내부 데이터가 증명하는 AI의 실적 (Evidence from within Anthropic)
Anthropic은 내부에서 사용 중인 차세대 미공개 모델인 'Mythos Preview'와 클로드의 실제 업무 데이터를 공개했습니다.
1. 엔지니어 1인당 코드 생산성 8배 증가
2026년 5월 기준, Anthropic이 메인 코드베이스에 병합(Merge)하는 전체 코드의 80% 이상은 클로드(Claude)가 직접 작성한 것이다. AI가 단순히 코드를 추천하는 것을 넘어 스스로 실행하고 장기적인 작업을 수행하면서, 2026년 2분기 기준 엔지니어 한 명이 하루에 처리하는 코드 양은 2024년 대비 8배나 급증했다.

2. 인간이 4년 걸릴 일을 단 한 달 만에...
실제 사내 사례로, 2026년 4월 클로드는 복잡하고 얽혀 있는 API 에러 800여 개를 수정하여 에러 발생률을 1,000분의 1로 줄였다. 이 작업을 감독한 엔지니어는 "인간이 했다면 남의 코드를 분석하고 컨텍스트를 파악하느라 최소 4년은 걸렸을 일"이라고 평가했다. 현재 Anthropic 내부에서는 수개월 동안 코드를 한 줄도 직접 짜지 않고 AI 감독만 하는 엔지니어들이 늘고 있다.
3. 코드 리뷰와 실험 설계도 AI가 주도
이제 Anthropic은 AI가 짠 코드를 또 다른 AI 리뷰어 모델에게 검사받게된다. 인간이 놓친 과거 버그와 보안 결함의 3분의 1을 AI 리뷰어가 미리 잡아내고 있다. 또한, 특정 훈련 코드를 최적화하는 사내 실험에서 과거 모델(Claude 4 Opus)은 3배 속 개선에 그쳤으나, 최신 모델(Mythos Preview)은 52배의 속도 개선을 이루어내며 인간 연구원의 한계를 아득히 뛰어넘었다.
4. 인간의 역할은 어디로 가는가?
AI가 코딩, 실험 실행, 결과 도출 같은 '실무(Perspiration, 땀방울)'의 영역을 99% 자동화하면서 인간의 영역은 급격히 좁아지고 있다.
현재 인간이 AI보다 확실하게 우위를 점하고 있는 유일한 영역은 '연구의 맛과 판단력(Research taste and judgment)'입니다. 즉, "수많은 실험 중 무엇이 진짜 의미 있는가?", *"어떤 문제를 해결하는 것이 우리 인류에게 가치 있는가?"*와 같은 방향 설정과 대국적인 시야만이 인간의 몫으로 남아 있게된다.
그러나 Anthropic은 이마저도 안심할 수 없다고 말한다. AI가 다음 연구 단계를 제안하고 인간의 판단과 비교했을 때, 최신 모델(Mythos Preview)은 이미 64%의 확률로 인간보다 더 나은 연구 방향을 제시했기 때문이며, '연구 직관'마저도 AI가 곧 학습해 낼 버그 중 하나일지도 모른다고 한다.
5. 우리가 마주할 3가지 미래 시나리오
Anthropic은 앞으로 다가올 미래를 세 가지로 예측하였다.
- 성장의 정체 (S-곡선): 에너지 부족, 칩 제조 지연, 혹은 모델 아키텍처의 한계로 인해 AI 발전 속도가 평탄해지는 시나리오 (가장 가능성이 낮음)
- 지속적인 효율성 폭발: AI가 실무를 완벽히 대체하되, 인간이 최종 방향을 쥐고 있는 구조. 100명의 직원이 있는 스타트업이 과거 10만 명 규모의 대기업 수준의 아웃풋을 낼 수 있게 된다.
- 완전한 재귀적 자기 개선 (대특이점): AI가 완전히 인간의 손을 떠나 스스로를 업그레이드하는 단계. 이 경우 발전 속도는 인간의 시간이 아닌 '컴퓨팅 연산 속도'에 의해 결정되며, 인간의 노동력은 경제적 경쟁력을 완전히 상실하게 된다.
✍️ 마치며
Anthropic의 이번 리포트는 AI가 인간의 일자리를 뺏는다는 단순한 위기감을 넘어, 기술 발전의 제어권(Control) 자체가 인간에게서 떠나갈 수 있음을 경고하고 있습니다.
Edison의 말처럼 천재성이 1%의 영감과 99%의 노력이 대변된다면, 이제 그 99%의 노력은 AI의 몫이 되었습니다. 우리는 다가올 'AI가 AI를 만드는 시대'를 맞이할 준비가 되어 있을까요?
출처
https://www.anthropic.com/institute/recursive-self-improvement
'IT 소식 (CS, AI 위주)' 카테고리의 다른 글
| [보안] 패스트캠퍼스 운영사 '데이원컴퍼니' 개인정보 유출 사고 발생 (비밀번호 변경 권고) (0) | 2026.06.11 |
|---|---|
| AI의 중독성과 맹목적 수용 + 문해력 저하의 바이러스? (0) | 2026.06.07 |
| 앤트로픽 AI 재귀적 자기개선 임박, 윤리적 고민과 개발 속도 브레이크 (Recursive Self-Improvement) (0) | 2026.06.06 |
| [보안]티빙 개인정보 유출 및 조치 방법 (2026년 5월 30일) (0) | 2026.06.06 |
| [교육AI] AI는 교사의 비서? vs 학생의 지름길?, 미국 K-12 교육 현장 설문조사 리뷰 (0) | 2026.06.06 |