딥시크 V4가 “가격-칩-에이전트-비전” 전쟁을 본격 점화… GPT-5.6이 내부 로그에서 보인 이유
이번 글에서 꼭 짚고 싶은 5가지 핵심(여기부터 읽어야 합니다)
- API 가격 최대 90% 인하: 모델 성능 경쟁을 “비용 경쟁”으로 완전히 끌어내렸습니다.
- 엔비디아 + 화웨이 칩 모두 구동 검증: 특정 생태계(CUDA)에 종속되지 않는 방향이 확실해졌어요.
- 에이전트 능력 강화: 코드만 잘 짜는 수준을 넘어, 작업을 ‘끝내는’ 에이전트로 이동 중입니다.
- “생각하면서 포인팅” 비전(시각 추론) 시스템: 단순히 더 잘 ‘보는’ 게 아니라, 사고 과정에서 좌표로 대상을 고정합니다.
- 오픈AI 쪽 내부 로그에서 GPT-5.6 라우팅 흔적: 다음 버전이 생각보다 빨리 시험/준비 중일 가능성을 키웁니다.
뉴스 헤드라인: 딥시크 V4 출시가 AI 시장의 판을 바꾸고 있어요
중국 AI 연구소 딥시크가 V4를 공개하면서, 글로벌 AI 경쟁 구도가 “최고 성능” 중심에서가격(토큰 비용) · 칩(구동 생태계) · 속도 · 에이전트 · 비전 · 통제/배포 중심의전면전 양상으로 바뀌고 있습니다.
핵심은 단순히 모델이 좋아졌다는 정도가 아니라,“싼데, 오픈에 가깝고, 다양한 하드웨어에서 돌아가며, 에이전트/시각추론까지 붙는다”는 조합이산업 전반의 비용 구조를 흔들었다는 점이에요.
이 글에서는 이번 이슈를 그룹별/항목별로 나눠서,왜 이것이 ‘진짜 위험한 변화’인지까지 정리해볼게요.
1) 가격 전쟁: “성능”보다 “토큰당 비용”이 승부처가 됨
1-1. 최대 90% API 가격 인하가 던진 신호
- 딥시크는 V4 계열의 API 가격을 최대 90%까지 내린 것으로 언급됩니다.
- 토큰 단가가 큰 폭으로 하락하면, 기업들이 “필요한 만큼만” 쓰던 습관이 바뀝니다.
1-2. 토큰 사용량이 폭증하는 이유: 제주의 역설(Jevons Paradox)
가격이 싸지면 ‘그만큼 더 많이 쓰게’ 됩니다.AI도 똑같이 돌아가요.
- Disney, Meta, Visa 같은 사례들이 언급되며 기업 내부 AI 사용량이 이미 비정상적으로 늘어났다는 맥락이 있어요.
- 그래서 “좋은 모델 vs 더 좋은 모델”보다 “얼마나 싸게, 얼마나 자주, 얼마나 자동화해서 돌리느냐”가 중요해집니다.
1-3. 의미 있는 결론(전략 관점)
앞선 폐쇄형(비싼) 모델들은 초반엔 가격을 방어하려 해도,결국 토큰 사용 폭증 흐름을 이기기 어렵습니다.
즉, 딥시크 같은 쪽은 “모든 벤치마크 1등”이 아니어도,일상 업무에서 충분히 좋고 훨씬 싸면 시장을 잠식할 수 있어요.
2) 칩/인프라 전쟁: “엔비디아 종속”을 깨려는 방향이 명확해짐
2-1. 엔비디아 + 화웨이 칩 양쪽 구동 가능성
- V4가 Nvidia뿐 아니라 Huawei(Ascend) 계열에서도 구동/검증된 점이 강조됩니다.
- 중국 내 칩/서빙 생태계 지원이 확산되는 조짐도 언급돼요.
2-2. 국가 단위 AI 스택으로 연결될 수 있는 이유
이 포인트가 중요한 이유는,모델 자체만 잘 만드는 게 아니라칩-클라우드-모델로 이어지는 “완결형 생태계”를 구축하려는 신호로 해석되기 때문입니다.
- 중국 통신/정보기술 관련 기관이 테스트에 들어갔다는 정황은 “민간 경쟁”을 넘어서는 방향성을 보여줍니다.
- 만약 향후 화웨이 Ascend 대규모 인프라가 더 널리 깔리면, V4 프로 가격 경쟁력은 더 커질 수 있어요.
3) 에이전트 전쟁: 코딩 도구를 넘어 “업무 자동화”로 이동
3-1. 딥시크 V4의 ‘에이전트 능력 강화’ 포인트
- 딥시크는 V4에서 추론력과 에이전트(Agentic) 능력을 강화했다고 설명합니다.
- 복잡한 멀티스텝 작업을 더 잘 수행할 가능성을 내세워요.
3-2. 오픈AI 쪽은 Codex를 “진짜 에이전트”로 밀고 있어요
오픈AI는 Codex가 ChatGPT의 “다음 순간”처럼도구 사용을 넘어 디지털 업무 전반으로 확장 중이라는 흐름이 같이 언급됩니다.
- Slack·Gmail·Calendar 같은 도구 간 요약/분석/정리/의사결정 보조
- 스프레드시트/프레젠테이션 생성, 옵션 비교, 트레이드오프 추적 등
3-3. “에이전트 전쟁”의 본질
에이전트는 결국 기업 고객 입장에서업무 시간을 줄이고, 실수를 줄이고, 반복 작업을 자동화하는 도구가 됩니다.
그래서 모델 성능이 조금만 좋아져도 “돈 버는 속도”가 달라질 수 있어요.반대로, 싼 모델이 에이전트를 잘 돌리면 시장은 빠르게 이동합니다.
4) 비전 전쟁: “더 잘 보는 AI”가 아니라 “생각하면서 포인팅하는 AI”
4-1. 연구 핵심 키워드: reference gap(참조 고정의 격차)
딥시크 쪽 기술 보고서는 멀티모달 모델의 대표 약점으로perception gap(더 선명히 보지 못함) 말고,reference gap(같은 대상을 추론 중에 잃어버림)을 다룹니다.
즉,“이미지 인식”은 되는데,추론하는 동안 좌표/대상을 안정적으로 유지하지 못하는 문제가 핵심이라는 거예요.
4-2. 해결 방식: 포인트/바운딩박스를 ‘생각 과정’에 내장
- 모델이 대상을 말로만 지칭(“왼쪽의 곰”)하는 게 아니라
- 좌표/박스로 앵커를 고정하고 사고를 이어가는 방식
- 그 과정에서 “생각하면서 가리키는(포인팅)” 메커니즘이 등장합니다.
4-3. 왜 이게 중요하냐: 실무형 시각 과제가 깨지는 지점
- 사람이 많은 군중에서 “세어야 하는데, 이미 센 대상을 잃어버리는” 문제
- 회로도에서 “빨간 콘덴서와 인덕터의 좌/우 관계”처럼 정확한 상대 참조가 필요한 문제
- 미로/경로 추적에서 “좌/우” 같은 표현이 섞이며 논리 무너짐
4-4. 성능/효율 관점: 시각 기억을 덜 써도 더 잘 맞춘다는 주장
보고서에서는 800×800 이미지 기준으로 약 90개 수준의 시각 메모리 엔트리를 유지한다고 설명하며,타 모델 대비 메모리 효율이 높다는 비교가 포함됩니다.
결과적으로 더 빠르고, 더 저렴하고, 로봇/자율주행/영상 분석처럼 실시간 요구에 유리해질 수 있다는 논리죠.
5) 오픈AI 이슈: GPT-5.5의 “고블린 버그”와 Codex 확장
5-1. GPT-5.5가 뜬금없이 괴물/생물 언급을 늘린 ‘이상 패턴’
- 대화 주제와 무관하게 goblin/gremlin/troll 같은 생물이 반복 언급되는 현상이 관찰됐다는 맥락입니다.
- 단순 밈처럼 보이지만, 사용자 경험/품질 신뢰 측면에서는 꽤 치명적일 수 있어요.
5-2. 프롬프트에서 금지 단어를 반복적으로 차단했다는 정황
오픈AI가 해당 생물 단어들을 관련 없으면 금지하도록 프롬프트에 넣었다는 설명이 언급됩니다.그리고 사용자들이 금지된 단어를 유도하는 방식으로 “다시 나오기도 했다”는 흐름이 나와요.
5-3. Codex는 반대로 ‘진지한 에이전트’로 빠르게 진화
한쪽(GPT-5.5)은 기묘한 버그성 노출이, 다른 쪽(Codex)은 업무 자동화 중심의 확장.이 대비가 “시장 경쟁”을 더 흥미롭게 만들었죠.
6) 논란의 중심: GPT-5.6이 내부 로그/라우팅에서 보였다는 얘기
6-1. “출시 확인”이 아니라 “시험/라우팅 흔적”에 가깝다는 해석
중요한 포인트는,GPT-5.6이 이미 공개 출시됐다는 의미라기보다백엔드 로그에서 라우팅 라벨이 보였다는 가능성입니다.
6-2. 그래도 타이밍이 의미 있는 이유
- 딥시크 V4가 가격/오픈성/비전/에이전트로 압박을 주는 시점과 맞물립니다.
- 오픈AI가 대응을 더 빨리 준비할 수밖에 없는 환경이 조성됐다는 거죠.
6-3. 이 부분이 “진짜 위험”인 이유(핵심 관점)
딥시크 같은 오픈/저가 모델은특정 과제에서 ‘한 번’ 이기면 끝이 아니라,꾸준히 충분히 잘 돌리고 비용 우위를 유지하는 쪽입니다.
즉, 오픈AI는 성능 격차만 보면 안 되고배포·비용·속도·에이전트 통합까지 같이 경쟁해야 해요.
7) 딥시크 내부 변화: 리더십/인재 유지/연구팀 확장 흐름
7-1. 창업자 공개 활동 감소 + 지분/자본 변화
딥시크 창업자가 공개 활동을 줄였다는 보도 흐름과 함께,법인/자본 관련 지표 변화(지분 상승 등)가 언급됩니다.
7-2. 핵심 연구자 부각(대외 활동 증가)과 장기 연구 시그널
- V3/R1/V4 계열에 참여한 연구자가 대외 행사/발표에서 더 보인다는 흐름
- 일부 발언은 “일자리 영향” 같은 사회적 메시지까지 포함했다는 맥락
7-3. 팀 규모 성장: 장기전 준비 가능성
연구/엔지니어링 인원이 늘었다는 수치가 제시되며,단발성 출시보다 지속적인 개선 사이클을 운영할 수 있다는 신호로 읽힙니다.
8) “바이럴 스크린샷” 경계: 한 번 맞춘 걸로 전체를 결론 내리면 안 돼요
여기서 독자들이 흔히 놓치는 함정이 하나 있어요.
- 어떤 모델이 한 번 버그를 더 잘 고친 스크린샷이 돌아다녀도
- LLM은 확률적(stochastic)이라 “반복 재현성”이 없으면 벤치마크가 되지 않습니다.
그래서 “V4가 GPT-5.4를 이겼다/Claude를 눌렀다” 같은 단정은 조심해야 해요.진짜 평가는내 업무 워크플로우, 내 스택, 내 프롬프트, 내 비용 한도에서 반복 검증하는 겁니다.
오늘의 결론: AI 전쟁의 승부는 ‘최고 모델’이 아니라 ‘가성비+배포+통합’
이번 이슈를 한 문장으로 요약하면 이거예요.
모델 스펙 싸움에서 끝나는 게 아니라, 토큰 비용과 칩·속도·에이전트·비전 통합까지 포함한 “생태계 전쟁”으로 바뀌고 있다.
그리고 딥시크 V4는 그 변화를 “체감 가능한 가격”으로 밀어붙였고,오픈AI 쪽은 내부 로그에서 다음 단계(GPT-5.6) 준비 흔적이 보일 정도로 압박이 강해졌습니다.
이제 독자/기업 입장에서는“어떤 모델이 제일 똑똑한가”보다어떤 모델 조합이 가장 싸게, 가장 빠르게, 가장 안정적으로 일을 끝내는가를 봐야 합니다.
전하고 싶은 주요 내용(다른 곳에서 덜 말하는 ‘진짜 포인트’)
- 가격 인하의 진짜 무서움: 벤치마크 1등이 아니라, 토큰 사용 폭증으로 “행동 자체”를 바꿉니다.
- 비전의 전환: 픽셀을 더 보게 하는 경쟁이 아니라, 추론 중에 대상을 잃지 않도록 “좌표 앵커”를 내장하는 경쟁으로 이동합니다.
- 칩의 정치경제: 엔비디아 의존도를 낮추는 방향은 단순 기술이 아니라 공급망/자립 전략과 연결됩니다.
- 에이전트는 기능이 아니라 운영 방식: 메신저형 챗에서 업무 시스템형(요약→결정→정리→추적)으로 가는 흐름이 핵심입니다.
- 재현성 검증이 승자를 가른다: 바이럴 승리는 참고만 하고, 비용/속도 포함 반복 테스트로 판단해야 합니다.
SEO 키워드(자연 포함): 글로벌 AI 경쟁, AI 가격 경쟁, 멀티모달 비전, 에이전트 AI, 토큰 비용
< Summary >
딥시크 V4는 API 가격을 최대 90% 내리고, 엔비디아와 화웨이 칩 모두에서 돌아가는 점을 강조하면서,에이전트 능력과 “포인팅하며 추론하는” 멀티모달 비전(좌표 앵커 기반)을 함께 내놨습니다.이 조합은 시장을 ‘성능’ 중심에서 ‘토큰 비용·속도·칩 생태계·통합 에이전트’ 중심의 전쟁으로 바꿔놓는 흐름이에요.동시에 오픈AI 쪽은 GPT-5.5의 고블린 버그와 Codex의 에이전트 확장이 공존하고,백엔드 로그에서 GPT-5.6 라우팅 흔적이 포착됐다는 얘기가 타이밍상 압박감을 더합니다.결국 승자는 “가장 똑똑한 모델”이 아니라, 충분히 잘하고 더 싸게, 더 안정적으로 일을 끝내는 쪽이 될 가능성이 큽니다.
[관련글 이전글… Next-Korea.com 추천 링크 2개]



