ai
DeepSeek V4-Pro, 75% 할인과 100만 컨텍스트 옵션 동시 공개
DeepSeek-V4-Pro가 출력 1M 토큰당 $0.87, 100만 토큰 컨텍스트 기본 제공, claude-code 호환 엔드포인트 한 번의 환경변수 교체로 흡수 가능 — 코딩 에이전트의 단위 원가 가정이 무너졌다. 한눈에V4-Pro 정가 인풋 $0.
Codex, 맥 전 앱을 백그라운드에서 직접 조작한다
Codex 데스크톱 앱이 gpt-5-5 위에서 macOS 전체를 백그라운드 가상 데스크톱으로 부리는 computer-use|병렬 컴퓨터 유즈, 인앱 브라우저, 90+ codex-plugin|플러그인, 메모리·프로액티브 제안을 한 번에 풀었다 — 'IDE 보조'
Mollick의 추론 본위 제안: 커피 한 잔 = 반 엑사플롭
$1 ≈ 10¹⁷ FLOP — 에단 몰릭이 던진 '추론본위제'는 토큰 단가의 구조적 결함을 정면으로 드러내는 사고실험이다. 한눈에몰릭의 어림: 1달러 ≈ 10¹⁷ 매니지드 LLM 추론 FLOP, 4달러 커피 ≈ 0.5 엑사플롭토큰은
카파시: LLM에게 HTML로 응답하라고 시켜보라
Karpathy가 권한 "structure your response as HTML" 한 줄은 단순 프롬프트 팁이 아니라 LLM 출력 포맷의 기본값을 Markdown에서 HTML로 옮기려는 움직임의 일부다 — 토큰 비용은 2~5배 늘지만 일회성
Thinking Machines, '대화 끊기는 AI' 끝낼 새 모델 공개
Thinking Machines Lab이 첫 결과물 TML-Interaction-Small을 공개했다: 276B MoE(12B 활성), 200ms 마이크로-턴 양방향 스트리밍, end-to-end 응답 지연 0.4초, encoder-free early fusion으로 음성·영상·텍스트를 직접 트랜스포머에 공급. 한눈에TML-Interaction-Small:
Gemini Robotics-ER 1.6, Spot에 평문 영어를 입히다
Gemini Robotics-ER 1.6은 Gemini 3.0 Flash 기반 임바디드 추론 VLM으로, 포인팅·성공 감지·계기 판독에서 1.5 대비 측정 가능한 점프를 보였고, Boston Dynamics Spot에 자연어 + function calling
ChatGPT Images 2.0 — '생각하는' 이미지 모델이 도착했다
ChatGPT Images 2.0 / gpt-image-2는 '그리기 전에 LLM이 한 번 생각하고, 필요하면 웹을 뒤지고, 결과를 자체 검증한다'는 점에서 직전 세대와 결이 다른 이미지 모델이다. 그래서 어떤 LLM을
DeepSeek V4 오픈 가중치 공개, 1.6T MoE와 듀얼 사고 모드
DeepSeek V4 Preview는 1M 컨텍스트·사고 모드 토글·하이브리드 희소 어텐션을 MIT 라이선스 오픈웨이트로 묶어 던졌다. SWE-bench Verified 80.6%로 오픈웨이트 SOTA를 갱신했고, V4-Flash 가격은 입력 $0.14/1M·
OpenAI, GPT-5.5 공개… 에이전트 시대로 한 걸음
GPT-5.5는 Terminal-Bench 2.0에서 82.7%로 Opus 4.7(69.4%) · Gemini 3.1 Pro(68.5%)를 13~14%p 차로 따돌렸지만, SWE-Bench Pro에선 여전히 Opus 4.
워크스페이스 에이전트와 Codex 업데이트, 컴퓨터 작업의 새 인터페이스로
OpenAI가 같은 주에 workspace-agents 프리뷰, chronicle 화면 메모리, guardian-agent 자동 승인, Sheets 플러그인, Codex의 gpt-5-5 채택을 묶어 발표하며 codex를 '컴퓨터 사용 보편 하네스'로 재포지셔닝했다. 한눈에워크스페이스 에이전트는 Codex
Grok 음성-텍스트 API, 시간당 0.10달러로 시장에 풀리다
Grok STT API가 배치 $0.10/시간, 스트리밍 $0.20/시간, 자체 WER 6.9%로 출시 — Whisper·Deepgram·AssemblyAI 대비 단가 23~72% 절감이다. 한눈에REST(api.x.ai/v1/
OpenAI, 생명과학 추론 모델 'GPT-Rosalind' 공개
gpt-rosalind는 OpenAI의 첫 도메인 전용 frontier-model 시리즈로, 자체 벤치마크 lifescibench에서 통과율 36.1%를 기록해 GPT-5.5(25.7%), Gemini 3.1 Pro(23.6%), Grok 4.3(13.0%