Symbolika
OpenAI 코덱스, 맥 앱 조작·기억·플러그인 90종 장착
OpenAI가 4월 26일 데스크톱용 codex 앱을 대대적으로 업데이트했다. 핵심은 네 가지다. 사용자의 맥 앱을 자체 커서로 직접 조작하는 컴퓨터 제어, 외부 도구를 잇는 90개 이상의 플러그인, 사용자 취향을 기억하는 메모리
Anthropic-Amazon, 5GW 컴퓨트와 추가 투자 합의
4월 21일 Anthropic이 Amazon과의 파트너십을 크게 확장한다고 발표했다. 핵심은 두 가지다. 첫째, Claude 모델을 학습하고 서비스하는 데 필요한 컴퓨트(연산 자원)를 최대 5기가와트(GW)까지 확보한다. 둘째, Amazon이 오늘
컴퓨트 이중 구속과 쏟아지는 AI 제품
와튼스쿨 경영학자 Ethan Mollick(@emollick)이 이번 주 AI 업계의 현재를 압축하는 두 개의 짧은 글을 잇따라 올렸다. 첫 번째는 AI 회사들이 직면한 '컴퓨트(연산자원) 제약'이 왜
DeepSeek V4-Pro, 75% 할인과 100만 컨텍스트 옵션 동시 공개
DeepSeek가 자사 코드 추론 모델인 deepseek-v4-pro API의 가격을 한시적으로 75% 깎는 프로모션을 발표했다. 동시에 claude-code 같은 외부 코딩 에이전트에서 100만 토큰짜리 context-window를 활성화할 수 있도록 통합 옵션도 함께 풀었다. 적용
Codex, 맥 전 앱을 백그라운드에서 직접 조작한다
샘 올트먼(@sama)이 OpenAI의 코딩 도구 codex에 대한 업데이트를 공개했다. 가장 눈에 띄는 변화는 '컴퓨터 사용(computer-use)' 기능이다. Codex가 사용자의 맥(Mac)에 설치된 앱을 직접 조작할
Mollick의 추론 본위 제안: 커피 한 잔 = 반 엑사플롭
와튼의 Ethan Mollick 교수가 경제학 사고실험 하나를 던졌다. AI 서비스 가격을 지금처럼 '토큰' 단위가 아니라 'flop' 단위로 매기자는 것이다. 그의 거친 계산대로라면 4달러짜리 커피 한 잔은
카파시: LLM에게 HTML로 응답하라고 시켜보라
karpathy(안드레이 카파시) 는 오픈AI 창립 멤버이자 테슬라 AI 디렉터를 지낸 연구자다. 그가 X에 올린 짧은 팁 하나가 1만 6천 개 넘는 좋아요를 받으며 빠르게 퍼졌다. 질문 끝에 '응답을
Thinking Machines, '대화 끊기는 AI' 끝낼 새 모델 공개
지금 우리가 챗봇을 쓰는 방식은 묘하게 답답하다. 할 말을 머릿속에서 정리해 한 덩어리로 보내고, 모델이 답을 다 만들 때까지 기다린다. mira-murati가 이끄는 thinking-machines-lab이 첫 결과물로 공개한 interaction-model은 바로 이 답답함을
Gemini Robotics-ER 1.6, Spot에 평문 영어를 입히다
DeepMind가 로봇용 추론 모델 gemini-robotics-er 1.6을 공개했다. 같은 날 Boston Dynamics의 4족 로봇 boston-dynamics-spot에 이 모델을 얹고, 복잡한 코드를 짜는 대신 평문 영어로 "방을 정리해줘" 같은 지시를
Qwen
Qwen 은 알리바바 클라우드가 2023년부터 공개해 온 LLM 시리즈로, 현업에서는 보통 "오픈 가중치 + 다국어 + 멀티모달 + 모델 크기 풀라인업" 이라는 네 가지 강점 때문에 채택한다. 자체 인프라에서 돌리는 on-premise|
Qwen
Qwen 시리즈 는 알리바바 다모(DAMO) 아카데미가 2023년 9월의 Qwen-7B 공개를 시작으로 발전시켜 온 트랜스포머 기반 LLM 패밀리다. 동시대의 llama|LLaMA, Mistral, DeepSeek 와 함께 "오픈 가중치 프런티어"
Qwen
Qwen(큐원, 通义千问) 은 중국 알리바바 그룹이 만든 인공지능 언어모델 가족의 이름이다. "통이천문(通义千问)" 이라는 중국어 이름은 "천 가지 질문에 두루 답한다" 는 뜻으로, 사람의 말을
ChatGPT Images 2.0 — '생각하는' 이미지 모델이 도착했다
OpenAI가 4월 21일 라이브스트림에서 chatgpt-images-2를 공개했다. 회사 측 표현으로는 생각하는 능력을 갖춘 첫 이미지 모델. ChatGPT와 codex 사용자라면 누구나 오늘부터 쓸 수 있고, 모바일에서는 앱 업데이트가 필요하다. 개발자는 API에서 gpt-image-2라는
워크스페이스 에이전트와 Codex 업데이트, 컴퓨터 작업의 새 인터페이스로
OpenAI가 이번 주 두 가지 발표를 내놓았다. 하나는 팀 단위로 공유해 쓰는 workspace-agents를 ChatGPT 안에 넣은 것이고, 다른 하나는 개발자 도구였던 codex를 코드 작성 외의 일상 컴퓨터 작업으로 넓힌 것이다.
OpenAI, GPT-5.5 공개… 에이전트 시대로 한 걸음
OpenAI가 새 언어 모델 gpt-5-5를 공개했다. ChatGPT의 Plus·Pro·Business·Enterprise 사용자에게 오늘부터 순차적으로 배포되며, 코딩 도우미 도구인 codex, 개발자용 api, 그리고 github-copilot과 cursor 같은 외부 코딩 앱에서도 같은 날
DeepSeek V4 오픈 가중치 공개, 1.6T MoE와 듀얼 사고 모드
중국 AI 회사 DeepSeek이 4월 25일 차세대 모델 V4 Preview를 공개하고 가중치까지 함께 풀었다. 1조 6천억 매개변수의 V4-Pro와 2840억 매개변수의 V4-Flash 두 가지 버전이며, 한 번에 100만 토큰(책 한
Grok 음성-텍스트 API, 시간당 0.10달러로 시장에 풀리다
xAI가 2026년 4월 17일, 자사 음성 인식 모델을 외부 개발자가 호출할 수 있도록 풀어주는 speech-to-text API를 공개했다. 공식 X 계정 @xai는 "지금 사용 가능", "25개 언어"
OpenAI, 생명과학 추론 모델 'GPT-Rosalind' 공개
OpenAI가 4월 16일 gpt-rosalind라는 새 모델을 공개했다. 생물학·신약 개발·중개의학 연구를 돕도록 만들어진 '추론 특화' 모델로, DNA 이중나선 구조를 밝히는 데 결정적 역할을 한 영국 과학자 rosalind-franklin의
Qwen (통의천문)
Qwen(큐웬)은 중국 알리바바 그룹이 만든 llm 계열입니다. 중국어 이름은 통의천문(通义千问)이고, 영어 약칭이 Qwen입니다. 가장 큰 특징은 두 가지입니다. 첫째, 모델 가중치를 누구나 내려받아 자기 서버나 노트북에서
Qwen (통의천문)
Qwen은 알리바바 클라우드 통의실험실이 공개하는 llm 계열로, llama·Mistral·deepseek 와 함께 자체 호스팅 LLM 후보의 1순위로 꼽힌다. 대부분의 모델이 Apache 2.0 또는 자체 오픈 라이선스로 배포된다. 주요 라인업
Qwen (통의천문)
Qwen 시리즈는 알리바바 클라우드 통의실험실이 2023년부터 공개해 온 llm 패밀리로, 매 세대 기술 보고서를 arXiv에 함께 공개한다. 아키텍처·학습 레시피·평가가 비교적 투명해 llama, deepseek 와 함께 오픈웨이트 연구의 주요
Qwen
Qwen은 알리바바 그룹 Tongyi Lab이 2023년 발표한 dense decoder-only transformer 패밀리로 시작해, 현재는 MoE·멀티모달·장문맥·추론 특화 분파를 포괄하는 폭넓은 모델군이다. 학술적으로 관심 가질 만한 설계 결정과 결과를 정리한다.
Qwen
Qwen(통의 千问, 중국어 발음에 가깝게 "치원" 정도로 읽는다)은 알리바바가 공개하는 대규모 언어모델(LLM) 시리즈다. ChatGPT나 claude 같은 모델을 떠올리면 된다 — 사용자가 글로 질문하면 글로 답하고, 코드를
Qwen
Qwen은 알리바바 Tongyi Lab이 2023년부터 빠르게 반복 공개해 온 오픈 가중치 LLM 패밀리다. 실무에서 챙겨야 할 포인트는 라인업·라이선스·배포·성능 네 축이다. 라인업. 텍스트 주력은 Qwen3로, 0.5B/1.