AI 비즈니스 설계도

글

라벨이 AI인 게시물 표시

공식가 90% 할인 'Claude 암시장', 진짜 위험은 가격이 아닙니다

5월 13, 2026

월 200달러짜리 Claude를 10분의 1 값에 팝니다, 이 광고의 진짜 의미 텔레그램과 타오바오에 이런 광고가 떠다닙니다. "Claude Opus 4.7, 공식가의 10%" . 한 달 200달러짜리 Max 플랜을 여러 명에게 쪼개 팔거나, API 키를 한 토큰당 헐값에 넘기는 식이에요. 솔깃하시죠? 그런데 이 가격이 가능한 진짜 이유를 알면 생각이 좀 달라집니다. 당신이 입력한 모든 프롬프트가 어디로 가는지부터 짚어봐야 하거든요. 90% 할인이 가능한 네 가지 트릭 중국 암시장에서 운영되는 프록시 네트워크(중계소)는 보통 네 가지 방식으로 가격을 깎습니다. 첫째, 무료 체험 크레딧을 받는 가짜 계정을 대량으로 만들어 굴려요 . 둘째, 도난 신용카드로 유료 플랜에 가입한 뒤 API 접근권을 재판매하죠. 셋째, 캄보디아·케냐 같은 곳에서 생체인증을 1인당 30달러 이하로 대행시켜 신원 검증을 우회합니다. 가장 교묘한 게 네 번째예요. "모델 바꿔치기" 입니다. 사용자는 "Claude Opus 4.7로 답변받았다"고 믿지만, 실제로는 그보다 훨씬 저렴한 Haiku나 Qwen 같은 모델이 응답을 만들어 보낸 거죠. 의료 분야 벤치마크에서 측정해보니 공식 API는 정답률 84%, 프록시 서비스는 37% 가 나왔다고 합니다. 같은 모델을 쓰고 있다고 믿었는데 절반 이하 성능이라는 얘기예요. 앤스로픽이 잡아낸 24,000개 계정, 1,600만 건의 쿼리 2026년 2월, 앤스로픽이 보고서를 하나 냈습니다. 24,000개의 사기 계정에서 1,600만 건이 넘는 Claude 쿼리 가 발생했고, 그 배후로 DeepSeek·Moonshot·MiniMax 같은 중국 AI 연구소가 지목됐다는 내용이었어요. 한 "히드라 클러스터"는 단독으로 2만 개 넘는 계정을 굴렸다고 합니다. 일반 고객 요청 사이에 거래량을 섞어 넣어 적발을 피하...

자세한 내용 보기

AI 추론이 깨운 메모리 슈퍼사이클 — DDR5 4배·HBM4 70%·삼성SK가 끌고 가는 2026

5월 11, 2026

DDR5 가격이 4개월 만에 4배가 됐습니다 2026년 1월 기준 글로벌 DDR4·DDR5 가격이 2025년 9월 대비 4배 이상 으로 폭등했습니다. 시장조사업체 TrendForce는 같은 시기 일반 D램 1분기 계약가 상승률 전망을 처음 55~60%에서 90~95% 로 끌어올렸어요. 이런 곡선은 1990년대 이후 거의 본 적이 없는 풍경입니다. 진짜 흥미로운 건, 이번 폭등의 트리거가 단순한 'AI 학습 수요'가 아니라는 점이에요. 추론이 학습을 밀어내자, 메모리 수요가 다 깨어났어요 지난 사이클의 주인공은 엔비디아 GPU + HBM 이었습니다. AI 모델을 학습시키는 데 쓰이는 조합이었죠. 그런데 2025년 후반부터 무게 중심이 '추론(inference)' 으로 빠르게 옮겨갔습니다. 학습은 데이터센터에서 한 번 무겁게 돌리면 끝나지만, 추론은 사용자가 모델을 호출할 때마다 끊임없이 일어나요. AI 에이전트가 실제 서비스에 들어오면 호출량이 자릿수 단위로 뜁니다. 이 변화가 메모리 시장 구조를 바꿨습니다. 추론 워크로드는 GPU 외에 엔비디아의 ASIC, 일반 서버 CPU, 온디바이스 NPU 까지 다양한 칩에 분산됩니다. 결과적으로 한 종류가 아니라 HBM·DDR5·LPDDR5X·GDDR7이 동시에 부족해졌어요. 트렌드포스는 2026년 한 해 AI가 전 세계 D램 웨이퍼 생산량의 약 20%를 가져갈 것으로 봤습니다. 한 번도 본 적 없는 비중입니다. SK 70%·삼성 HBM 25만 장, 두 회사가 같은 방향으로 뛰어요 한국 메모리 두 회사가 이 흐름의 정중앙에 있습니다. SK하이닉스 는 HBM3E에 이어 차세대 HBM4 시장에서 약 70% 점유가 예상돼요. 엔비디아 차세대 'Rubin(루빈)' 플랫폼이 HBM4를 메인 메모리로 삼는 구조라, 사실상 한 회사가 한 세대 전체를 끌고 가는 그림이 그려집니다. CES 2026에서는 16층 적...

자세한 내용 보기

추론형 AI(Reasoning AI)란 무엇인가 — o3·DeepSeek R1·ZAYA1이 만든 새 스케일링 축

5월 09, 2026

o3가 GPT-4가 못 푼 문제를 풀어요, 더 똑똑해서가 아닙니다 GPT-4는 한참을 들여다봐도 풀지 못하던 문제가 있습니다. 그런데 OpenAI의 o3 는 같은 문제를 척척 풀어냅니다. 추상 추론 벤치마크인 ARC-AGI에서 o3가 받은 점수는 45.1% 예요. 같은 시리즈 이전 모델들은 한 자릿수에 머물러 있던 영역입니다. 흥미로운 점은, o3가 GPT-4보다 단순히 '더 큰' 모델이 아니라는 사실이에요. 모델 크기가 아니라 '생각하는 시간' 을 늘려서 만든 차이입니다. 이런 모델들을 묶어서 부르는 새 카테고리가 있습니다. 답을 내기 전에 멈춰서 생각하는 AI예요 '추론형 AI(Reasoning AI)' 또는 '대규모 추론 모델(Large Reasoning Model, LRM)' 이라고 불립니다. 정의는 간단해요. 일반적인 LLM이 입력을 받으면 바로 답을 출력하는 것과 달리, 이 모델들은 답하기 전에 내부적으로 단계를 밟아 생각하는 시간을 가집니다. 수학 문제를 푸는 사람이 종이에 풀이 과정을 적어 가며 검토하듯이요. 차이를 만든 핵심 기술은 강화학습(RL) 입니다. 정답이 있는 문제에서 모델이 스스로 사고를 펼치고, 정답에 가까운 추론 경로를 찾도록 보상을 주는 방식이죠. 그러다 보니 모델이 자발적으로 문제를 분해하고, 가설을 세우고, 검증하고, 틀렸다 싶으면 되돌아가는 '습관'을 익히게 됩니다. 결과적으로 코딩·수학·과학·알고리즘 문제처럼 단계가 많은 문제 에서 큰 성능 도약이 일어났어요. OpenAI o3와 DeepSeek R1, 같은 답에 가격은 20분의 1 현재 추론 모델 시장은 크게 세 갈래예요. 첫째, OpenAI의 o 시리즈(o1·o3·o4-mini) 입니다. 추론 과정을 직접 보여주지 않고 요약만 노출하는 'private chain of thought' 방식이에요. 둘째, 중국...

자세한 내용 보기

AI 에이전트는 더 정교한 프롬프트가 아니라 control flow가 필요하다 — 12-Factor Agents와 LangGraph가 가리키는 같은 방향

5월 09, 2026

프로덕션 에이전트의 90%는 사실 결정적 코드예요 "AI 에이전트"라는 단어를 들으면 자율적으로 사고하고 도구를 골라 일을 처리하는 모습을 떠올리게 됩니다. 그런데 실제로 프로덕션에서 돌아가는 에이전트의 약 90%는 결정적 코드 이고, 그 안에 LLM 호출이 작은 결정 지점에만 박혀 있다는 게 최근 엔지니어들 사이의 공통된 관찰이에요. 그 흐름을 한 문장으로 압축한 표현이 최근 화제가 됐습니다. "Agents need control flow, not more prompts." 그런데 왜 갑자기 이런 주장이 동시에 여러 곳에서 튀어나왔을까요. 70~80%에서 멈춥니다, 그게 모든 LLM 에이전트의 벽이에요 데모는 멋지게 돌아갑니다. 그런데 같은 에이전트를 실제 사용자에게 넘기는 순간 일관되게 동일한 벽에 부딪힙니다. 신뢰성이 70~80% 부근에서 멈춰버리는 현상 이에요. 무한 루프에 빠지거나, 잘못된 도구 호출을 만들거나, 자기 상태를 잊어버리는 식이죠. 한 엔지니어는 자기 경험을 이렇게 표현했어요. "약 30개 파일을 넘어서면 LLM이 통제하는 흐름이 무너집니다. 어떤 파일은 빼먹고, 어떤 파일은 세 번씩 테스트하고, 한 파일에서 에러가 나면 이전에 잘 동작하던 네 개를 다시 검사하기 시작합니다." 자율성을 줬더니 안정성이 떨어진 거죠. 이건 모델이 멍청해서가 아니라, 언어 생성 자체에는 '제어' 개념이 없기 때문 이라는 게 핵심입니다. 더 정교한 프롬프트로는 그 벽을 못 넘어요 기존 접근은 보통 두 갈래였습니다. 하나는 프롬프트 체인을 점점 정교하게 만드는 방향, 다른 하나는 사람이 옆에서 베이비시팅 해 주는 방향이었어요. 둘 다 한계가 분명합니다. 프롬프트 체인은 길어질수록 분기마다 실패 확률이 곱연산으로 늘고, 베이비시팅은 자동화의 의미가 사라지죠. 최근 담론은 결론을 단순하게 정리합니다. "...

자세한 내용 보기

camofox-browser, AI 에이전트가 Cloudflare를 통과하는 법 — Camoufox 엔진의 C++ 단 위장

5월 08, 2026

Cloudflare도 못 잡는다는 브라우저, GitHub 별 4천 개가 붙은 이유 Playwright로 자동화 스크립트를 짜본 분이라면 한 번쯤 막힌 경험이 있으실 거예요. Cloudflare 챌린지, "사람인지 확인" 페이지, Google 캡차 같은 벽이죠. camofox-browser 는 이 벽을 다른 방식으로 돌아가는 오픈소스 프로젝트인데, 5월 7일 v1.9.0이 풀린 시점에 GitHub 별이 4,000개를 넘겼습니다. 이름은 'camo + fox', 곧 위장한 파이어폭스라는 뜻이에요. 그런데 진짜 흥미로운 건 위장 방식 자체가 기존 도구들과 한 단계 다르다는 점입니다. Camoufox 엔진을 REST API로 감쌌어요, AI 에이전트용으로 camofox-browser의 정체는 단순하게 표현하면 "Camoufox 엔진 위에 얹은 헤드리스 브라우저 서버" 입니다. Camoufox는 Firefox를 포크해서 지문 위장 기능을 C++ 단에 박아 둔 별도의 브라우저 엔진이에요. jo-inc가 만든 camofox-browser는 그 엔진을 가져다 REST API + Playwright 호환 인터페이스 로 감싸 주는 역할을 합니다. 설치는 보통의 Node 프로젝트와 다르지 않아요. clone 하고 npm install 한 뒤 서버를 띄우면 localhost:9377 에 자동화 엔드포인트가 열립니다. AI 에이전트(예: LangChain·LlamaIndex 기반 자동화 봇)가 이 포트를 통해 페이지를 열고, 클릭하고, 텍스트를 읽는 식이죠. Playwright API와 호환돼서 기존 스크립트를 거의 수정 없이 옮길 수 있다는 점이 가장 큰 매력 포인트입니다. 라이선스는 MIT, 언어 비중은 자바스크립트 94.1%·타입스크립트 4.4%예요. 왜 C++ 레벨 패치가 다른가요 기존 안티디텍트 도구 대부분은 자바스크립트 영역에서 지문을 바꿔치기합...

자세한 내용 보기

ChatGPT는 거들 뿐 — AI는 이미 차·공장·창고 안에 박혀 있습니다 (2026 현장 르포)

5월 07, 2026

ChatGPT는 거들 뿐 — AI는 이미 차·공장·창고 안에 박혀 있습니다 AI 얘기를 들으면 우리 머릿속에는 보통 ChatGPT 화면이 떠오릅니다. 그런데 정작 가장 먼저, 가장 깊게 자리 잡은 AI는 클라우드가 아니라 자동차 운전석, 공장 천장, 창고 선반 안에 박혀 있어요. 테슬라가 외부 자극을 0.3초 만에 처리하고, 아마존 창고에선 로봇 75만 대가 배송 4건 중 3건을 만집니다. 같은 시점에 아우디 도장 라인은 사람보다 먼저 결함을 잡아내고 있어요. 이 글에서는 2026년 현재 '진짜 현장에 들어간 AI'의 모습을 사례별로 정리해 보겠습니다. 0.3초, 테슬라 FSD v14.3이 보여주는 차량 안 AI 2026년 4월 테슬라가 공개한 자율주행 소프트웨어 FSD v14.3 의 핵심 숫자는 두 개예요. 차량이 주변 상황을 인지·판단·반응하는 속도가 이전 버전보다 약 20% 빨라졌고 , 인지에서 행동까지 걸리는 시간이 0.3초 수준에 들어왔습니다. 사람의 평균 반응 시간(0.5~0.7초)보다 분명히 빠릅니다. 중요한 건 이 모든 처리가 차량 안 AI 컴퓨터에서 직접 이뤄진다 는 점이에요. 데이터를 클라우드로 보내고 답을 기다릴 시간이 없으니까요. 테슬라는 이번 버전에서 모델 컴파일 방식을 MLIR로 전면 바꾼 것으로 알려졌고, 그게 속도 향상의 큰 축입니다. 다만 구형 하드웨어(HW3) 차량은 v14.3 본체를 못 받고 별도 'FSD V14 Lite'를 2026년 2분기에 받게 됩니다. 같은 브랜드 안에서도 하드웨어가 능력을 가르는 시대가 됐다는 뜻이에요. 아우디·현대 공장은 사람보다 먼저 결함을 잡습니다 자동차를 '만드는' 쪽으로 가도 그림이 비슷해요. 아우디는 독일 넥카르술름 공장에 'ProcessGuardAI' 라는 플랫폼을 깔고, 도장 공정을 실시간으로 모니터링합니다. 전처리 약품 투입량 최적화와 전착도장 이상...

자세한 내용 보기

GPU 옆에 SSD를 붙인다? AI 반도체의 다음 카드 'HBF' 쉽게 정리

4월 29, 2026

도입 GPU 32개로 돌리던 AI 작업을 단 2개로 줄였습니다. 같은 모델, 같은 결과를 더 빠른 속도로요. SK하이닉스가 자체 시뮬레이션에서 공개한 숫자입니다. 비결은 더 강력한 GPU가 아니었어요. 그 옆에 새로 붙이는 메모리 한 종류였습니다. 요즘 AI 반도체 업계의 화제 한가운데에 있는 이름, 바로 HBF(High Bandwidth Flash) 인데요. 도대체 이게 뭐길래 이렇게 시끄러운 걸까요. 핵심 내용 요약 한 줄로 요약하면 이렇습니다. HBF는 "GPU 옆에 직접 붙이는 거대 용량 플래시 메모리" 입니다. 지금까지 AI 칩 옆에 붙던 HBM(고대역폭 메모리)이 빠른 D램으로 채워졌다면, HBF는 같은 적층 패키징을 그대로 가져오되 그 안을 NAND 플래시로 채워요. 결과는요? HBM 대비 용량이 약 8~16배인데 대역폭은 비슷합니다. SK하이닉스는 HBM 단독 대비 동시 쿼리 처리량이 최대 18.8배 늘고, 와트당 성능이 2.69배 올랐다는 시뮬레이션을 공개했어요. 쉽게 풀어 설명 비유로 풀어볼게요. AI 모델은 음식을 만드는 주방 같은 거예요. GPU는 셰프, HBM은 셰프 손이 닿는 작업대 위 재료 트레이입니다. 빠르고 가깝지만, 좁아요. 반대로 SSD는 지하 창고예요. 어마어마한 양을 쌓아둘 수 있지만 갔다 오는 데 시간이 걸리죠. HBF는 그 사이에 놓이는 "주방 옆 대용량 냉장고"입니다. 작업대만큼 빠르진 않아도, 작업대보다 훨씬 큰 양을 손 닿는 거리에 둘 수 있어요. 거대 LLM을 통째로 GPU 옆에 올려두고 부르면 곧장 꺼내 쓰는 식이죠. 기술적으로는 NAND 플래시 다이를 TSV(실리콘 관통 전극) 기술로 수직 적층해서, 인터포저 위에 GPU와 나란히 올리는 구조예요. HBM이 쓰던 패키징 노하우를 그대로 빌려옵니다. 샌디스크와 SK하이닉스는 2025년 8월 함께 표준화하기로 손을 잡았고, 2026년 2월 25일...

자세한 내용 보기

사람 손 없이 논문 한 편을 쓴 AI — 자율 ML 에이전트 4가지 사례 (2026)

4월 28, 2026

도입 논문 한 편을 사람 손 없이 처음부터 끝까지 쓴 AI가 있습니다. 아이디어 발굴, 코드 작성, 실험, 그래프 그리기, 본문 집필, 심지어 자체 동료심사까지요. 비용은 단돈 6~15달러 였습니다. 한 끼 식사 값으로 학술 논문 한 편이 나오는 시대가 정말 온 걸까요. 더 놀라운 건 이게 '먼 미래'가 아니라는 점입니다. 메타, 사카나AI, 허깅페이스에서 이미 일이 벌어지고 있어요. 핵심 내용 요약 최근 1년 사이에 'AI가 AI를 개발한다'는 컨셉은 네 가지 흐름으로 한꺼번에 터져 나왔습니다. 첫째, 사카나AI의 AI Scientist v2 가 Nature에 게재됐고, 처음으로 완전 자동 생성된 논문이 사람 동료심사를 통과했습니다. 둘째, 메타의 REA(Ranking Engineer Agent) 는 광고 랭킹 ML 모델 6개의 정확도를 평균 2배로 끌어올렸어요. 셋째, 허깅페이스의 ml-intern 은 논문 읽기부터 학습·배포까지 자동화하는 오픈소스 ML 엔지니어 에이전트입니다. 넷째, 메타·옥스퍼드·UBC·NYU 공동 연구팀이 3월 19일 공개한 HyperAgents 는 자기개선 전략을 다른 도메인으로 전이시키는 데 성공했습니다. 쉽게 풀어 설명 'AI가 AI를 만든다'는 말이 구체적으로 어떤 모습일까요. ML 엔지니어가 모델 하나를 개선하는 과정을 떠올려 봅시다. 보통 이렇게 진행됩니다. 가설 세우기 → 코드 짜기 → 학습 돌리기 → 실패하면 디버깅 → 결과 분석 → 다음 실험 설계 → 논문이나 제품으로 마무리 . 한 사이클에 며칠, 길면 몇 주가 걸려요. 이 모든 단계를 에이전트 한 무리가 자율적으로 돌리는 게 핵심입니다. 메타 REA는 가설을 만들고 학습 잡(job)을 띄우고 실패한 실험을 디버깅한 뒤 다음 실험을 설계하는 루프를 사람 개입 없이 돕니다. 사카나 AI Scientist는 더 나아가 논문 작성과 자기 동료심사까...

자세한 내용 보기

GPT-5.5 vs Claude Opus 4.7, 에이전트로 쓸 때 진짜 차이는 점수가 아니었습니다

4월 28, 2026

도입 한 모델이 똑같은 코딩 작업을 하면서 다른 모델보다 72% 적은 출력 토큰 으로 끝냅니다. 그게 GPT-5.5와 Claude Opus 4.7 사이의 가장 솔직한 격차예요. 벤치마크 점수만 보면 GPT-5.5가 한 걸음 앞서 있는 것 같은데, 정작 Cursor와 Claude Code를 매일 쓰는 개발자들은 여전히 큰 리팩토링은 Opus 4.7에 맡깁니다. 무슨 일이 벌어지고 있는 걸까요. 두 모델을 에이전트로 쓸 때 무엇이 다른지부터 풀어 볼게요. 핵심 내용 요약 두 모델은 일주일 사이에 연달아 나왔습니다. Claude Opus 4.7은 4월 16일 , GPT-5.5는 4월 23일 에 공개됐어요. 둘 다 1M 토큰 컨텍스트를 지원합니다. 입력 가격은 100만 토큰당 5달러로 같지만, 출력은 GPT-5.5가 30달러, Opus 4.7이 25달러로 후자가 조금 쌉니다. 강점은 칼같이 갈려 있어요. GPT-5.5는 GPT-4.5 이후 처음으로 밑바닥부터 재훈련한 베이스 모델이고, '계획해서 실행하는' 작업에서 앞섭니다. 반대로 Opus 4.7은 코드베이스를 통째로 읽고 이해해서 PR을 마무리하는 쪽에서 우위예요. 그리고 위에서 말한 토큰 효율 — 출력 길이의 차이가 에이전트 비용을 결정하는 실제 변수가 됩니다. 쉽게 풀어 설명 벤치마크를 두 그룹으로 묶어 보면 차이가 분명해집니다. 첫 번째는 '계획·실행' 영역이에요. 터미널을 열고 명령어를 짜서 일을 처리하는 Terminal-Bench 2.0에서 GPT-5.5가 82.7%, Opus 4.7이 69.4%를 받았습니다. 13점 차이는 작지 않죠. 컴퓨터를 직접 조작하는 OSWorld-Verified에서도 GPT-5.5가 78.7%로 앞섭니다. 두 번째는 '코드베이스 이해' 영역입니다. 실제 깃허브 이슈를 해결하는 SWE-bench Pro에서 Opus 4.7은 64.3%, GPT-5.5는...

자세한 내용 보기

에이전트 = 모델 + 하네스 — 2026년 AI 업계가 '하네스 엔지니어링'에 꽂힌 이유

4월 28, 2026

도입 AI 에이전트 프로젝트 10개 중 약 9개는 실제 서비스로 올라가지 못한다 고 합니다. 그것도 모델이 멍청해서가 아니에요. 가트너 분석에 따르면 기업 AI 실패의 65%가 모델 바깥의 시스템에서 생긴다고 합니다. 그래서 요즘 실리콘밸리에서 부쩍 자주 들리는 단어가 있어요. "하네스 엔지니어링(harness engineering)"입니다. 도대체 이게 뭐길래 한꺼번에 이렇게 떠들썩한 걸까요. 핵심 내용 요약 한 줄로 정리하면 이렇습니다. 에이전트(Agent) = 모델(Model) + 하네스(Harness). 모델은 우리가 흔히 아는 GPT나 클로드(Claude) 같은 거예요. 하네스는 그 모델을 둘러싸고 있는 모든 것입니다. 어떤 도구를 호출할지, 어디까지 권한을 줄지, 무엇을 기억하고 무엇을 잊을지, 결과물이 제대로 나왔는지 누가 채점할지 같은 것들이죠. 모델이 "뇌"라면, 하네스는 그 뇌가 일할 수 있도록 차려놓은 "작업장"에 가깝습니다. 쉽게 풀어 설명 비유로 풀어볼게요. 천재 외과의사가 한 명 있다고 칩시다. 의사 본인이 아무리 뛰어나도 수술실이 엉망이면 결과가 좋을 리 없겠죠. 메스가 어디 있는지 모르고, 환자 차트도 없고, 마취 기계도 안 켜져 있다면요. AI 모델도 똑같습니다. 모델 자체는 뛰어나도, 도구·기억·권한·검증 같은 "수술실 정돈"이 빠지면 헛발질을 합니다. 소트웍스의 비르기타 뵈켈러는 2026년 4월 2일 마틴 파울러 사이트에 올린 글에서 하네스를 두 방향의 제어 로 설명합니다. 하나는 가이드(feedforward) — 에이전트가 행동하기 전에 미리 막아주는 장치예요. 다른 하나는 센서(feedback) — 행동한 다음 에 결과를 보고 스스로 고치게 하는 장치죠. 코드 작성을 예로 들면, 린터(Linter)나 타입체커가 가이드 역할을 하고, 자동 테스트나 AI 코드 리뷰가 센서 역할을 합니다. 영향 분석 ...

자세한 내용 보기

이 블로그 검색

AI 비즈니스 설계도

글

Pinned Post

공식가 90% 할인 'Claude 암시장', 진짜 위험은 가격이 아닙니다

공식가 90% 할인 'Claude 암시장', 진짜 위험은 가격이 아닙니다

AI 추론이 깨운 메모리 슈퍼사이클 — DDR5 4배·HBM4 70%·삼성SK가 끌고 가는 2026

추론형 AI(Reasoning AI)란 무엇인가 — o3·DeepSeek R1·ZAYA1이 만든 새 스케일링 축

AI 에이전트는 더 정교한 프롬프트가 아니라 control flow가 필요하다 — 12-Factor Agents와 LangGraph가 가리키는 같은 방향

camofox-browser, AI 에이전트가 Cloudflare를 통과하는 법 — Camoufox 엔진의 C++ 단 위장

ChatGPT는 거들 뿐 — AI는 이미 차·공장·창고 안에 박혀 있습니다 (2026 현장 르포)

GPU 옆에 SSD를 붙인다? AI 반도체의 다음 카드 'HBF' 쉽게 정리

사람 손 없이 논문 한 편을 쓴 AI — 자율 ML 에이전트 4가지 사례 (2026)

GPT-5.5 vs Claude Opus 4.7, 에이전트로 쓸 때 진짜 차이는 점수가 아니었습니다

에이전트 = 모델 + 하네스 — 2026년 AI 업계가 '하네스 엔지니어링'에 꽂힌 이유