Creeta — AI 개발자 도구 · 생태계 뉴스

메타의 상시 착용 펜던트, 나만이 아닌 방 안 모든 사람을 녹음한다

The Information이 보도한 알렉스 히멜의 내부 메모에 따르면, 메타의 AI 펜던트 로드맵에는 주변 오디오 상시 캡처, 실시간 전사, Limitless 인수를 기반으로 한 기업용 'Wearables for Work' 구독 티어가 포함된다.

커널 스케줄러 제거로 MI300X에서 초당 3,000 토큰 달성

Kog AI 모노커널: 커널 실행을 없애 AMD MI300X에서 초당 약 3,000 토큰 달성. 주의사항 포함 기술 분석.

Windsurf, 이제 Devin으로 — Cascade 7월 1일 종료

Cognition이 6월 2일 Windsurf를 Devin Desktop으로 개명했다. 무엇이 바뀌었는지, 무엇이 문제인지, IT 관리자가 지금 해야 할 일을 정리했다.

Nemotron 3 Ultra, 6월 4일 출시. 실제로 작동하는 호출 방법은 이렇다.

NVIDIA Nemotron 3 Ultra GA 6월 4일: NIM/OpenRouter 호출 방법, 최소 하드웨어 요구사항, 베이스 체크포인트 주의사항.

Composer 2.5, 비용은 60분의 1로 최상위권 근접

Composer 2.5: Artificial Analysis Coding Index 3위, 작업당 $0.07 — 최근접 경쟁사 $4.10 대비 압도적 비용 우위. 요금제 선택, 효과적인 프롬프트 전략, 독립 평가 점수의 실제 의미를 분석한다.

GitHub 스타 4개, Ollama 음성 면접 트레이너 — GrillKit

Apache 2.0 라이선스 면접 트레이너. Whisper 음성 입력, Ollama 또는 클라우드 LLM 지원, 로컬 세션 기록 제공. SaaS 불필요, 회원가입 없음.

RDNA3, llama.cpp KV VRAM 47% 절감 — CUDA에는 동급 기능 없어

RDNA3 비트 패킹으로 RX 7900에서 llama.cpp KV VRAM 47% 절감. 플래그, VRAM 계산, 4.9× 압축을 위한 TurboQuant.

NodeCartel 접속 불가. 크로스 호스트 AI 오케스트레이션: 실제 대안은?

NodeCartel 접속 불가. Kore.ai, CrewAI Cloud, Northflank, AgentNode Pro의 크로스 호스트 AI 스케줄링 비교 분석.

17k 토큰 → 1.4k — Headroom이 원본을 언제든 복원 가능하게 유지

에이전트 파이프라인용 오픈소스 컨텍스트 압축 미들웨어: 토큰 60–95% 절감, CCR 가역성, AST 인식 엔진.

Cognition의 260억 달러, 12월까지 10억 달러 ARR이 필요하다. 수치가 빠듯하다.

4억 9,200만 달러 ARR에 260억 달러 밸류에이션: Cognition 시리즈 D 지표, Windsurf 기여 귀속 문제, 10억 달러 ARR 목표.

졸업식에서 야유를 받다 — 당신이 제품을 만들어야 할 AI 회의론자들

MIT 테크놀로지 리뷰 2026년 5월 과대평가 지수: 졸업식 야유, Z세대 정서(46%), 사상 최고 AI 투자 현황을 다룬다.

Opus 4.8, budget_tokens 폐기 — 그 외 변경 사항 총정리

Opus 4.8: 빠른 모드, 세션 중간 시스템 프롬프트, 1K 캐시 하한. 기존 budget_tokens 구문은 400 오류 반환.

Showing of 182 posts