Creeta
Step 3.7 Flash는 드롭인 교체 가능 — 단 하나의 엔드포인트 세부사항 제외
StepFun Step 3.7 Flash: 네이티브 비전과 어드바이저 모드를 갖춘 198B MoE 모델로, OpenAI 호환 API를 즉시 사용 가능. 엔드포인트 주의사항 및 reasoning_effort 예제 포함.
Step 3.7 Flash is a drop-in — except for one endpoint detail
StepFun Step 3.7 Flash: 198B MoE with native vision, Advisor Mode, and an OpenAI-compatible API you can call today. Includes endpoint gotchas and reasoning_effort examples.
RL 알고리즘은 당신이 고르지 않는다 — SIA의 피드백 루프가 결정한다
SIA는 스캐폴드와 LoRA 가중치를 하나의 루프에서 공동 진화시킵니다. 설치, LawBench 실행, 커스텀 평가 추가까지 — Hexo Labs, 2026년 5월.
You don't pick the RL algorithm — SIA's Feedback loop does
SIA co-evolves scaffold and LoRA weights in one loop. Install, run LawBench, and add custom evals — Hexo Labs, May 2026.
NVIDIA, Qwen3.6-35B을 3배 압축했지만 정확도는 거의 그대로
HuggingFace의 NVIDIA NVFP4 Qwen3.6-35B 체크포인트: 메모리 3.06배 절감, 정확도 손실 1% 미만, Blackwell 네이티브 지원, vLLM 플래그 포함.
NVIDIA cut Qwen3.6-35B 3×. Accuracy barely moved.
NVIDIA's NVFP4 Qwen3.6-35B checkpoint on HuggingFace: 3.06× memory reduction, <1% accuracy loss, Blackwell-native, vLLM flags included.
인증 정보는 Overslash가 보관합니다. AI에게는 핸들만 전달됩니다.
Overslash는 게이트웨이에서 핸들로 시크릿을 주입하고, 에이전트별 영향 범위를 제한하며, 범위를 벗어난 요청은 인간 승인으로 에스컬레이션합니다. 셀프호스팅 무료 또는 좌석당 €3 클라우드.
Overslash holds the credentials. Your AI only gets a handle.
Overslash injects secrets by handle at the gateway, limits blast radius per agent, and escalates out-of-scope calls to human approval. Free self-hosted or €3/seat cloud.
하네스 수정이 GPU 커널을 10배 느리게 했다. 가중치가 해결했다.
SIA는 스캐폴드를 수정하고 LoRA로 가중치를 파인튜닝한다 — LawBench 70.1%, GPU 커널 12.4% 속도 향상, MIT 라이선스.
Harness edits slowed the GPU kernel 10×. Weights fixed it.
SIA edits its scaffold and fine-tunes weights via LoRA — 70.1% LawBench, 12.4% faster GPU kernels, MIT-licensed.
Omni는 리렌더링을 건너뛴다 — 9가지 데모로 보는 차이점
Gemini Omni·3.5 Flash 데모 분석: I/O 2026 클립 9개, 장면 보존 vs 병렬 코딩, API 제공 현황.
Omni skips the re-render — nine demos show the difference
Gemini Omni and 3.5 Flash demo breakdown: nine I/O 2026 clips, scene-preservation vs parallel coding, API availability.