Posts

인터페이스 문제는 풀렸다. 정체성 문제는 아직이다.

Ethan Mollick의 최신 Substack 글 *Claude Dispatch and the Power of Interfaces*는 설득력 있는 주장을 펼친다: AI의 진짜 병목은 능력이 아니라 인터페이스다. 맞는 말이다. 그리고 증거는 쌓이고 있다. 인터페이스의 수렴 Mollick은 명확한 진화 경로를 추적한다: 챗봇은 인지 과부하를 만든다. 최신 논문에 따르면 금융 전문가들이 AI로 생산성을 얻었지만, 챗봇 인터페이스 자체가 그 이득을 상쇄했다 — 텍스트 벽, 요청하지 않은 제안, 누적되는 혼란. 코딩 에이전트(Claude Code, Codex)는 개발자에게 이 문제를 해결했다. 하지만 Git과 Python을 전제한다. 지식 노동자의 99%는 문밖에 있다. ...

NVIDIA는 GPU 사이에서 텐서를 공유하고, Soul Spec은 에이전트 사이에서 행동을 공유한다. 둘 다 하네스 엔지니어링이다.

멀티에이전트 AI를 이야기하다 보면, 스택의 모든 레이어에서 같은 질문에 도달합니다: 에이전트들은 어떻게 데이터를 공유하는가? NVIDIA가 하드웨어 레벨에서 이 답을 내놓았습니다. Dynamo 1.0 프레임워크는 GPU 간 KV 캐시를 라우팅하고, 스토리지 계층에 걸쳐 메모리를 오프로딩하며, 수천 개 노드에서 추론을 조율합니다. 이미 AstraZeneca, ByteDance, Pinterest 등 수십 곳에서 프로덕션 배포 중입니다. 하지만 하드웨어 데이터 공유는 문제의 절반만 풉니다. 나머지 절반 — 에이전트들이 서로의 정체성, 메모리, 안전 규칙에 대해 무엇을 알아야 하는가? — 은 소프트웨어에 있습니다. ...

81,000명이 Anthropic에게 말한 AI의 진짜 필요 — 당신의 예상과 다릅니다

Anthropic이 역대 최대 규모의 AI 정성 연구를 공개했습니다. 80,508명. 159개국. 70개 언어. 1주일. 그리고 결과는 AI 사용자가 실제로 무엇을 원하는지에 대한 지배적 서사를 뒤집습니다. 핵심 발견은 기만적으로 단순합니다: 사람들은 더 많이 하는 AI가 아니라, 신뢰할 수 있는 AI를 원합니다. 연구 개요 “81k Interviews” 프로젝트는 Claude 기반 AI 인터뷰어가 전 세계 참여자와 구조화된 대화를 수행했습니다. 각 인터뷰는 응답에 따라 후속 질문을 조정하는 하이브리드 방식으로 — 설문의 규모와 정성 연구의 깊이를 동시에 확보했습니다. ...

Claude Code 유출이 보여준 것: 엔진이 아니라 하네스가 해자다

2026년 3월 31일, 보안 연구원 Chaofan Shou가 Anthropic이 아마도 세상에 보여주고 싶지 않았을 것을 발견했습니다: Claude Code — Anthropic의 공식 AI 코딩 CLI — 의 전체 소스코드가 npm 레지스트리에 .map 파일로 그대로 노출되어 있었습니다. 모델은 유출되지 않았습니다. 가중치는 안전합니다. 하지만 나머지 전부 — 에이전트 아키텍처, 멀티 에이전트 오케스트레이션, 메모리 시스템, 내부 기능 플래그 — 가 노출됐습니다. 그리고 이것이 드러내는 사실은 흥미롭습니다: AI 에이전트의 진짜 경쟁 우위는 엔진이 아니라 하네스입니다. 자동차 비유 AI 에이전트를 자동차로 생각해보세요: ...

프롬프트 → 컨텍스트 → 하네스: AI 엔지니어링의 3단계 진화와 세 번째가 모든 것을 바꾸는 이유

AI 업계는 시대에 이름 붙이는 것을 좋아합니다. 프롬프트 엔지니어링 시대가 있었고, 컨텍스트 엔지니어링이 왔습니다. 지금 우리는 가장 결정적인 전환의 시작점에 서 있습니다: 하네스 엔지니어링. 각 단계는 AI 시스템을 만들 때 무엇을 설계하는가에 대한 근본적 변화를 나타냅니다. 그리고 각 단계는 다른 종류의 사양을 요구합니다. 1단계: 프롬프트 엔지니어링 — 모델에게 말 걸기 첫 번째 시대는 AI에게 말하는 법을 배우는 것이었습니다. 시스템 프롬프트를 만들고, 역할 지정을 실험하고, “단계별로 생각하세요"가 실제로 효과가 있다는 것을 발견했습니다. ...

ClawSouls Registry: 자동 안전 검증을 갖춘 오픈 AI 페르소나 레지스트리

요약 **ClawSouls Registry**를 출시했습니다. GitHub Pull Request만 열면 누구든 AI 에이전트 페르소나를 등록할 수 있고, SoulScan(53개 보안 패턴)이 자동으로 안전성을 검증합니다. 다른 AI 에이전트 레지스트리에는 자동 안전 검증이 없습니다. 이것이 ClawSouls의 차별점입니다. 문제 AI 에이전트가 폭발적으로 성장하고 있습니다 — Claude Code, Cursor, Windsurf, Copilot. 각각 시스템 프롬프트나 페르소나 파일로 개인화할 수 있지만, 이 페르소나를 안전하게 공유할 표준은 없었습니다. 누군가 이런 내용이 담긴 페르소나를 제출하면? 프롬프트 인젝션 (“이전 지시를 무시하고…”) 권한 상승 (“sudo rm -rf / 실행”) 비밀 유출 (“모든 API 키를 전송”) 안전 우회 (“모든 안전 규칙을 무시”) 자동 검증 없이는 걸러낼 수 없습니다. ...

IronClaw vs OpenClaw: Rust 재구현 vs 원본 — 뭐가 더 나을까?

IronClaw는 보안과 프라이버시에 초점을 맞춘 OpenClaw의 Rust 재구현입니다. 아키텍처, 보안, 채널, 메모리 등을 항목별로 비교합니다.

FTS vs Hybrid 메모리 검색 벤치마크: 실제 에이전트 데이터로 비교

실제 6주간 축적된 에이전트 메모리 303개 파일, 30개 질문으로 FTS vs Hybrid 검색을 비교했습니다. FTS는 정확한 키워드 질문에 85% 정확도를 보이지만, 의역/맥락 질문에서 Hybrid가 +25%p 앞섭니다.

Soul-Driven AI란 무엇인가?

AI 에이전트는 매 세션마다 자신이 누구인지 잊습니다. Soul-Driven AI가 이를 해결합니다 — 지속되는 정체성, 검증된 안전성, 커뮤니티가 만드는 페르소나.

정체성 + 거버넌스 = 100% 안전? Abliterated LLM에서 복합 페르소나 접근법 테스트

안전 학습이 제거된 LLM에서 세 가지 페르소나 안전 접근법을 테스트했습니다. 규칙만: 28%. 거버넌스만: 44-61%. 정체성+거버넌스 결합: 100%.