dogfood 를 활용한 하네스를 만들 수 있는지 연구 중
dogfood라는 개념을 만난 배경
dogfood. 개념을 명확하게 이해하고 있는 것은 아닌데, 대략 이해한 바대로 설명을 드리자면, 제가 만든 서비스를 제가 직접 그 사용자의 입장이 돼서 그 서비스를 개발하는 방법론(?)이라고 이해하고 있습니다.
원래는 AI에게 필요한 내용을 코드로 구현시키고 제가 직접 웹브라우저를 통해서 검수를 하는 방식으로 개발을 이어가고 있습니다. 근데, 이것 마저도 AI에게 맡길 수 있으면 더 빠르게 더 정확하게 생산성 있게 개발을 할 수 있지 않을까 하는 고민이 생기게 됐습니다.
페르소나 기반 dogfood 하네스의 구상
이 서비스를 이용할 것으로 예정하는 대상의 페르소나를 몇몇 구성하고, 각자 직접 웹브라우저 mcp를 통해 로컬에 구동된 서비스를 접속해서 정의된 내용에 의해 그 서비스를 실제 필요로 하는 업무에서 도움을 받고자 하는 기대하는 부분을 조작하게 해서 예상대로 도움이 됐는지 어디서 막혔는지 등을 일일이 보고 받고 종합해서 보완할 부분을 보완해보는 전략입니다.
지금까지 시도한 것과 남은 과제
이러한 일련의 과정을 위해서는 서버 구동 및 페르소나별로 계정 생성, 시나리오 작성 등을 세세하게 하네스로 구성해야 합니다. 지금까지 시도한 것은 우선 각 페르소나가 병렬적으로 playwright mcp를 제어할 수 있게 한 것입니다.
계정 공유 문제
그 이외에는 각 페르소나가 각 계정을 가져야 하는데, 하나의 계정을 공유하는 문제가 있어서 이부분에 대한 조치가 필요합니다.
페르소나 갯수와 토큰 비용의 트레이드오프
추가로는, 페르소나의 갯수가 꼭 6개나 필요한지 입니다. 각 agent가 playwright mcp를 이용해서 이것저것 실험을 하게 되면, 토큰 사용이 기하급수적으로 늘어납니다. 제 생각에는 3-4개 정도로만 구성해도 충분할 거 같아서, 갯수는 줄이고, 워크플로우가 더 매끄러워질 수 있도록 하네스를 더 다듬을 예정입니다.
관련 글
Claude Code 하네스: 1인 개발자가 AI 에이전트 팀을 만드는 법
1인 개발자가 Claude Code로 전문가 AI 팀을 구성한 경험. 에이전트, 스킬, 오케스트레이터로 이루어진 하네스 구조와 모노레포 풀스택 개발 자동화 사례를 공유합니다.
Claude Code 하네스: 리서치부터 글쓰기까지, 하나의 구조로 확장하기
Claude Code 하네스를 리서치, 디자인, 글쓰기, 분석, 데이터 파이프라인에 확장한 사례. 팬아웃, 파이프라인, 생성-검증 세 가지 아키텍처 패턴과 5개 실전 하네스를 공유합니다.
요즘 고민하는 것 : 추상화
AI 시대에 추상화와 테스트 코드가 왜 더 중요해졌는지에 대한 고민. 자연어보다 인터페이스로 명세를 작성하고, 테스트로 검증하는 것이 더 정확하고 신뢰할 수 있다는 생각을 정리했습니다.