AI Project OS 開発日記1:単発で使うのをやめた日 —“群れ”と“ループ”の作り方
前回までは「AI を疑い、御す」話だった。今回は、使い方そのものを単発の対話から“群れ”と“ループ”へ変える。概念だけでは動かないので、今回はやり方(定義ファイル・プロンプト・コマンド)まで全部書く。題材は Claude Code。
1. サブエージェントで「専門家」を呼ぶ
苦労していたこと:ひとつの会話に何でも詰め込むと、コンテキストが膨らみ、視点が偏る。長い校正やレビューを頼むと、本筋の作業まで薄まってしまう。
やり方:役割ごとに「専門エージェント」を1ファイルで定義する。.claude/agents/<名前>.md に、YAML フロントマター(名前・使いどころ・許可ツール・モデル)と、その人格のシステムプロンプトを書くだけだ。
# .claude/agents/proofreader.md
---
name: proofreader
description: 日本語の文章をプロのライターとして校正する。校正や推敲を頼まれたら使う。
tools: Read, Edit
model: sonnet
---
あなたはプロの日本語テックライター兼校正者です。
渡された文章の誤字脱字・表記ゆれ・不自然さを直し、完成版だけを返す。
コード・URL・固有名詞は変更しない。
あとはチャットで「proofreader で校正して」と頼むだけ。そのエージェントが別コンテキストで走り、結論だけを親に返す。description が合致すれば、自動で委譲もされる。役割の違うエージェントを並列で複数投げると、まとめて速い。
効いた理由:親の文脈が汚れない。独立した視点が入り、「自分の文章を自分で褒める病」が消える。実際この日記も、本文は私が書き、校正はこの proofreader に投げている。
2. アドバーサリアル検証で、幻覚を“多数決”で殺す
苦労していたこと:AI の「できました」「これで正しい」は、自信満々のまま間違っていることがある。静かに通る嘘が、いちばんこわい。
やり方(対話で):結論を、そのまま検証に回す。次のように投げるだけだ。
次の結論を検証して。
独立したサブエージェントを3体立て、各自に「これを反証しろ。確信が無ければ反証扱いにしろ」と指示。
過半数が反証できたら、その結論は棄却。観点は 正確性 / セキュリティ / 再現性 で分けること。
結論: (検証したい主張をここに書く)
やり方(自動化で):決定論的に回すなら、オーケストレーションで「3体並列 → 多数決」を1ブロックにまとめる。
// 独立した3体に反証させ、2体以上が生き残らせたら採用(多数決)
const votes = await parallel(Array.from({ length: 3 }, () => () =>
agent(`主張を反証せよ。確信が無ければ refuted=true。主張: ${claim}`, { schema: VERDICT })));
const ok = votes.filter(Boolean).filter(v => !v.refuted).length >= 2;
効いた理由:1体の自己採点は甘い。複数体・別観点での反証は、もっともらしい嘘をよく弾く。「賛成多数」ではなく「反証に生き残ったか」で採否を決められる。
3. ループとスケジュールで「放っておいても進む」を作る
苦労していたこと:「CI が緑になったら次」「PR が来たらレビュー」——この“待ち&繰り返し”に人間が張り付いていた。時間の無駄だ。
やり方:コマンド一行で、繰り返しと定期実行を仕込む。
# 一定間隔で繰り返す(例:5分ごと)
/loop 5m デプロイ状況を確認して、緑になったら通知して
# 間隔を省くと自己ペース(AI が状況を見て、次に起きる時刻を自分で決める)
/loop PR が来るたびにレビューし続けて
# cron 的な定期実行(ルーチン化/無人運転)
/schedule 平日の朝9時に、未読の Issue を要約して Slack に投げる
効いた理由:「人間がポーリングする」のをやめられる。待ち時間がそのまま作業時間に変わり、長い処理・継続監視・定期作業が、放置のまま進む。状態が変わると自動で起こされるので、空回りもしにくい。
今後の展望:ループで回り続ける“群れ”
次に来るのは、この3つの合わせ技だ。専門エージェントの群れが、ループとスケジュールで自律的に走り、互いの結果をアドバーサリアルに検証し合う。人間がやるのは承認と方向づけだけ、という形になる。
そこで効いてくるのは、結局これまでの地味な土台だ。出力面を絞り、起きたことを残し、失敗を隔離し、設定を構造として正確に書く。自律性が上がるほど、ガードレールと観測ログの価値が上がる。派手な自律エージェントの足元を、その地味さが支える。
Join the Discussion
コメントするにはログインしてください。
外部アカウントで本人性を担保し、スパムを抑えてコメントできます。