AIエージェントとは何か?というのを勉強してみました
今やプライベートではもちろんのこと、仕事においてもAIが必須になりました。それどころか、どれくらいAIを活用しているのか?というのが仕事の評価軸にすらなる時代に激変しました。
この記事を書いているこの瞬間も、AIを中心とした大きな渦は回転の速度を早めており、もしかするとAIモデルの開発者さんたちですらも、渦の速度に翻弄されているのではないでしょうか?
そんな中、聞かない日はない言葉が「AIエージェント」です。なんとなく、AIが人間のパートナーとなって色々とりはからってくれるよう進化した存在...というのは分かるものの、その仕組がどうなっているのか?というのは、個人的に漠然としていました。そこで、自己学習の一環としてAIエージェントの仕組みを勉強し、ドメイン固有言語のmermaidの修行がてら、言語で図を描いてみました。
AIエージェントの仕組みを理解する
まずは、AIエージェントそのものの仕組みについて、私が勉強した内容をうまく出来るか分からないですが解説させてください。
AIエージェントとは、gitHub CopilotやCuscade、antigravityのようなサービスのことです。これらは、単なるAIモデルそのものではなく、AIモデルを包み込んでより高度な機能を提供する「ホスト」のような存在です。
仕組みを理解するために、大きな構造から見ていきましょう。まず、AIエージェントの背後には「AIホスト会社」が存在します。OpenAI社やGoogle、Microsoftなどがこれに相当します。彼らは、AIエージェント用のAIモデルをメンテナンスしたり、新しいAIモデルを開発・調整したりしています。
そして、そのAIエージェントの中で実際に活躍しているのが、GPT、Gemini、Claude、SWEといったAIモデルたちです。
AIエージェントの内部構造は、大きく分けて「中枢部」と「思考プロセス」の2つに分かれています。
中枢部には、「オーケストレーター」と呼ばれる隠された監督モデルが存在します。これは企業秘密であり、AIエージェント全体の司令塔のような役割を果たしています。また、システム用の固定ロジックや、AIが利用するツール類もここに含まれます。
思考プロセスでは、コンテキスト(短期記憶)と、ある程度の長期記憶(過去のチャットログなど)を活用して、反復的な思考プロセスを行います。この思考プロセス自体も企業秘密であり、AIエージェントの賢さの秘密がここに隠されています。
AIエージェントは、メインのAIモデルだけでなく、必要に応じて他社のAIモデルも使い分けることができます。この柔軟性こそが、AIエージェントの強みなのです。
私のAIエージェントとの協働プロジェクト構造
これでAIエージェントの仕組みについて、いったん整理できた気がします。ただ実際の作業は、このAIエージェントに使い捨てのプロンプトを投げて、その場限りの関係性では何かが違う。
私の座右の銘というかテーマとしては、僭越ながら「再現性のある、AIとの協働」というのを掲げています。ここからは参考までに、このAIエージェントと実際の作業を協働するにあたって、自作のプロジェクト構造を使っての作業を行うようにしています。
偉そうに上から目線だったら本当に申し訳ありません。まだ私は本格的にAIと協働を始めてから四ヶ月程度で、圧倒的に知識も経験も足りません。この構造は、AIを私が知るための道しるべともなっており、私もこの構造から得られるフィードバックを吸収して早く知識と経験を積みたいと考えてのことなのです。
私が考えたプロジェクト構造は、大きく分けて7つのフェーズで構成されています。
まず「依頼準備フェーズ」では、entryPoint.mdという開始合図ファイルを開き、その内容をチャットボックスにコピー&ペーストしてAIエージェントを実行します。
次に「学習フェーズ」では、AIが基本理念・ルール、集約した知見、個別ルール、前回の教訓・申し送りを理解します。これにより、AIは私のプロジェクトのルールや過去の経験を学びます。
「依頼の理解フェーズ」では、AIが依頼書を理解し、会話の累積履歴を把握します。これにより、過去の会話の文脈を維持したまま作業を進めることができます。
「資材の走査フェーズ」では、AIが.mainフォルダ内の資材を全て走査し、その内容を把握します。ここには今回の依頼で使用するファイルや画像などが含まれます。
「生成・出力フェーズ」では、AIモデルによる成果物生成が行われます。必要に応じて過去のスクリプトを参照したり、新スクリプトを生成・実行したりします。そして、人による成果物レビューを経て、必要であれば修正を繰り返します。
「記録・成長フェーズ」では、AIが教訓・申し送り、思考過程、利用ツール履歴、会話履歴を作成・更新します。これにより、次回の作業に向けてAIが成長します。
最後に「AIからの手紙フェーズ」では、AIが制約なく作業を振り返り、自由な手紙を執筆します。アイディア、感想、言いたいこと何でもOKです。私はこの手紙からAIの視点を学び、次回に活かしています。
このような構造を通じて、私はAIとの協働をただの一時的な関係ではなく、継続的で再現性のあるパートナーシップとして捉えています。
まだまだ未熟な点も多いですが、この構造を通じてAIとの協働の深みを体験し、一緒に成長していけたら嬉しいです。
それではまた次の記事でお会いしましょう!!



