AIエージェントの技術と現場知見

Tech Blog

AIエージェントの技術を軸に、これまでの進化の過程から最新動向、そしてこれからの展望までを整理・考察する技術ブログです。 アーキテクチャや実装・研究プロセスの裏側を含め、現場で得たリアルな知見を継続的に共有します。

Featuredコーディングエージェントのツール群:Read・Edit・Bashからサブエージェントまで何を持たせるか
テクノロジー

コーディングエージェントのツール群:Read・Edit・Bashからサブエージェントまで何を持たせるか

Claude Code・Codex CLI・Gemini CLI など主要なコーディングエージェントに共通するツールセットを整理し、ツール設計の背景にある原則を業務エージェント実装に転用できる知見としてまとめます。

管理者2026.06.11
記事を読む →
34 件の記事
コーディングエージェントのツール群:Read・Edit・Bashからサブエージェントまで何を持たせるか
テクノロジー

コーディングエージェントのツール群:Read・Edit・Bashからサブエージェントまで何を持たせるか

Claude Code・Codex CLI・Gemini CLI など主要なコーディングエージェントに共通するツールセットを整理し、ツール設計の背景にある原則を業務エージェント実装に転用できる知見としてまとめます。

管理者2026.06.11
BizPlanのAIガード:業務エージェントを守る多層防御の設計
開発ノート

BizPlanのAIガード:業務エージェントを守る多層防御の設計

事業計画エージェントBizPlanに組み込んだAIガード(入力・出力の検査機構)を、多層防御の設計思想を軸に紹介します。検知パターンの詳細は公開せず、層の組み立て方と運用設計に焦点を当てます。

管理者2026.06.11
BizPlanのアーキテクチャ全体像:6レイヤー構造と汎用AIエージェント基盤の設計
開発ノート

BizPlanのアーキテクチャ全体像:6レイヤー構造と汎用AIエージェント基盤の設計

提供中の事業計画エージェントBizPlanを支える6レイヤー構造を、汎用基盤とドメイン固有部の分離という設計思想を軸に紹介します。ハーネス核の設計(Function Callingループ・RAG注入・ストリーム抽象)から拡張の考え方まで、TypeScriptの解説用コードとともに解説します。

管理者2026.06.11
モデル選定の実際:タスク別にどのモデルを使い分けるか
開発ノート

モデル選定の実際:タスク別にどのモデルを使い分けるか

コスト・速度・品質の3軸でモデルの使い分け基準を整理し、自分のタスクで比較検証するベンチマークスクリプトとモデルルーティングの実装をTypeScriptで解説します。選定に迷ったときの早見表付きです。

管理者2026.06.11
BizPlanの裏側:事業計画エージェントのハーネス設計を公開します
開発ノート

BizPlanの裏側:事業計画エージェントのハーネス設計を公開します

提供中エージェントBizPlanの設計思想——フェーズ設計・質問順序・成果物スキーマ——を、簡略化した実装例とともに紹介します。なぜその構造にしたかという設計判断の理由に焦点を当てた、ケーススタディ連載の第1弾です。

管理者2026.06.11
ユーザーフィードバックを改善ループに組み込む
開発ノート

ユーザーフィードバックを改善ループに組み込む

フィードバック収集UIの設計からデータスキーマ・自動分類・優先度付け・プロンプト改善への反映・効果検証まで、ユーザーフィードバックを継続的な改善サイクルに組み込むための実践的な設計を解説します。

管理者2026.06.11
プロンプト回帰テスト:変更で壊れていないかを検知する
開発ノート

プロンプト回帰テスト:変更で壊れていないかを検知する

プロンプトを1行直したら別のケースが壊れた——を防ぐ、ゴールデンデータセットと評価関数を組み合わせた回帰テストの設計と、GitHub ActionsへのCI組み込みまでを段階的に解説します。

管理者2026.06.11
LLM-as-a-Judge:モデルにモデルを評価させる手法と落とし穴
開発ノート

LLM-as-a-Judge:モデルにモデルを評価させる手法と落とし穴

LLMを評価者として活用する自動評価の組み方、人手評価との一致率の確かめ方、評価モデル自身が持つバイアスと緩和策を、TypeScriptのコードとともに解説します。

管理者2026.06.11
Agent Store

記事で紹介した技術を、実際の業務でお試しください。

業務に合うエージェントを条件で絞り込んで選べます。すべて無料で、今すぐ利用できます。

エージェント一覧を見る →

当サイトではCookieを使用しています。詳しくはCookieポリシーをご覧ください。