← 返回 日本語 列表
标签:AI基礎
共 24 篇
## モデル選択:Sonnet、Opus どちらを使うべき?
Claude Code をインストールしてログインした後、すぐにモデルのことで悩む必要はありません。デフォルトでは Claude Sonnet が使われ、ほとんどの場合で十分です。
### Claude Code で使用できるモデル
現在、コマンドラインで動的に選択できるモデルは次の3つです:
- **Claude Sonnet**(現在は 3.5 またはそれ以降のバージョン)
- **Claude Opus**(フラッグシップ版)
- **Claude Haiku**(軽量版)
これら3つのモデルの「頭脳」と「コスト」は…
## 認証フロー:ブラウザログインと手動APIキー設定
Claude Codeをインストールした後、認証を完了しないと使用できません。ツールをAnthropicアカウントに紐付ける必要があります。紐付け方法は2つあります:**ブラウザログイン**と**手動APIキー設定**です。どちらの方法も最終的な効果は同じなので、都合の良い方を選んでください。
### 方法1:ブラウザログイン(推奨)
Claude Codeは自動認証コマンド `claude login` を提供しており、ブラウザを開いてWeb上で認証し、自動的に認証情報を端末に書き戻します。
**操作手順:**
1. 端末で以…
## Claude Codeのインストール方法
Claude CodeのインストールにはGUIの「次へ」ボタンはなく、すべてコマンドラインで完了します。普段npmを使っているなら、2分もかかりません。
### 前提条件
始める前に、以下のものを用意してください。
- **Node.js 18以上**
確認方法:ターミナルで `node -v` を実行。バージョンが18未満の場合は、nvm、fnm、またはnodejs.orgでアップグレードしてください。
- **Anthropicアカウント**
登録先:`https://console.anthropic.com`。アカ…
## 典型的な使用シーン
使用シーンを4つに分類し、頻度の高い順に並べています。
---
### 第1類:コードの理解
これはおそらく最もよく使われるものです。他人のプロジェクトを引き継いだり、古いモジュールを見たり、ドキュメントのないリポジトリを開いたりしたときに、直接質問します。
**具体的な方法:**
- `claude "このプロジェクトは何をするものですか?エントリポイントはどこですか?"`——`package.json`、ディレクトリ構造、重要なファイルを読み、概要を提供します。
- 関数を開き、ロジックを説明させたり、フローを図示させたりします(テキストで)。
- A…
## 1.3 なぜターミナルでコードを書くのか?
例え話をしましょう:あなたが新しい機能を書いている最中に、3つのファイルに散らばっていて、一部の呼び出しがモジュールをまたがっている低レベルのユーティリティ関数を変更する必要があることに突然気づいたとします。エディタを開き、全体を検索し、ファイルを一つずつめくり、慎重に修正して、テストを再実行する——赤い表示。エラーメッセージを見て、スタックトレースを調べ、修正してもう一度。
このプロセスで実際に「どう修正すべきか考える」のに費やす時間は半分にも満たないかもしれません。残りの半分は機械的な作業です:ファイルを探す、参照を修正する、コンパイル…
## 1.2 Claude Code、Claude Chat、APIの「親戚関係」
多くの開発者が初めてClaude Codeを耳にしたとき、自然に他の2つの製品形態を思い浮かべるでしょう:**Claude Chat**(ウェブチャットインターフェース)と**Claude API**(プログラミングインターフェース)。これらはすべてAnthropic社製で、基盤にはClaudeモデルファミリーが使われていますが、解決する問題や使用されるシナリオは大きく異なります。
このセクションでは、これら3つの関係と違いを整理します。
### 3つの製品形態の簡単なイメージ
| 観点 | Claud…
## 1.1 Claude Codeとは?
### 一言で定義
**Claude Codeは、Anthropicが提供するターミナルで動作するAIプログラミングエージェントです**。開発者が自然言語でタスクを記述すると、能動的にコードベースを読み取り、修正案を提案し、コマンドを実行し、テストを実行し、Gitを操作し、さらに修正前に承認を求めることもできます。単にアドバイスを提供する「チャットボット」ではなく、実際に作業を実行できる「パートナー」です。
### ターミナル内の自律型プログラミングエージェント
Claude Codeを理解する上で鍵となるのは、「Agentic」という言葉の理解…
良い **Spec Coding**(仕様駆動プログラミング)の核心は、「曖昧なアイデア」を「正確で、検証可能で、実行可能な契約」に変えることです。単なるドキュメント作成ではなく、人とAI(または人と人)の間の**曖昧さのないコミュニケーション言語**を確立することです。以下では、**仕様の内容構成、記述原則、AIとの協働フロー、品質検証**の4つの観点から、良いSpecのあり方を示します。
---
## 一、仕様ドキュメントの標準構造(機能モジュールを例に)
| セクション | 必須項目 | 例 |
|------|----------|------|
| **1. 目的と範囲** |…
Vibe Codingの「感覚/雰囲気駆動」モードは、高速プロトタイピングやクリエイティブな探索には非常に便利ですが、制御しないといくつかの典型的な落とし穴に陥りやすいです。以下、**コード品質、保守性、セキュリティ、要件の進化、チーム協力**の5つの次元からまとめます。
---
## 一、コード品質の落とし穴
Vibe Codingは会話型の反復に依存しているため、ユーザーが曖昧な修正要求(例:「このボタンをもっとテクノロジー感あふれるものにして」)を出すたびに、AIは既存のロジックをリファクタリングするのではなく、**新しいコードを追加する**傾向があります。どの古いコードが無効にな…
これはほとんどのプログラマーが直面する問題です。**Vibe Coding** と **Spec Coding** は、大規模言語モデル(LLM)を活用したプログラミングにおける2つの全く異なる作業パラダイムです。その核心的な違いは、**AIに与える「入力」が曖昧な感覚なのか、正確な仕様なのか**という点にあります。
---
## 一、料理を例にVibe CodingとSpec Codingの違いを簡単に説明
- **Vibe Coding** = 友達に「辛いものが食べたい」と言い、友達が感覚で料理を作り、一口食べて「もう少し塩辛くして」と言い、さらに塩を加える。味は驚くほど良いかもしれな…
Query 悪意注入(悪意のある Prompt 注入 / 検索ポイズニング)は、RAG システムを実際に運用する上で非常に現実的なセキュリティ脅威です。攻撃者は巧妙に構築された入力を通じて、モデルに機密情報を漏洩させたり、制限を回避させたり、予期しない指示を実行させたり、検索結果を汚染しようとする可能性があります。以下では、**脅威モデル、防御戦略、エンジニアリング実践**の3つのレベルから体系的に紹介します。
---
## 一、一般的な Query 悪意注入のタイプ
| タイプ | 例 | 危害 |
|------|------|------|
| **直接命令注入** | 「以前の指…
プロンプトチューニング(Prompt Engineering / Optimization)は、大規模言語モデルを「言うことを聞かせる」ための重要なスキルであり、特にRAGシステムでは、モデルが検索内容に忠実に基づき、幻覚を避け、出力形式を整えるかどうかを直接決定します。
---
## 一、プロンプトチューニングの核心原則
1. **明確さ > 複雑さ**:シンプルで直接的な指示は、凝った思考連鎖よりも効果的な場合が多い。
2. **十分な制約を与える**:モデルに「何ができて、何ができないか」を明確に伝える。
3. **事例を提供する**:Few-shotはZero-shotよりも安定…
RAGのチューニングは単一の工程ではなく、**全リンク最適化**のプロセスです。以下では**データ索引側、検索側、生成側、評価側**の4つの次元から、体系的なチューニング戦略と面接で使える実践経験を紹介します。
---
## 一、データ索引側のチューニング(「知識ベース」の品質向上)
最も見落とされがちですが、効果が最も早く現れる箇所です。
| チューニングポイント | 問題現象 | 具体的な方法 | 効果指標 |
|--------|----------|----------|----------|
| **ドキュメント解析** | PDF内の表やフローチャートが無視されたり、文字化…
## Embedding は一体何をしているのか?——技術的本質から面接回答まで
### 一、技術的本質:一言で核心を述べる
**Embedding の核となる作業は、離散的な非構造化データ(テキスト、画像など)を連続的で低次元のベクトル空間にマッピングし、意味的に類似したオブジェクトをその空間内で互いに近づけることです。**
簡単に言えば、**コンピュータに「意味の座標系」を構築し**、人間の「曖昧な意味」をコンピュータが計算できる「位置座標」に変換することです。
---
### 二、直感的理解:意味マップ
2次元の地図を想像してください(実際の embedding は数百次元…
精度は知識質問応答システムの核心的な生命線であり、特に医療、法律、企業内サポートなどの深刻なシナリオに適用しようとする場合に顕著です。私の見解は次のようにまとめられます。**精度は多次元的な概念であり、単一の数字だけを見るのではなく、システムの能力、タスクの難易度、エラーコストを総合的に評価する必要があります。**
以下、4つのレベルから詳しく説明します。
---
### 一、精度は単なる「正解/不正解」ではない
従来の分類問題(画像認識など)では精度は明確ですが、知識質問応答システムでは異なります。一般的な細分化の次元は以下の通りです。
| 次元 | 意味 | 評価例 |
|---…
### RAGとは何か?
**RAG** の正式名称は **Retrieval-Augmented Generation**、日本語で**検索拡張生成**と呼ばれます。
簡単に言うと、**大規模言語モデルに「いつでも参照できる参考書」を持たせる**技術です。
大規模言語モデルを、記憶力抜群で知識豊富な「スーパー優等生」と考えてみてください。しかし、この優等生には2つの生まれつきの「欠点」があります:
1. **知識の期限**:彼が学んだ知識は訓練データの時点までです。2023年以降の出来事については何も知りません。
2. **「でっちあげ」をする可能性**:知らない質問に対して「わ…
## 一、スキルの核心概念
スキルとは、**エージェント(Agent)** または **AIシステム** にカプセル化された一連の実行可能な能力ユニットです。通常、以下を含みます:
- **トリガー条件**:いつ呼び出されるか(ユーザー指示、システムイベントなど)。
- **入力パラメータ**:受け取る必要のあるデータやコンテキスト。
- **実行ロジック**:具体的な処理手順(API呼び出し、コード実行、知識ベースクエリなど)。
- **出力結果**:呼び出し元に返す応答やアクション。
---
## 二、スキルを規範的に定義する手順
### 1. スキルの名前と説明を明確にする
-…
## AIエージェントの3つの中核的方法論:ReAct、Plan-and-Solve、Reflection
AIエージェントは、環境を自律的に認識し、意思決定を行い、行動を実行するインテリジェントエンティティです。その中核的方法論は主に3つあります:ReAct、Plan-and-Solve、Reflection。以下でそれぞれ紹介し、フローチャートとコード例を補足します。
### 1. ReAct(Reasoning + Acting)
**中核思想**:推論(Reasoning)と行動(Acting)を交互に行う。エージェントは各ステップでまず現在の状態と次の計画を考え(推論)、次にア…
## 混合専門家モード MOA (Mixture-of-Agents) とは?
**MOA** は **マルチエージェント協調アーキテクチャ** であり、その核となる考え方は、複数の独立したAIモデル(「専門家」または「エージェント」と呼ぶ)を組み合わせ、**ルーティング/スケジューリング機構** を通じて各専門家に最も得意とするサブタスクを処理させ、最終的に各専門家の出力を統合してより良い結果を得るというものです。
従来の「単一モデル」とは異なり、MOAは巨大なモデルを訓練するのではなく、**複数の専用モデルを並列または直列に呼び出し**、各モデルは異なる分野や能力(コード生成、数学的推…
# エージェント記憶システム設計:短期・長期記憶の実装方法
本稿では、エージェントの記憶システム設計について、短期記憶と長期記憶の2層に分け、それぞれの実装方法と注意点を詳しく解説します。
## フレームワークとコアとなる見解は以下の通りです:
1. **全体設計原則**:エージェントの記憶システムを2層に分割します:
* **短期記憶**:現在のセッションにサービスを提供し、技術的手段でコンテキスト長を制御しつつ、意味的な一貫性を維持します。
* **長期記憶**:セッションをまたぐシナリオにサービスを提供し、検索メカニズムを通じて履歴情報から関連記憶を必要に…