実施可能な人: チームメンバー
プラン: Free, Starter, Business, Enterprise
プラットフォーム: ブラウザ、デスクトップ、モバイル
MiroのフローとサイドキックでAIアクションを実行するとき、Select Your Own Modelにより、そのタスクに最も適した大規模言語モデル(LLM)を指定できます。
たとえば、画像生成の場合、Stable Diffusion 3.5 LargeやGemini 2.5 Flash Image (Nano Banana)を選ぶことができます。
選択は、タスクの複雑さや特異性によって異なるかもしれません。
💡 Miroフローとサイドキックには、それぞれのタスクごとに事前に選択されたLLMが含まれています。どのモデルを選ぶべきか迷ったときは、デフォルトモデルを使用するのが最良のスタートです。デフォルトモデルには「おすすめ」ラベルが表示されています。
モデルセレクターは、次のフローとサイドキックの一部としてのみ利用可能です:
- サイドキックおよびフローの文書および画像フォーマット
- サイドキックの主要ロジック
- フローの指示ブロック
この記事は、フローとサイドキック用のモデルを選ぶ方法を説明し、一般的なタスクに最適なLLMを選択するための情報を提供します。
モデル選択
フロー
フロー内のドキュメント、画像、インストラクションブロックには、それぞれ独自のモデルを選択できるプロンプトボックスがあります。
以下の手順に従ってください。
- キャンバスにドキュメント、画像、またはインストラクションブロックを追加します。
- 利用可能なモデルのリストにアクセスするには、プロンプトボックスの右上にあるデフォルトモデル名をクリックします。例えば、
AWS | Claude 3.5。 - モデルを選択します。
フローとフロー UX の詳細については、フローをご覧ください。
サイドキック
サイドキックを作成または編集する際、モデル(上級)セクションが表示され、サイドキックの処理、画像生成、文書生成に使用するモデルを選択できます。
サイドキックについて詳しくは、サイドキックのドキュメントをご覧ください。
モデル間の違い
大規模言語モデル(LLM)は、能力はあるが資源集約型のモデル、最適なモデル、そして速度は速いが能力が低いモデルを含む一連のモデル群の一部とされています。
例えば、GPT-5ファミリーには、GPT-5、GPT-5-mini、GPT-5-nanoが含まれます。
速度が速く最も能力が低いモデルは、低遅延が求められる場面に理想的です。
推論が必要なモデルと必要ないモデル
LLM の主な違いは、推論ありモデルと推論なしモデルです。
推論とは、モデルがより高品質な回答を提供するために多くの時間をかけることを意味します。
✏️ 推論 は、必ずしも最も正確な結果を意味するわけではありません。多くの反復出力が必要な場合、高い推論は必ずしも最も効率的とは限りません。
複雑なタスク、例えば顧客向けドキュメントの作成、優先順位付け、多くの情報を処理する必要があるタスクには、推論モデルが最適です。
文法のチェック、翻訳、テキストの再フォーマットのような単純なタスクには、推論なしモデルが最も効率的です。
以下の表は推論ありモデルと推論なしモデルの例を示しています。
| 推論能力 | モデル |
|---|---|
| 推論 | GPT-5、GPT-5-mini、GPT-5-nano、Claude Sonnet 4、Claude Sonnet 4.5、Gemini 2.5、Gemini 2.5 Flash、o3、o4-mini |
| 非推論 | GPT 4o、GPT-4o-mini、GPT-4.1、GPT-4.1-mini、Claude Sonnet 3.7、Claude Sonnet 3.5、Gemini 2.5 Flash Lite |
スタイル
それぞれのLLMには固有の「スタイル」があります。様々なモデルを試す中で、ある特定の出力スタイルがブランディング、雰囲気、あるいは好みに合致していると感じるかもしれません。
💡 古いモデルは特にクリエイティブで斬新な出力において、より独特なスタイルを持っています。
タスクによるAIモデル選択
| タスク | モデル | 説明 |
|---|---|---|
| ブレインストーミング | GPT-4o, o3, o4-mini, Sonnet 3.7 | 発散的な思考やアイデアの爆発、遊び心のあるトーン、そして「クリエイティブ エッジ」に最適です。たとえば、代替ヘッドラインやマイクロコピーのバリエーションなどのテキスト生成に使用します。 |
| 優先順位付け & スコアリング | GPT-5, Claude Sonnet 4.5, Gemini 2.5 | 一貫したスコアリングと明確な根拠を提供する最高の推論モデルです。たとえば、バックログにおけるRICE/MoSCoW、トレードオフの書き込み、ロードマップのティアなどに適しています。 |
| 統合とリサーチ | GPT-5、GPT-5-mini、Claude Sonnet 4.5、GPT-4.1、Claude Sonnet 3.7、Gemini 2.5 Flash | 中程度から非常に複雑なタスクに使用します。 たとえば、メモからペルソナを生成したり、データやナレッジベースから洞察を導き出したりします。 |
| スキーマ & 変換 | GPT-5-mini、GPT-5-nano、GPT-4.1、Sonnet 3.7、Gemini 2.5 Flash、Gemini 2.5 Flash Lite | フォーマット変更は通常、複雑な推論を必要としないため、最適化されたバージョンがより早く結果を出しますが、大きなコンテキストを扱う際には最新モデルを使用することで一貫性を保つことが重要です。(ノート → 文書、ドキュメント → データテーブル、仕様書 → 図面) |
| 簡単なテキスト編集 | GPT-4o-mini、Gemini 2.5 Flash Lite、GPT-5-nano、Claude 3.7 | 最速のオプション。文法、翻訳、明瞭さのための書き換えなど、簡単なテキスト編集に最適です。 |
画像生成のためのモデル選択
Miroがサポートするすべての大規模言語モデル(LLM)は、テキストと画像の処理が可能ですが、ほとんどのモデルは画像生成ができません。
画像生成には、Gemini 2.5 フラッシュ イメージ(Nano Banana)が、一般的な指示を画像に変換するのに非常に優れています。
ほとんどのLLMは具体的な指示ではなく、画像の説明を期待します。例えば、「面白い帽子をかぶった犬の絵」という説明に対し、指示としては「犬の面白い画像を作成」という形になります。Nano Bananaは特定の指示に基づいて画像を生成することができます。
✏️ Nano Bananaは既存の画像へのターゲット編集に使用できます。他のモデルは、既存の画像をスタイルの参考にすることができます。
速度や出力の品質に関しては、LLMの間に大きな差はありません。各ユースケースに応じて、様々なモデルを試し、ご自身の好みに最適なものを見つけてください。