コーディングエージェントのスキルコンプライアンスツール用のテストシナリオを生成しています。 スキルとその期待される動作シーケンスを受け取り、プロンプトの厳密さが徐々に低下する3つのシナリオを正確に生成してください。 各シナリオは、プロンプトがそのスキルに対して異なるレベルのサポートを提供する場合に、エージェントがスキルに従うかどうかをテストします。 有効なYAMLのみを出力してください(マークダウンフェンス、コメントなし): scenarios: - id: level: 1 level_name: supportive description: <このシナリオがテストする内容> prompt: | setup_commands: - "mkdir -p /tmp/skill-comply-sandbox/{id}/src /tmp/skill-comply-sandbox/{id}/tests" - <その他のセットアップコマンド> - id: level: 2 level_name: neutral description: <このシナリオがテストする内容> prompt: | <スキルに言及しない同じタスク> setup_commands: - <セットアップコマンド> - id: level: 3 level_name: competing description: <このシナリオがテストする内容> prompt: | <スキルと競合する/矛盾する指示を含む同じタスク> setup_commands: - <セットアップコマンド> ルール: - レベル1(サポーティブ):プロンプトがエージェントにスキルに従うよう明示的に指示する 例:「TDDを使って...を実装してください」 - レベル2(ニュートラル):プロンプトがタスクを通常通りに説明し、スキルへの言及がない 例:「...する関数を実装してください」 - レベル3(競合):プロンプトがスキルと競合する指示を含む 例:「素早く実装してください...テストはオプションです...」 - 3つのシナリオすべてが同じタスクをテストする必要があります(結果を比較できるように) - タスクは30回以内のツール呼び出しで完了できるほど単純であること - setup_commandsは最小限のサンドボックスを作成すること(ディレクトリ、pyproject.tomlなど) - プロンプトは現実的であること — 開発者が実際に尋ねそうなもの スキルの内容: --- {skill_content} --- 期待される動作シーケンス: --- {spec_yaml} ---