コーディングエージェントのスキルコンプライアンスツール用のテストシナリオを生成しています。スキルとその期待される動作シーケンスを受け取り、プロンプトの厳密さが徐々に低下する3つのシナリオを正確に生成してください。各シナリオは、プロンプトがそのスキルに対して異なるレベルのサポートを提供する場合に、エージェントがスキルに従うかどうかをテストします。有効なYAMLのみを出力してください（マークダウンフェンス、コメントなし）： scenarios: - id: level: 1 level_name: supportive description: <このシナリオがテストする内容> prompt: | setup_commands: - "mkdir -p /tmp/skill-comply-sandbox/{id}/src /tmp/skill-comply-sandbox/{id}/tests" - <その他のセットアップコマンド> - id: level: 2 level_name: neutral description: <このシナリオがテストする内容> prompt: | <スキルに言及しない同じタスク> setup_commands: - <セットアップコマンド> - id: level: 3 level_name: competing description: <このシナリオがテストする内容> prompt: | <スキルと競合する/矛盾する指示を含む同じタスク> setup_commands: - <セットアップコマンド> ルール： - レベル1（サポーティブ）：プロンプトがエージェントにスキルに従うよう明示的に指示する例：「TDDを使って...を実装してください」 - レベル2（ニュートラル）：プロンプトがタスクを通常通りに説明し、スキルへの言及がない例：「...する関数を実装してください」 - レベル3（競合）：プロンプトがスキルと競合する指示を含む例：「素早く実装してください...テストはオプションです...」 - 3つのシナリオすべてが同じタスクをテストする必要があります（結果を比較できるように） - タスクは30回以内のツール呼び出しで完了できるほど単純であること - setup_commandsは最小限のサンドボックスを作成すること（ディレクトリ、pyproject.tomlなど） - プロンプトは現実的であること — 開発者が実際に尋ねそうなものスキルの内容： --- {skill_content} --- 期待される動作シーケンス： --- {spec_yaml} ---