← Wróć do bloga

P2P2 i Reflexion — planowanie i samokorekta

P2P2 🔴

Potrzeba: Złożone zadanie wymagające planowania przed wykonaniem — podejście agentowe.

Wyjaśnienie: Plan → Proof (zweryfikuj) → Plan (doprecyzuj) → Produce (wykonaj). Dwufazowe planowanie z walidacją.

Format prompta:

„Krok 1: Zaplanuj. Krok 2: Zweryfikuj kompletność planu. Krok 3: Doprecyzuj. Krok 4: Wykonaj.”

Przykład użycia w QA

„Zaplanuj migrację JUnit 4→5 (300 testów). Zweryfikuj: custom runnery, @Rule. Doprecyzuj kolejność. Wykonaj pierwszy moduł.”

Kiedy używać P2P2?

Przy dużych, ryzykownych zadaniach — migracje, budowa frameworka, refactoring. P2P2 wymusza walidację planu ZANIM zaczniesz implementację. Podwójne planowanie łapie błędy, które pojedyncze planowanie pomija.


Reflexion 🔴

Potrzeba: Model ma się uczyć na własnych błędach w iteracjach.

Wyjaśnienie: Pętla: Answer → Feedback → Improve. Model ocenia swoją odpowiedź i poprawia ją samodzielnie.

Format prompta:

„Napisz rozwiązanie. Oceń je krytycznie. Popraw na podstawie własnej oceny.”

Przykład użycia w QA

„Napisz test Selenium dla login flow. Oceń: czy obsługuje timeout, retry, flakiness? Popraw na podstawie oceny.”

Kiedy używać Reflexion?

Gdy potrzebujesz wyższej jakości z jednego prompta — generowanie kodu testowego, pisanie dokumentacji, analiza. Jedna dodatkowa iteracja samooceny potrafi złapać 80% problemów.


W następnym wpisie: Self-Consistency, Meta Prompting, Least-to-Most i PAL — pozostałe frameworki zaawansowane.