dr2633

Derek Rosenzweig dr2633

Achievements

inference-preference-optimization inference-preference-optimization Public

Inference Preference Optimization (IPO) builds on GRPO by integrating memory retrieval into chain-of-thought reasoning for personalized inference.

Python 5