본문 바로가기

Direct Preference Optimization(DPO)