This week s Arxiv Dive we get into Direct Preference Optimiz Cerebral Valley #03-ai-events

This week’s Arxiv Dive we get into Direct Preferen...

Scott Howard

01/26/2024, 3:56 AM

This week’s Arxiv Dive we get into Direct Preference Optimization: Your Language Model is Secretly a Reward Model. Hope to see some of y’all there Friday! https://lu.ma/oxenbookclub

Open in Slack

Previous Next