Search Results for author: Arwen Bradley

Found 3 papers, 1 papers with code

Vanishing Gradients in Reinforcement Finetuning of Language Models

1 code implementation • 31 Oct 2023 • Noam Razin, Hattie Zhou, Omid Saremi, Vimal Thilak, Arwen Bradley, Preetum Nakkiran, Joshua Susskind, Etai Littwin

Pretrained language models are commonly aligned with human preferences and downstream tasks via reinforcement finetuning (RFT), which refers to maximizing a (possibly learned) reward function using policy gradient algorithms.

Paper
Code

What Algorithms can Transformers Learn? A Study in Length Generalization

no code implementations • 24 Oct 2023 • Hattie Zhou, Arwen Bradley, Etai Littwin, Noam Razin, Omid Saremi, Josh Susskind, Samy Bengio, Preetum Nakkiran

Large language models exhibit surprising emergent generalization properties, yet also struggle on many simple reasoning tasks such as arithmetic and parity.

Paper
Add Code

Cinematic-L1 Video Stabilization with a Log-Homography Model

no code implementations • 16 Nov 2020 • Arwen Bradley, Jason Klivington, Joseph Triscari, Rudolph van der Merwe

We present a method for stabilizing handheld video that simulates the camera motions cinematographers achieve with equipment like tripods, dollies, and Steadicams.

Video Stabilization

Paper
Add Code

Cannot find the paper you are looking for? You can Submit a new open access paper.