Search Results for author: Salsabila Mahdi

Found 1 papers, 1 papers with code

Debate Helps Supervise Unreliable Experts

1 code implementation • 15 Nov 2023 • Julian Michael, Salsabila Mahdi, David Rein, Jackson Petty, Julien Dirani, Vishakh Padmakumar, Samuel R. Bowman

Comparing debate to a baseline we call consultancy, where a single expert argues for only one answer which is correct half of the time, we find that debate performs significantly better, with 84% judge accuracy compared to consultancy's 74%.

Reading Comprehension

Paper
Code

Cannot find the paper you are looking for? You can Submit a new open access paper.