Search Results for author: ChengCheng Tan

Found 1 papers, 0 papers with code

Uncovering Latent Human Wellbeing in Language Model Embeddings

no code implementations • 19 Feb 2024 • Pedro Freire, ChengCheng Tan, Adam Gleave, Dan Hendrycks, Scott Emmons

Do language models implicitly learn a concept of human wellbeing?

Ethics Language Modelling +1

Paper
Add Code

Cannot find the paper you are looking for? You can Submit a new open access paper.