
Saat Model Mulai Mengerti: Kisah GPT-3 dan RLHF
Ketika ChatGPT pertama kali diluncurkan ke publik pada akhir tahun 2022, banyak yang terkesima oleh betapa "manusiawi" caranya dalam merespons. Ia mampu menjawab pertanyaan teknis, membuat lelucon, menulis puisi, hingga memberikan saran hidup yang terasa personal. Namun, di balik kemampuannya tersebut, terdapat tonggak penting dalam sejarah pengembangan kecerdasan buatan yang sering luput dari perhatian publik, yaitu paper Training Language Models to Follow Instructions with Human Feedback yang ditulis oleh Long Ouyang dan tim dari OpenAI.