Apa yang diperlukan komputer untuk mempelajari aturan pemasangan basa RNA? Orang-orang melatih model bahasa besar untuk prediksi struktur RNA. Beberapa model ini memiliki ratusan juta parameter. Pada hasil awal yang menarik adalah bahwa model-model ini mempelajari aturan pasangan basis Watson-Crick-Franklin langsung dari data. Sebuah kelompok peneliti di Harvard memutuskan untuk melihat model terkecil apa yang dapat mencapai hasil ini. Mereka melatih model probabilistik kecil dengan hanya 21 parameter menggunakan penurunan gradien. Dengan sedikitnya 50 urutan RNA—tanpa struktur yang sesuai—aturan pasangan basa akan muncul setelah hanya beberapa zaman pelatihan. Jadi jawaban atas pertanyaan awal mereka adalah bahwa dibutuhkan "jauh lebih sedikit dari yang Anda kira" untuk mempelajari jenis model ini. Saya tidak berpikir ini berarti bahwa upaya pelatihan skala besar harus bodoh atau salah arah. Tetapi hasil ini menunjukkan ada banyak efisiensi dan kinerja yang masih dapat diperoleh dari inovasi arsitektur. Ada banyak struktur yang mendasari bahasa biologi.
3,42K