Topik trending
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Andrej Karpathy
Membangun @EurekaLabsAI. Sebelumnya Direktur AI @ Tesla, tim pendiri @ OpenAI, CS231n/PhD @ Stanford. Saya suka melatih jaring saraf dalam yang besar.
Saya bermain dengan Gemini 3 kemarin melalui akses awal. Beberapa pemikiran -
Pertama, saya biasanya mendesak untuk berhati-hati dengan tolok ukur publik karena imo mereka bisa sangat mungkin untuk dimainkan. Ini bermuara pada disiplin dan pengendalian diri tim (yang sementara itu sangat diberi insentif sebaliknya) untuk tidak terlalu fit set tes melalui senam yang rumit atas data yang berdekatan dengan set tes di ruang penyematan dokumen. Secara realistis, karena semua orang melakukannya, tekanan untuk melakukannya tinggi.
Bicaralah dengan modelnya. Bicaralah dengan model lain (Ride the LLM Cycle - gunakan LLM yang berbeda setiap hari). Saya memiliki kesan awal yang positif kemarin di seluruh kepribadian, penulisan, pengkodean getaran, humor, dll., Potensi pengemudi harian yang sangat solid, jelas LLM tingkat 1, selamat kepada tim!
Selama beberapa hari/minggu ke depan, saya paling penasaran dan mencari ansambel di atas eval pribadi, yang sekarang banyak orang/organisasi tampaknya membangun untuk diri mereka sendiri dan kadang-kadang melaporkan di sini.
75,15K
Saya mulai terbiasa membaca segala sesuatu (blog, artikel, bab buku,...) dengan LLM. Biasanya lulus 1 adalah manual, lalu lulus 2 "jelaskan/ringkas", lulus 3 Tanya Jawab. Saya biasanya berakhir dengan pemahaman yang lebih baik/lebih dalam daripada jika saya melanjutkan. Berkembang menjadi salah satu kasus penggunaan teratas.
Di sisi lain, jika Anda seorang penulis yang mencoba menjelaskan/mengomunikasikan sesuatu, kita mungkin semakin melihat pola pikir "Saya menulis ini untuk manusia lain" dan lebih banyak "Saya menulis ini untuk LLM". Karena begitu LLM "mendapatkannya", ia kemudian dapat menargetkan, mempersonalisasikan, dan menyajikan ide kepada penggunanya.
666,23K
Berbagi percakapan baru-baru ini yang menarik tentang dampak AI terhadap perekonomian.
AI telah dibandingkan dengan berbagai preseden sejarah: listrik, revolusi industri, dll., Saya pikir analogi terkuat adalah AI sebagai paradigma komputasi baru (Perangkat Lunak 2.0) karena keduanya pada dasarnya tentang otomatisasi pemrosesan informasi digital.
Jika Anda memperkirakan dampak komputasi pada pasar kerja pada ~ 1980-an, fitur paling prediktif dari tugas/pekerjaan yang akan Anda lihat adalah sejauh mana algoritmanya tetap, yaitu apakah Anda hanya mengubah informasi secara mekanis sesuai dengan hafalan, aturan yang mudah ditentukan (misalnya mengetik, pembukuan, kalkulator manusia, dll.)? Saat itu, ini adalah kelas program yang memungkinkan kemampuan komputasi era itu untuk kita tulis (dengan tangan, secara manual).
Dengan AI sekarang, kami dapat menulis program baru yang tidak pernah kami harapkan untuk ditulis dengan tangan sebelumnya. Kami melakukannya dengan menentukan tujuan (misalnya akurasi klasifikasi, fungsi penghargaan), dan kami mencari ruang program melalui penurunan gradien untuk menemukan jaringan saraf yang bekerja dengan baik melawan tujuan itu. Ini adalah posting blog Software 2.0 saya dari beberapa waktu yang lalu. Dalam paradigma pemrograman baru ini, fitur baru yang paling prediktif untuk dilihat adalah verifikasi. Jika suatu tugas/pekerjaan dapat diverifikasi, maka dapat dioptimalkan secara langsung atau melalui pembelajaran penguatan, dan jaring saraf dapat dilatih untuk bekerja dengan sangat baik. Ini tentang sejauh mana AI dapat "mempraktikkan" sesuatu. Lingkungan harus dapat diatur ulang (Anda dapat memulai upaya baru), efisien (banyak upaya dapat dilakukan), dan dapat dihargai (ada beberapa proses otomatis untuk menghargai upaya tertentu yang dilakukan).
Semakin banyak tugas/pekerjaan dapat diverifikasi, semakin mudah diterima oleh otomatisasi dalam paradigma pemrograman baru. Jika tidak dapat diverifikasi, itu harus keluar dari sihir jaring saraf dari generalisasi yang disilangkan jari, atau melalui cara yang lebih lemah seperti imitasi. Inilah yang mendorong batas kemajuan yang "bergerigi" dalam LLM. Tugas yang dapat diverifikasi berkembang pesat, termasuk mungkin di luar kemampuan para ahli top (misalnya matematika, kode, jumlah waktu yang dihabiskan untuk menonton video, apa pun yang terlihat seperti teka-teki dengan jawaban yang benar), sementara banyak lainnya tertinggal jika dibandingkan (kreatif, strategis, tugas yang menggabungkan pengetahuan dunia nyata, keadaan, konteks dan akal sehat).
Perangkat lunak 1.0 dengan mudah mengotomatiskan apa yang dapat Anda tentukan.
Perangkat lunak 2.0 dengan mudah mengotomatiskan apa yang dapat Anda verifikasi.
1,9M
Teratas
Peringkat
Favorit

