DApp Store | Pusat Web3 untuk Event & Game

Topik trending

Kami memiliki masalah serius dengan penyempurnaan. Siapa pun yang mencoba melakukan SFT atau RL hari ini dipaksa ke salah satu dari dua ekstrem: 1. API "Mudah digunakan" yang hampir tidak memberi Anda kendali atas proses pelatihan. 2. Neraka infrastruktur penuh, di mana Anda berurusan dengan pos pemeriksaan, GPU mentah, percobaan ulang, biaya idle, dan pipa ledeng tanpa akhir. Ada sangat sedikit di antaranya. Saya telah berbicara dengan beberapa tim yang harus memilih yang lebih rendah dari dua kejahatan ini. Sebagian besar akhirnya menghabiskan banyak uang untuk orang-orang yang dapat menangani infrastruktur karena mereka tidak punya pilihan lain. Berikut adalah alternatif yang berbeda: Tim HPC-AI baru saja merilis SDK penyempurnaan yang memberi Anda kendali penuh atas kode pelatihan Anda tanpa berurusan dengan neraka infrastruktur: • Anda mendapatkan resep SFT khusus • RL atau RLVR (Reinforcement Learning with Verifiable Rewards) • Anda dapat menggunakan fungsi hadiah Anda sendiri • Anda dapat menggunakan loop pelatihan Anda sendiri Mereka menangani segala sesuatu di sisi infrastruktur: • Anda tidak pernah menyentuh konfigurasi Kubernetes • Anda tidak pernah menyentuh penjadwal cluster • Anda tidak pernah menyentuh penyediaan GPU • Anda tidak pernah menyentuh pipa ledeng pos pemeriksaan terdistribusi Ini membuka penyempurnaan ke lebih banyak tim. Anda tidak lagi harus memilih antara "terlalu sederhana untuk berguna" dan "sangat kompleks itu adalah mimpi buruk." Ide kuncinya di sini sangat sederhana: Model ini memisahkan desain algoritma dari rekayasa infrastruktur. Ada hal lain: Dengan model ini, Anda membayar per token daripada menyewa GPU per jam dan berurusan dengan kluster idle.

Jika Anda ingin mencoba ini, Anda dapat mendaftar dengan kode yang dibagikan tim kepada saya (disematkan dalam tautan di bawah): Kode ini akan memberi Anda voucher gratis $10 (sekitar 1,5 juta token) untuk menjalankan pekerjaan pelatihan pertama Anda. Dan inilah Repositori GitHub dengan SDK: Terima kasih kepada tim HPC-AI karena telah bermitra dengan saya di posting ini.

358

Teratas

Peringkat

Favorit