متجر التطبيق اللامركزي | مركز Web3 للأحداث والألعاب

ما الذي يمكنني فعله باستخدام Discover

المواضيع الرائجة

Bonk Eco continues to show strength amid $USELESS rally

Pump.fun to raise $1B token sale, traders speculating on airdrop

Bonk‏‎‎-8.66‎%‎‏

ALON‏‎‎-3.25‎%‎‏

LAUNCHCOIN‏‎‎-6.77‎%‎‏

GOONC‏‎‎-4.25‎%‎‏

KLED‏‎‎-13.75‎%‎‏

Boop.Fun leading the way with a new launchpad on Solana.

elie

جدول مثير للاهتمام من DeepSeek v3.2 يقارن عدد رموز الإخراج في اختبارات الأداء المختلفة، نسخة DSV3.2 الخاصة تفكر أكثر بكثير من أي نموذج آخر، لكن بما أنهم يستخدمون اهتماما متناثرا، فإن تكلفة الاستدلال ستظل مقبولة؟

‏‎20.48‏K

elieمنذ 13 ساعةً

يبدو أن ميسترال على وشك إصدار نموذجين جديدين: مينيسترال 3 وميسترال لارج 3. من ناحية العمارة، يبدو أن الأمر يلي: > تماما مثل llama2/3 في Ministral، وهو مشابه جدا (حتى لو أضافوا SWA) لأول إصدار من Mistral 7B قبل عامين. > نفس بنية DeepSeek V3 تماما للجهاز الكبير (الذي يبدو أنه من MoE) في كليهما، يستخدمون أيضا تحجيم الحبال LAMA4 (بدلا من الخيط)، وبالنسبة للحبل الكبير يبدو أنهم ينفذون فك الترميز الافتراضي باستخدام إيجل رابط إلى PRS في الموضوع

‏‎78.41‏K

elie‏1 ديسمبر، 06:06

يا أخي، هذه ورقة من FAIR في 2024، Llama 2/3 تم تطويرها بواسطة Genai (ليست نفس العنقود، قاعدة الكود,...) هم شفافون بشأن MFU/معدل النقل على عكس نماذج التدريب المختبرية الأخرى على هذا الحجم، وهناك أرقام فعلية في ورقة Llama 3.

Teortaxes▶️ (DeepSeek 推特🐋铁粉 2023 – ∞)‏1 ديسمبر، 03:35

> ميتا أوف لم يكن @suchenzang أمزح هم حقا لا يستطيعون التوسع في القطارات المسبقة

‏‎17.04‏K

الأفضل

المُتصدِّرة

التطبيقات المفضلة