Актуальні теми
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Shanu Mathew
Клімат, інвестування, НБА та реп. Старший віце-президент, портфельний менеджер - Стале інвестування. Попередня: Керівник відділу ESG, HY Credit, Startup (acq.) IB. Власні погляди. РТ ≠ схвалення.
Я вважаю, що це провокаційний погляд і хороша думка, але хотів би трохи попрацювати над логікою.
Сьогодні більшість інструментів ШІ працюють у хмарі. Кожного разу, коли ви просите модель написати, узагальнити, перекласти чи проаналізувати щось, цей запит надходить на GPU у дата-центрі. Більше користувачів → більше запитів → більше GPU, → більше дата-центрів → більше ліній електропередач, трансформаторів, підстанцій → генерації тощо. Це основний маховик нинішнього ШІ апаратного забезпечення + капітального вибуху дата-центрів.
Корисне виведення на пристрої порушує цей лінійний ланцюг.
Якщо багатомільярдна модель достатньо ефективна, щоб працювати на нейронному чіпі всередині вашого телефону, ноутбука, автомобіля чи гарнітури, то велика частина повсякденних завдань ніколи не змушена залишати пристрій. Думайте про прості, але великі запити: автозаповнення, написання листів, транскрипція голосу, узагальнення, просте розпізнавання зображень. Це саме ті загальні запити з великим обсягом і низькою складністю, які, ймовірно, домінуватимуть у використанні.
Швидка перевірка того, що може змінитися: прості припущення — гнучко, як хочете.
-1B користувачів × 50 запитів/день × ~$0.002/запит x 365 днів = ~$35B/рік вартості хмарного виведення.
-Якщо 30% цієї суми перейде на пристрій, це буде ~$11B+ річного попиту на хмару, який так і не з'являється.
-Гранична вартість за локальний запит фактично становить ~$0 після відправки пристрою.
Звичайні застереження: апаратне забезпечення рухається вперед, але все ще потрібно масштабувати пам'ять, пропускну здатність тощо. Але модель параметрів 3–7B, що працює на нейронному чіпі телефону (приблизно 10–45 «TOPS» сьогодні, прогнозується 60+ до 2027 року), могла б локально виконувати ці завдання з великим обсягом і низькою складністю. Для кожного завдання не потрібні моделі у масштабі фронтиру.
Хмара все ще має значення, щоб було дуже зрозуміло. Навчальні передові моделі, глибоке довготривале мислення, великі корпоративні навантаження, координація між кількома агентами — усе це набагато краще підходить для великих централізованих дата-центрів. Ключовим зсувом стало те, що логічний ланцюг більше не зводиться до «кожен новий користувач = я маю додати більше GPU і більше гігават дата-центру». Тут невідомий аргумент Jevon про парадокс і чи сприяє він більшому використанню ШІ і змушує користувачів шукати складніші підказки, що частково компенсує це
За словами Аашая, бум капітальних витрат не «зникає повністю», але його поточна інтенсивність, ймовірно, змінюється. Перенесення навіть 5–30% навантаження з інференції з хмари на пристрій у сучасному масштабі може бути значущим. Складні проблеми залишаються централізованими в хмарі. Але «повсякденний ШІ» стає особливістю обладнання, яке ви вже маєте, на відміну від утиліти з лічильником, яку орендує запит.

Aashay Sanghvi4 груд., 12:33
Індукція на пристрої руйнує торгівлю капітальними витратами ШІ
5,21K
На мою думку, Дваркеш готував із цим:
-Парадокс RLVR: Лабораторії витрачають мільярди перед випікуванням конкретних навичок, що створює фундаментальну напругу: якщо ми близькі до людейоподібних учнів, це робить усе це попереднє навчання безглуздим, бо вони навчатимуться на практиці.
-Справжня цінність людської праці: Нам не потрібні індивідуальні навчальні конвеєри для кожного мікрозавдання; Поточний ШІ це робить.
-Дифузійна затримка = подолання: Якби моделі були еквівалентними людині, вони інтегрувалися б швидше, ніж співробітники [Можна сперечатися — походження даних, бізнес-впевненість у надійності, страхи заміни тощо можуть обґрунтовано зупинити впровадження ШІ; але ми все одно всі були б переконані, що це кращий варіант, а це ще не так, тож суть залишається, на мою думку].
-Відбулося зміщення цілей: ми вирішили те, що вважали вузькими місцями в AGI (наприклад, міркування), але поки що не можемо автоматизувати 95% роботи з знаннями. Інтелект — це більше, ніж ми усвідомлювали і визначали раніше, і це нормально визнавати.
-Вузьке місце безперервного навчання: майбутня вибуховість ШІ залежить від розв'язання безперервного навчання — агенти задіяні, навчання на досвіді, об'єднання знань у «колективний розум». Далеко від цього, але оптимістично, ми можемо туди дійти!

Dwarkesh Patel3 груд., 05:56
Новий допис: Думки про прогрес у сфері ШІ (грудень 2025)
1. Що ми масштабуємо?

39,54K
«Ненаситний»
«Невблаганний»
"Практично розпродано"

Ben Bajarin4 груд., 23:50
Повний підсумок $CRWV сесії на конференції UBS Tech. Тут багато цікавих деталей і деякі нюанси, але я маю передчуття, @CoreWeave у 2026 році буде здоровий дохід.

4,93K
Найкращі
Рейтинг
Вибране

