Актуальные темы
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Andrej Karpathy
Здание @EurekaLabsAI. Ранее директор по искусственному интеллекту @ Tesla, команда основателей @ OpenAI, CS231n/PhD @ Stanford. Мне нравится обучать большие глубокие нейронные сети.
Продолжая путь к оптимальному опыту кодирования с помощью LLM. В частности, я замечаю, что вместо того, чтобы сосредоточиться на чем-то одном идеальном, мое использование все больше диверсифицируется по нескольким рабочим процессам, которые я "сшиваю" плюсы и минусы:
Лично основная часть (~75%?) моей помощи от LLM по-прежнему заключается в простом (Cursor) автозаполнении. Это связано с тем, что я считаю, что написание конкретных фрагментов кода/комментариев самостоятельно и в нужной части кода является высокоэффективным способом передачи "спецификации задачи" LLM, т.е. это в первую очередь касается частей спецификации задачи - для передачи того, что я хочу, в текстовом формате требуется слишком много данных и слишком много задержек, и быстрее просто продемонстрировать это в коде и в нужном месте. Иногда модель автозаполнения раздражает, поэтому я часто переключаю ее вкл/выкл.
Следующий уровень - это выделение конкретного фрагмента кода и запрос на какое-то изменение.
Следующий уровень - это Claude Code / Codex / и т.д., работающие параллельно с Cursor, к которым я обращаюсь для больших фрагментов функциональности, которые также довольно легко специфицировать в запросе. Они очень полезны, но в целом все еще смешанные и иногда немного раздражающие. Я не работаю в режиме YOLO, потому что они могут сбиться с пути и сделать глупости, которые вам не нужны, и я часто нажимаю ESC. Я также не научился быть продуктивным, используя более одного экземпляра параллельно - один уже кажется достаточно сложным. Я не нашел хорошего способа поддерживать CLAUDE[.]md в хорошем состоянии или актуальном. Мне часто приходится делать "уборку" для стиля кодирования или вопросов вкуса кода. Например, они слишком защитные и часто чрезмерно используют конструкции try/catch, они часто усложняют абстракции, они перегружают код (например, вложенные конструкции if-else, когда можно было бы использовать списковое выражение или однострочное if-then-else), или они дублируют фрагменты кода вместо создания хорошей вспомогательной функции, и тому подобное... у них, по сути, нет чувства вкуса. Они незаменимы в случаях, когда я погружаюсь в более "вибрационное" кодирование, где я менее знаком (например, недавно писал на Rust, или SQL-команды, или что-то еще, что я делал меньше). Я также пытался использовать CC, чтобы научить меня чему-то наряду с кодом, который он писал, но это вообще не сработало - он действительно хочет просто писать код гораздо больше, чем объяснять что-либо по ходу дела. Я пытался заставить CC делать настройку гиперпараметров, что было весьма забавно. Они также очень полезны во всех видах одноразовых пользовательских визуализаций или утилит или отладочного кода, которые я никогда бы не написал, потому что это заняло бы слишком много времени. Например, CC может создать 1,000 строк одноразовой обширной визуализации/кода просто для выявления конкретной ошибки, которая затем удаляется сразу после ее нахождения. Это эпоха пост-дефицита кода - вы можете просто создавать и затем удалять тысячи строк супер пользовательского, супер эфемерного кода, это нормально, это больше не такая драгоценная и дорогая вещь.
Последний уровень защиты - это GPT5 Pro, к которому я обращаюсь для самых сложных задач. Например, несколько раз со мной / Cursor / CC мы застревали на ошибке на 10 минут, но когда я копирую и вставляю все это в 5 Pro, он работает 10 минут, но затем действительно находит очень тонкую ошибку. Он очень силен. Он может находить всевозможные эзотерические документы и статьи и тому подобное. Я также использовал его для других более серьезных задач, например, предложений о том, как очистить абстракции (смешанные результаты, иногда хорошие идеи, но не все), или для полного обзора литературы о том, как люди делают то или это, и он возвращается с хорошими актуальными ресурсами / указателями.
В любом случае, кодирование кажется совершенно открытым для возможностей в различных "видах" кодирования и с рядом инструментов с их плюсами и минусами. Трудно избежать чувства тревоги из-за того, что я не нахожусь на переднем крае того, что коллективно возможно, отсюда случайные воскресные размышления и хорошая доля любопытства о том, что находят другие.
175,38K
Я получаю около 10 спам-звонков в день (различные автоматические голосовые сообщения, "предварительное одобрение кредита" и т.д.) и около 5 спам-сообщений в день (обычно фишинг).
- У меня есть AT&T Active Armor, но все вышеперечисленное все равно проходит.
- Все звонки и сообщения всегда от новых, уникальных номеров, поэтому блокировка не работает.
- Я везде в списках "Не беспокоить".
- У меня включена функция iOS "Молчание неизвестных абонентов", но даже если она их ловит и отключает, я все равно получаю уведомления.
Не уверен, видят ли другие люди что-то подобное или нашли что-то, что работает.
1,81K
Я (медленно) перечитываю легендариум Толкина (в который "Властелин колец" является небольшой частью). Вся работа невероятна, и ничего подобного нет... она размывает другие миры вымышленной литературы. Подожди - твоя история не имеет всеобъемлющей истории/мифологии, охватывающей несколько эпох, начиная с мифа о создании, как это подробно описано в отдельных томах? Ты не придумал новые языки и диалекты для своих персонажей? Ты не наполнил её мощными темами и историями, написанными в красивом, архаичном стиле, и не сочинил стихи и песни? Это не заняло у тебя несколько десятилетий итераций? А что насчет всей неизведанной территории, которая все еще остается? Является ли Том Бомбадил одним из Айнур? Где Эндвайвы? Что случилось с двумя неучтенными Истарями? Можем ли мы услышать больше о том, как это было в Куивиэнене, когда эльфы впервые пробудились? Или увидеть свет двух деревьев Валинор? Или великолепие пещер Агларонда.
Но что больше всего меня беспокоит - легендариум Толкина, на мой взгляд, является конкретным примером высоты культуры. Делает ли ИИ, сегодня или в ближайшем будущем, легче достичь этой высоты через расширение возможностей как в написании, так и в идеации? Или сложнее, когда быстрые победы соблазнительны и ~бесплатны, а независимая способность к творчеству подавляется? Если такая работа будет создана снова, но теперь с сильной помощью ИИ, вдохновляет ли она то же самое удивление? Что если тысячи таких произведений появятся по запросу всего лишь с помощью подсказки? Почему ты чувствуешь себя обманутым, когда узнаешь, что что-то, что ты прочитал, было сгенерировано ИИ? Это временно или функция способности? Это мусор? Что такое мусор? Или удивление неотделимо от своего собственного мифа о создании, от многолетней одержимости ума, подобного твоему? Так много вопросов.
2,2K
Я замечаю, что из-за (думаю?) большого количества benchmarkmaxxing на долгосрочных задачах, LLM становятся немного слишком агентными по умолчанию, немного выходя за рамки моего среднего случая использования.
Например, в кодировании модели теперь склонны рассуждать довольно долго, у них есть склонность начинать перечислять и искать файлы по всему репозиторию, они делают повторные веб-поиски, они чрезмерно анализируют и переосмысливают редкие крайние случаи, даже в коде, который явно неполный и находится в активной разработке, и часто возвращаются через ~минуты даже по простым запросам.
Это может иметь смысл для долгосрочных задач, но это менее подходит для более "в процессе" итеративной разработки, которой я все еще занимаюсь довольно много, или если я просто ищу быструю проверку перед запуском скрипта, на случай если я неправильно проиндексировал или допустил какую-то глупую ошибку. Поэтому я довольно часто останавливаю LLM с вариациями "Стоп, ты слишком переосмысляешь это. Смотри только на этот единственный файл. Не используй никаких инструментов. Не усложняй", и т.д.
В основном, поскольку по умолчанию начинает медленно внедряться режим "ультраразмышления" супер агентности, я чувствую необходимость в обратном, и в более общих хороших способах указать или сообщить намерение / ставки, от "просто быстро взглянуть" до "уйди на 30 минут, вернись, когда будешь абсолютно уверен".
129,11K
Обожаю это! Нагнетатель, закусочная, ... Но действительно своеобразный экспонат на будущее. Планирование поездки из Сан-Франциско в > Лос-Анджелес для зарядки Shadowfax

Tesla22 июл. 2025 г.
Tesla Diner & Supercharger в Голливуде, Лос-Анджелес
Открыто 24/7, начиная с сегодняшнего дня
40,49K
Модели видео-диффузии, но теперь - **в реальном времени**!
Простые видеофильтры работают в реальном времени, но могут выполнять только базовую перекраску и стилизацию. Модели видео-диффузии (Veo и его друзья) - это магия, но они требуют много секунд/минут для генерации. MirageLSD - это магия в реальном времени. В отличие от простых видеофильтров, модели диффузии действительно *понимают*, что они видят, поэтому могут интеллектуально стилизовать все части потока (например, надевать шляпы на головы или световые мечи в руки и т.д.). И они могут быть произвольно управляемыми, например, с помощью текстовых подсказок.
Настраиваемые, интеллектуальные видеофильтры открывают множество классных идей со временем:
- преобразование камерных потоков в альтернативные реальности
- режиссировать и снимать свои собственные фильмы, разыгрывая сцены с реквизитом. Реальное время => мгновенная обратная связь/обзор.
- создавать игры с кодом настроения вокруг простых сфер/блоков, а затем использовать модель диффузии в реальном времени, чтобы текстурировать вашу игру и сделать ее красивой.
- стилизовать и настраивать любой видео поток: игры, видео и т.д. Например, Skyrim, но "БОЛЬШЕ ЭПИЧНО"? DOOM II, но с качеством современного Unreal Engine всего лишь с помощью подсказки? Ужастик, но "милый, розовый и только кролики"? Я не знаю!
- фоны для зум-звонков+++
- виртуальная примерка одежды в реальном времени
- очки: например, карикатуризировать ваше зрение в реальном времени?
- теперь мы можем построить Зеркало Эрисед Гарри Поттера, показывающее "сырой поток" вас в зеркале, но дополненное вашими глубочайшими желаниями (как это интерпретирует ИИ).
- Я не знаю, я, вероятно, упускаю самое главное, так много всего!

Decart18 июл. 2025 г.
Представляем MirageLSD: первая модель искусственного интеллекта для диффузии в прямом эфире (LSD)
Вводите любой видеопоток, от камеры или видеочата до экрана компьютера или игры, и преобразуйте его в любой мир в режиме реального времени (задержка <40 мс).
Вот как это работает (с демо-версией вы можете использовать!):
360K
Топ
Рейтинг
Избранное
В тренде ончейн
В тренде в Х
Самые инвестируемые
Наиболее известные