Актуальные темы
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Connor Davis
Эта статья MIT просто поразила меня 🤯
Статья посвящена "ARC" и она полностью изменила мое восприятие бенчмарка.
Исследователи не рассматривали ARC как логическую задачу. Они рассматривали каждую задачу как визуальную трансформацию.
Сетка на входе → сетка на выходе. Ничего более сложного.
Они построили небольшой Vision Transformer, обучили его с нуля на крошечном наборе данных ARC и использовали простой трюк с холстом, чтобы разместить каждый пример как изображение.
Затем они добавили изменения масштаба, трансляции и базовые визуальные приоритеты, которые вы могли бы увидеть в классической компьютерной визуализации.
Вот и все.
Никакой цепочки размышлений, никаких подсказок, никаких хитрых символических трюков.
Просто модель, смотрящая на пиксели и изучающая, как формы движутся, переворачиваются, растут, сжимаются или переносятся.
Дикая часть?
Эта крошечная модель достигает 54.5% в одиночку и 60.4%, когда комбинируется с U-Net.
Это примерно соответствует среднему человеческому уровню производительности с моделью, которая помещается в размер небольшого мобильного приложения.
Видеть ARC, решенный таким образом, заставляет весь бенчмарк выглядеть иначе.
Задачи внезапно выглядят как отображения изображений, а не как скрытые правила. Задачи на отражение действительно выглядят как отражения.
Задачи на симметрию выглядят как симметрия. Задачи на гравитацию выглядят как куски, "падающие" прямо вниз по холсту.
Честно говоря, я все еще обрабатываю это.
Это может быть самый приземленный результат ARC, который я читал за последние годы, и он пришел от самого буквального подхода к бенчмарку, который когда-либо существовал.

3,56K
Самые мощные конструкторы агентов ИИ 👇
1. n8n
2. LangChain
3. CrewAI
4. Конструктор агентов OpenAI
Какой из них вы используете прямо сейчас?
Я пробовал все из них в реальных проектах, и n8n продолжает оставаться самым сильным инструментом на столе. Он справляется с реальной работой. С грязной работой. С работой, которая касается реальных систем, а не живет в чате.
Вот что заставило меня остаться с ним:
n8n позволил мне создавать агентов, которые открывают электронные письма, читают их, извлекают полезные данные и отправляют их туда, куда нужно. Он позволил мне подключить этих агентов к CRM, таблицам, базам данных, Slack, Notion, API и всему остальному, от чего зависели мои рабочие процессы.
Я мог накапливать шаги, строить циклы, повторять задачи и наблюдать за всем с полной видимостью.
LangChain дал мне гибкость, но рабочие процессы быстро запутались.
CrewAI упростил ранние эксперименты, но сложные процессы выходили за его пределы.
Конструктор агентов OpenAI имеет потенциал, но стены появляются быстро, когда вам нужен более глубокий контроль.
n8n справился с полным процессом от рассуждений до действий, не заставляя меня строить бэкенд или соединять инструменты вручную. Он заставил агента чувствовать себя настоящим оператором, а не чат-ботом с дополнительными шагами.
Настоящий сдвиг произошел, когда я увидел, как легко я мог превратить один рабочий процесс в нечто повторяемое. Не демонстрация. Рабочая система. То, на что бизнес может полагаться каждый день.
Если вы создаете агентов в этом году, платформа, которую вы выберете, определяет все.
Так что мне интересно, с чем вы работаете и что заставило вас выбрать именно это.

4,27K
Топ
Рейтинг
Избранное


