Актуальные темы
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
В Box мы тратим много времени на тестирование Box AI с новыми моделями на неструктурированных данных, чтобы увидеть, как они работают в реальных областях знаний.
Как мы видели по результатам тестов, GPT-5 предлагает значительный скачок в возможностях по сравнению с GPT-4.1 в области рассуждений, математики, логики, программирования и других областях работы. Вот несколько примеров того, как эти улучшения проявляются в реальном мире:
*GPT-5 лучше контекстуализирует информацию. При извлечении данных, таких как окончательная сумма в долларах США в счете без обозначений валюты, но с адресом в Лондоне, GPT-5 правильно отвечает, что необходим курс конверсии из USD в GBP. В сравнении, GPT-4.1 увидел окончательный счет и вернул его, предполагая валюту (неправильно).
* GPT-5 обеспечивает лучшую мультимодальную аналитику. Для годового отчета публичной компании GPT-5 был задан вопрос о выделении ячейки в таблице из изображения, показывающего изменения в компонентах капитала компании. В верхней части таблицы уточняется, что все суммы акций указаны в тысячах, и GPT-5 четко указывает на эту конверсию, в то время как GPT-4.1 этого не делает, запутываясь, поскольку в таблице указаны акции, а в легенде — доли.
* GPT-5 лучше справляется с высокими уровнями сложности запросов и данных. При извлечении данных из резюме о всех датах начала работы, названиях должностей и именах работодателей, GPT-5 смог извлечь каждую часть данных, в то время как GPT-4.1, похоже, был перегружен и не извлек те же поля из-за размера запроса и сложности документа.
* GPT-5 гораздо яснее и конкретнее отвечает на вопросы. В соглашении о аутсорсинге с 6 различными услугами, которые были явно обсуждены, когда его спрашивают о "5 конкретных услугах в контракте", GPT-5 вернет первые 5 и спросит, было ли намеренно, что шестая не была упомянута. В сравнении, GPT-4.1 просто вернул первые 5 без каких-либо дополнительных оговорок, что может привести к путанице для пользователя.
* GPT-5 лучше интерпретирует данные в сложных областях. Для графика поточной цитометрии, обычно используемого в иммунологии, GPT-5 правильно определил высокую долю мертвых клеток и предложил правдоподобные коренные причины, которые могут привести к этой ситуации, в то время как GPT-4.1 дал минимальные обоснования, нуждаясь в дальнейшей проверке, чтобы сделать какие-либо предположения на основе сырых данных.
* GPT-5 лучше выявляет несоответствия в коде. Когда его просят выявить проблемы в данном файле кода на Python, хотя и GPT-5, и GPT-4.1 могут выявить реальные ошибки, которые приводят к сбоям, только GPT-5 смог выявить более тонкие проблемы, такие как печать неправильной переменной, когда это не имело бы смысла в контексте программы.
Эти улучшения в математике, рассуждениях, логике и качестве ответов в более длинных контекстных окнах невероятно полезны для конечных пользователей в повседневной работе, но они проявятся еще больше с более длительными работающими AI-агентами, особенно когда нет человека в процессе, чтобы проверять информацию на каждом этапе.
Здорово видеть, как эти улучшения продолжают поступать в последней партии AI-моделей, так как это приведет к AI-агентам, которые смогут использоваться в постепенно более критически важных областях работы.
78,16K
Топ
Рейтинг
Избранное