«Это первая модель, диалог с которой ощущается как беседа с вдумчивым человеком» — так описал GPT-4.5 глава OpenAI Сэм Альтман. Она вышла в конце февраля в исследовательской версии, то есть еще будет совершенствоваться. По словам Альтмана, это самая крупная модель среди тех, которые когда-либо создавала компания. Особенность новинки в том, что она ближе к естественной речи, в отличие от тех же версий o1 и o3 со строгой логикой. По просьбе SETTERS Media сооснователь и CEO онлайн-университета «Зерокодер» Кирилл Пшинник рассказывает о сильных и слабых сторонах GPT-4.5.
Один из самых простых способов показать превосходство новой модели над конкурентами — это прогнать ее через серию стандартных тестов (бенчмарков). Обычно на презентациях языковых моделей показывают результаты в задачах на логику, математику, понимание контекста, написание кода и общие знания. Такие тесты удобны: они дают понятную количественную оценку и позволяют быстро сравнить модели между собой.
{{slider-gallery}}
Тем не менее высокие баллы в тестах не всегда гарантия того, что модель понравится пользователям. Далеко не всем нужно, чтобы нейросеть разбиралась в математическом анализе и доказывала теоремы. Часто люди хотят от нейросети простого человеческого общения.
Например, на платформе LM Arena пользователи проводят слепое тестирование ответов разных моделей, не зная, какая из них что отвечает. На 10 марта в рейтинге лидируют Grok-3 и GPT-4.5 — модели, которые не пытаются поразить логикой и математическими способностями, а просто умеют естественно общаться.
На это и сделан акцент в GPT-4.5: разработчики сосредоточились на эмоциональном интеллекте нейросети, чтобы взаимодействие с ней было глубоким, интересным и живым.
Как и предыдущие GPT, версия 4.5 построена на основе генеративного предварительно обученного трансформера. Это мощная языковая модель, которая умеет не просто подбирать слова, а создавать живую и осмысленную речь.
Буква «o» в названии GPT-4o значит omni — мультимодальная (способная обрабатывать текст, картинки, аудио и видео). В GPT-4.5 этой буквы нет. Скорее всего, потому, что новая модель заточена на восприятие тонкостей человеческой речи, а ее мультимодальность вторична. Разработчики уверяют, что ответы нейросети стали человечнее и понятнее и в них практически нет «галлюцинаций».
Во время общения с GPT-4.5 у меня в голове фоном звучала реплика из фильма «Она»: «Кажется, я могу тебе все рассказать». С GPT-4.5 хочется по-дружески «зависнуть» — настолько живо и интересно модель формулирует ответы, приводит аргументы и делится своими идеями.
{{slider-gallery}}
Явный плюс новой версии — качество текста. GPT-4.5 отлично воспринимает эмоциональный тон запроса и отвечает понятнее, плавнее и естественнее, чем GPT-4o. Если правильно сформулировать запрос, модель выдаст почти идеальный текст. Иногда кажется, будто на другой стороне экрана не алгоритм, а грамотный копирайтер, который чувствует стиль и настроение читателя. Особенно это заметно при написании эмоционально окрашенных текстов: GPT-4.5 отлично улавливает оттенки смыслов и интонации.
{{slider-gallery}}
В задачах, где важны строгая логика и аналитические рассуждения, GPT-4.5 заметно проигрывает моделям, специально созданным для глубокого анализа. На моих тестах ни GPT-4o, ни GPT-4.5 не смогли правильно решить простую математическую задачу. Рассуждающие модели o1 и o3-mini справляются с такими задачами без проблем.
{{slider-gallery}}
Хотя OpenAI заявляет, что GPT-4.5 лучше понимает контекст и в целом умнее, на практике это незаметно. Доказательств этого я не увидел.
В целом GPT-4.5 не выглядит как прорывная модель, в отличие от предыдущих релизов OpenAI. После выхода DeepSeek-R1 от компании будто бы ждали «следующего iPhone», ведь до этого она представила мультимодальную GPT-4o, o3-mini с режимом «Глубокое исследование», первый автономный агент Operator. Вероятно, GPT-4.5 выпустили просто потому, что обещали.
Как я уже сказал, преимущество GPT-4.5 в том, что она более естественна в речи, интуитивна и эмоциональна. В каких рабочих сценариях это полезно?
Общение с клиентом. Например, бизнесы из wellbeing-индустрии могут использовать GPT-4.5 для первичной оценки ментального состояния клиентов. Эта модель умеет аккуратно вести человека по психологической карте: задавать правильные вопросы, выявлять проблемы и даже помогать найти пути решения. Перед тем как обращаться к специалисту, пользователь примерно поймет, чего хочет и что ему важно обсудить.
Брейнсторминг. Использовать ChatGPT для генерации идей — один из классических сценариев. Новая модель, вероятно, окажется хороша тем, что сможет лучше уловить настроение и стиль, в котором хочется поработать.
Подготовка к выступлению. Это тоже один из понятных сценариев. Вероятно, более естестественная GPT-4.5 лучше подготовит к ситуациям, в которых важны «мягкие навыки», — к публичному выступлению, презентации проекта команде, эмоционально сложному разговору.
Говоря в целом, если задача — написать текст, получить эмоциональную поддержку или просто интересно пообщаться, GPT-4.5 точно не разочарует. Если нужны точные расчеты, глубокие аналитические рассуждения или продуманные решения, лучше использовать модели с продвинутой логикой вроде o1 или o3-mini.
В перспективе GPT-4.5, скорее всего, будет удобным инструментом для клиентского сервиса. Однако прямо сейчас использовать модель через API невыгодно из-за высокой цены. Тем не менее если вы выбираете между GPT-4o и 4.5, стоит пробовать новую версию (если ваш тариф позволяет).
Полина Садовникова и Мария Бессмертная воспользовались этим поводом, чтобы пересмотреть свои любимые вампирские саги в строго рабочее время. Пройдите его и узнайте, какой вы вампир.