OpenAI представила новую версию технологии, используемой в их чате ChatGPT.
GPT-4o станет доступен для всех пользователей предыдущей версии, включая бесплатных.
По словам разработчиков, новая версия работает быстрее и более расслабленно — может поболтать или даже пофлиртовать.
GPT-4o способен считывать изображения и обсуждать их, переводить с одного языка на другой и распознавать эмоции по выражению лица. В отличие от предыдущих версий, он также запоминает предыдущие разговоры.
Его можно прерывать в любой момент, и у него более плавный разговорный ритм — задержки между вопросами и ответами практически отсутствуют.
OpenAI объявила, что будет постепенно внедрять новые функции.
Новая модель — это значительный шаг вперед в области искусственного интеллекта, утверждает главный технический директор OpenAI Мира Мурати. "Мы смотрим на будущее взаимодействия между нами и машинами, – говорит Мурати. – И мы считаем, что GPT-4o действительно меняет эту парадигму".
Во время демонстрации голосовой версии GPT-4o он не только решил простое уравнение, написанное на листе бумаги, но и дал полезные рекомендации по его решению. Он анализировал компьютерный код, переводя его с итальянского на английский, и интерпретировал эмоции на фото улыбающегося человека.
В ходе демонстрации бот, говоривший женским голосом с американским акцентом, приветствовал людей, обращавшихся к нему, а если его хвалили, отвечал: "Довольно, вы заставляете меня краснеть!"
Один исследователь попросил бота определить его выражение лица и эмоции. GPT-4o решил, что мужчина выглядит "счастливым и жизнерадостным, с широкой улыбкой и, возможно, с оттенком волнения".
"Похоже, у вас отличное настроение, - сказал бот. - Не хотите ли поделиться источником этих положительных эмоций?"
Конечно, не все во время презентации пошло по плану: в какой-то момент GPT-4o перепутал улыбающегося человека с деревянной поверхностью, затем начал решать уравнение, которое ему еще не показали. Очевидно, что до надежного и безопасного помощника человека искусственному интеллекту еще далеко.
Однако сегодня OpenAI, похоже, ставит перед собой более скромные задачи: создать GPT-4o как цифрового помощника нового поколения, наподобие Siri или Alexa, который помнит предыдущие вопросы и может отвечать не только с помощью голоса, но и текста.
В целом, презентация прошла успешно, однако критики отметили, что на ней не обсудили, насколько "экологичным" будет GPT-4o.
Искусственный интеллект требует гораздо больше энергии, чем традиционные вычислительные задачи, и чем "умнее" он становится, тем более серьезные вычислительные мощности ему необходимы. На презентации OpenAI этот вопрос не был поднят.
Не стоит делать слишком поспешные выводы о преимуществах нового чата: тщательно подготовленная презентация разработчиков и работа с реальными пользователями – это разные вещи.
Тем не менее, перспективы у него, судя по всему, весьма неплохие.
OpenAI также не планирует останавливаться на достигнутом: на прошлой неделе появились слухи о запуске компанией поисковика – конкурента Google.
Однако агентство Reuters позже сообщило, что компания отложила запуск проекта. Генеральный директор OpenAI Сэм Альтман отметил, что запуск GPT-4o не связан с разработкой поискового сервиса, но в пятницу написал в соцсети Х: "Мы усердно работаем над некоторыми новыми штуками, которые, как мы думаем, понравятся людям! Для меня это похоже на магию".
Как сообщает Bloomberg, OpenAI вскоре подпишет соглашение с Apple о внедрении своих ИИ-разработок в операционную систему для iPhone.
У Apple нет собственного чата, подобного GPT-4o или Google Gemini, и компания в последнее время направляет новые ресурсы в эту область. GPT-4o может предложить более современные функции по сравнению с текущим голосовым помощником Siri.
Финансовая поддержка технологического гиганта также будет полезна: OpenAI все чаще обвиняют в использовании материалов СМИ для тренировки своих моделей искусственного интеллекта без компенсации или согласия издателей.
Например, в декабре прошлого года американская New York Times подала иск против OpenAI и Microsoft (которая финансово поддерживает OpenAI, хотя и разрабатывает собственный генеративный чат) за нарушение авторских прав. Компании обвинили в использовании миллионов статей газеты для обучения чат-ботов.
Издание утверждает, что, хотя компании брали информацию из множества источников для создания своих систем, контенту New York Times уделялось особое внимание, чтобы "бесплатно воспользоваться огромными инвестициями NYT в журналистику".
На OpenAI неоднократно подавали в суд и авторы художественных произведений за использование материалов, защищенных авторским правом.