Компания Microsoft объявила, что в начале недели будет выпущена поддерживаемая ими модель ChatGPT нового поколения GPT-4, что в очередной раз должно совершить революцию в развитии искусственного интеллекта, ведь помимо текста, он будет делать гораздо больше. Машина выдает в ответ изображения, видео, а также может переводить пожелания людей к исполнению машинам и программам.
Новая версия искусственного интеллекта ChatGPT создает изображения, видео, звук и многое другое
Задача GPT-4 – совмещать не только текстовые навыки, но и создание изображений. Не исключено, что новая модель справится и с созданием звука. Технический директор Microsoft Андреас Браун обещает, что новые навыки станут большим шагом вперед.
ChatGPT, который стал общедоступным в ноябре, использует большую языковую модель GPT-3.5, которая также может общаться на эстонском языке, но ограничена текстовыми ответами. Брауна намекает, что так называемые мультимодальные модели GPT-4 могут проложить путь для создания видео и других типов контента.
Новая версия искусственного интеллекта также получит более строгие ограничения, чтобы выдавать меньше ложных фактов и нежелательного контента, пишет Search Engine Journal.
Новые навыки также связаны с новыми способами ввода вопросов. Например, в Twitter было высказано предположение, что машина может читать произвольные изображения и описывать, что на них изображено:
*If* GPT-4 is multimodal, we can predict with reasonable confidence what GPT-4 *might* be capable of, given Microsoft’s prior work Kosmos-1:
— Jim Fan (@DrJimFan) March 10, 2023
- Visual IQ test: yes, the ones that humans take!
- OCR-free reading comprehension: input a screenshot, scanned document, street sign, or… https://t.co/75NlBhZNlt pic.twitter.com/q5uWMKGUMK