Subscribe For Daily AI Content!

Краткий Обзор

В этом видео демонстрируется, как ChatGPT может "видеть" и взаимодействовать с реальным миром через камеру. Он способен распознавать объекты, понимать рукописный текст и извлекать информацию из книг. Ключевые моменты:

ChatGPT распознает местоположение по рисунку (Золотые Ворота в Сан-Франциско) и переводит текст.
Он идентифицирует книгу по изображению ("Poor Charlie's Almanack") и предоставляет краткое содержание указанной страницы.
Подчеркивается способность ChatGPT понимать контекст и предоставлять релевантную информацию на основе визуальных данных.

Начало разговора с ChatGPT [0:00]

Автор начинает разговор с ChatGPT, удостоверившись, что тот может его видеть. Он отмечает, что теперь нет необходимости говорить шепотом, и можно общаться в обычном режиме. Автор готовится показать ChatGPT рисунок.

Распознавание местоположения и перевод текста [0:12]

Автор показывает ChatGPT рисунок и просит определить местоположение и перевести написанный текст. ChatGPT правильно определяет, что на рисунке изображены Золотые Ворота, и делает вывод, что автор находится в Сан-Франциско. Также он переводит фразу "bonjour developer" как "hello developers".

Идентификация книги и извлечение информации [0:26]

Автор показывает ChatGPT книгу и просит ее идентифицировать. ChatGPT определяет книгу как "Poor Charlie's Almanack" Чарли Мангера. Затем автор просит ChatGPT назвать случайное число в диапазоне от 1 до 400 и, получив число 126, просит дать краткий обзор содержания страницы 126. ChatGPT предоставляет краткое описание страницы, говоря о правиле успеха Коко Шанель, которая фокусировалась на определении качеств, которые хотели ее клиенты, и предлагала им это. Автор удовлетворен предоставленной информацией.