Краткий Обзор
В этом видео демонстрируется, как ChatGPT может "видеть" и взаимодействовать с реальным миром через камеру. Он способен распознавать объекты, понимать рукописный текст и извлекать информацию из книг. Ключевые моменты:
- ChatGPT распознает местоположение по рисунку (Золотые Ворота в Сан-Франциско) и переводит текст.
- Он идентифицирует книгу по изображению ("Poor Charlie's Almanack") и предоставляет краткое содержание указанной страницы.
- Подчеркивается способность ChatGPT понимать контекст и предоставлять релевантную информацию на основе визуальных данных.
Начало разговора с ChatGPT
Автор начинает разговор с ChatGPT, удостоверившись, что тот может его видеть. Он отмечает, что теперь нет необходимости говорить шепотом, и можно общаться в обычном режиме. Автор готовится показать ChatGPT рисунок.
Распознавание местоположения и перевод текста
Автор показывает ChatGPT рисунок и просит определить местоположение и перевести написанный текст. ChatGPT правильно определяет, что на рисунке изображены Золотые Ворота, и делает вывод, что автор находится в Сан-Франциско. Также он переводит фразу "bonjour developer" как "hello developers".
Идентификация книги и извлечение информации
Автор показывает ChatGPT книгу и просит ее идентифицировать. ChatGPT определяет книгу как "Poor Charlie's Almanack" Чарли Мангера. Затем автор просит ChatGPT назвать случайное число в диапазоне от 1 до 400 и, получив число 126, просит дать краткий обзор содержания страницы 126. ChatGPT предоставляет краткое описание страницы, говоря о правиле успеха Коко Шанель, которая фокусировалась на определении качеств, которые хотели ее клиенты, и предлагала им это. Автор удовлетворен предоставленной информацией.