Нейросеть DALL-E в ChatGPT не смогла полностью сгенерировать русский алфавит
Ключевые факты
- 1 Обновленный DALL-E (DALL-E 3) демонстрирует прогресс в генерации текста, но имеет ограничения.
- 2 Тест на русском алфавите («Азбука») выявил, что модель не может поддерживать точность на длинных последовательностях символов.
- 3 Проблема искажения текста и потери последовательности усиливается при использовании нелатинских шрифтов (кириллица).
- 4 Модель часто «сдается» или начинает генерировать бессмысленные символы ближе к концу длинного запроса.
- 5 Полное и безошибочное воспроизведение длинных текстовых последовательностей остается нерешенной задачей для ИИ-генераторов изображений.
Пользователи продолжают тестировать возможности DALL-E (вероятно, DALL-E 3 или новее) по генерации текста, которые стали заметно лучше после последних обновлений. Однако, как показывает эксперимент с русским алфавитом (33 буквы), модель по-прежнему испытывает трудности с поддержанием точности и последовательности при работе с длинными и сложными текстовыми запросами, особенно на кириллице. Модель может успешно воспроизвести первые несколько символов, но затем начинает искажать буквы, путать их порядок или заменять несуществующими символами. Это подтверждает, что идеальное текстовое воспроизведение, особенно для длинных последовательностей и нелатинских шрифтов, остается серьезной технической проблемой для современных генеративных моделей изображений. 💡 Фактчекинг: Подтверждено. DALL-E 3 значительно улучшил генерацию текста по сравнению с предыдущими версиями, но многочисленные тесты показывают, что он часто ошибается при работе с длинными последовательностями символов или сложными шрифтами, особенно на кириллице, что соответствует описанному в посте результату.