Google: Маленькие модели Gemini 1.5 Flash точнее определяют интент пользователя, чем Pro-версии

Notjohnmu 22.01.2026 — 20:48

Ключевые факты

1 Google использует двухэтапную схему для анализа пользовательского интента в UI.
2 Первый этап: независимое суммирование каждого взаимодействия.
3 Второй этап: прогнозирование общего намерения на основе последовательности сводок.
4 Модель Gemini 1.5 Flash 8B показала более высокую точность, чем Gemini 1.5 Pro, благодаря новой методологии.

Исследование Google фокусируется на повышении эффективности и точности понимания намерений пользователя (интента) при взаимодействии с UI. Традиционные большие языковые модели (LLM) часто испытывают трудности с анализом длинных последовательностей действий, что приводит к ошибкам. Новый подход решает эту проблему, разбивая процесс на два этапа. На первом этапе каждое отдельное действие или взаимодействие с элементом UI независимо суммируется. На втором этапе эти краткие сводки используются как последовательность событий для прогнозирования общего намерения всей траектории. Главный вывод заключается в том, что при использовании этой методологии небольшие модели, способные работать локально на устройстве (например, Gemini 1.5 Flash 8B), демонстрируют превосходство в точности над огромными серверными моделями (например, Gemini 1.5 Pro). Это открывает путь к созданию более быстрых и дешевых инструментов аналитики, которые могут обрабатывать данные о поведении пользователя в реальном времени без необходимости отправлять большие объемы данных на дорогие удаленные серверы.

Источник