ИИ-ретаргетинг: новый стандарт для экранов

Университет Шарджи, ОАЭ, представил новое решение в области автоматической адаптации изображений для различных экранов и устройств. Специалисты разработали модели глубокого обучения, способные предсказывать оптимальные размеры изображений с учетом разрешения и формата экрана. Оказалось, что DL-модели, использующие трансферное обучение , превосходят современные методы обрезки и изменения размеров изображений.

Основу разработки составляют популярные архитектуры глубокого обучения Resnet18, DenseNet121 и InceptionV3, которые применяются для анализа структуры изображений, распознавания объектов и классификации. Ученые утверждают, что новый подход позволяет минимизировать потерю визуальной информации при изменении размеров изображения, обеспечивая высокое качество отображения на любых устройствах.

Исследователи объясняют, что современные технологии изменения размеров изображений, такие как обрезка (Cropping, CR), масштабирование (Scaling, SCL), метод Seam carving (SC) и искажение (Warping, WARP), часто требуют участия человека для выбора оптимального метода. Это приводит к искажению или неправильной обрезке изображений, особенно при использовании экранов с нестандартными соотношениями сторон. Новый подход позволяет автоматически определять, какой метод лучше всего подойдет для адаптации изображения к заданному разрешению.

Изображение дома в разрешении FHD и четыре изображения с четырьмя методами изменения размеров

Для обучения моделей использовался обширный набор данных, включающий 46 716 изображений разного разрешения и категорий. Исследователи провели эксперименты, добавляя в модель дополнительные параметры, такие как категория и закодированное разрешение изображения. Точность алгоритмов достигла 90% по метрике F1.

В статье подчеркивается, что автоматизация выбора методов ретаргетинга становится критически важной с учетом разнообразия устройств и экранов. Использование глубокого обучения позволяет не только анализировать изображения, но и строить модели, которые могут учитывать сложные взаимосвязи и эффективно выбирать оптимальный метод адаптации.

Авторы отмечают, что новая технология обладает высоким потенциалом для дальнейшего развития. В будущем планируется расширить базу данных и добавить новые методы ретаргетинга, чтобы повысить точность алгоритмов и адаптировать их к более широкому кругу задач. Однако сроки коммерческой доступности решения пока не разглашаются.

Public Release.