Югэн.ИИ один

Опубликовано: 08/01/2021 Время на прочтение: 4 минут

Фото Патрика Томассо на Unsplash

Букварь-представление вещей в перспективе

Статистика, алгоритмы, аналитика, наука о данных, ML, AI-независимо от того, какие термины/модные слова популярны, эта дисциплина является неотъемлемой частью решения проблем, которое доказало свою исключительную эффективность. В последние годы успехи в вычислительной технике и инфраструктуре, расширение исследований, здоровый приток инструментов и продуктов, значительные инвестиции, демократизация практических знаний и развитие сильных сообществ катапультировали его туда, где он находится сегодня. Среди всего блеска и критики (опасения по поводу предвзятости, в дополнение к неравенству богатства), которые получает ML/AI, иногда можно упустить из виду то, что находится в центре — решение проблем в масштабе и создание целенаправленных решений, которые поднимают все человечество.

Сократите расстояние между прототипированием и производством. Пусть модели выдержат испытание временем и сложными реалиями

В Yugen мы тесно сотрудничаем с клиентами в области розничной торговли, монетизации мобильной рекламы и пищевых технологий. Некоторые из них только начинали свои инициативы в области ML, в то время как некоторые из них имели некоторый опыт работы с предварительными аналитическими решениями. Кстати, большинство случаев использования, с которыми мы столкнулись, были сосредоточены на сопоставлении пользователей с продуктами/контентом/предложениями в масштабе и в режиме реального времени/почти в реальном времени. Наши клиенты были достаточно щедры, доверяя 2 неизвестным людям и стартапу, которому было меньше нескольких недель, естественно, мы почувствовали дополнительный импульс проявить себя, быстро продемонстрировав влияние. Было очевидно, что потребовались месяцы, чтобы разработать множество функций, построить сложную модель, которая сидит в наших ноутбуках или в экземпляре EC2, а затем взять ее в производство, не было мудрым выбором. Лучший подход состоял в разработке стартовой модели, предсказания, основанные на прогнозах в реальном времени, которые создают достойные повышения ключевых показателей эффективности и обещают многообещающие результаты.

И поэтому мы мчались в дикой погоне за производством простых моделей. Мы начали с простых алгоритмов и простой ванильной архитектуры вывода с несколькими микросервисами —

  • S3 для хранения артефактов модели и эталонных наборов данных
  • AWS Lambda для вывода и постобработки
  • Задания ETL для подготовки скоринговых данных, обновления нескольких зависимых наборов данных на S3 и вызова лямбды через шлюз API

Но это заложило прочную основу для того, чтобы мы повторяли, экспериментировали и совершенствовались. В последующие месяцы мы смогли продвинуться вперед по всем трем фронтам —

  • Улучшайте модели, добавляя функции, пробуя различные алгоритмы, выполняя A / B тесты
  • Оптимизируйте время выхода на рынок и поддерживайте надежность с помощью действий Github для автоматизации развертывания лямбда и добавления модульных тестов
  • Анализ производительности, проверка дрейфов, отслеживание работоспособности микросервисов с помощью быстрой панели мониторинга

Эта стратегия поставила нас в положение, в котором мы смогли найти разумные компромиссы между разработкой моделей, проектированием и мониторингом. И, оглядываясь назад, это имело далеко идущие последствия для воздействия, которое мы в конечном итоге смогли создать.

Рим не был построен за один день. Зацикливайтесь на экспериментах и итерациях, и ROI со временем будет увеличиваться.

Для любого варианта использования, который должен соответствовать пользователям визуального контента или физических продуктов, модель ML неизменно должна учитывать 2 стороны уравнения-спрос и предложение. Хотя между ними существуют сложные отношения, которые необходимо раскрыть, в этом году мы столкнулись с чем — то совершенно неожиданным-пандемией коронавируса. Мы воочию убедились в его влиянии на одного из наших клиентов в торговом зале. После нескольких месяцев отсутствия продаж из-за блокировок, когда магазины, наконец, начали открывать свои двери, уровни трафика и модели покупок пользователей сильно изменились. Наши модели, которые были обучены до блокировки, начали страдать от дрейфа данных. Нечто подобное мы наблюдали и у наших клиентов в сфере Food tech — больше онлайн-заказов,больше склонности экспериментировать с разными кухнями.

Эти исключительные обстоятельства подчеркивали необходимость отдавать приоритет непрерывным экспериментам (иногда добавляя эвристику и простые правила) над короткими спринтами во времени. Мы практически проводили новые эксперименты каждые 8-12 дней и отвергали те, которые считали менее эффективными. Другой интересной вещью, которая вышла из этого упражнения, было обнаружение сигналов для внесения обновлений в продукт. например, клиенты были готовы видеть больше фотографий ресторана, чтобы получить представление о гигиене кухни, поэтому добавление изображений гигиены кухни и информации в пользовательский интерфейс повысило доверие клиентов. Частые посты в социальных сетях о типе кухни, количестве шеф-поваров, их приверженности нормам приводили к более высоким кликам и, в конечном счете, конверсиям.

Всегда желательно начинать с простого и совершенствоваться в спринте. Статистические распределения входных данных могут изменяться с течением времени (дрейф данных), свойства целевой переменной могут изменяться (дрейф концепции), изменения продукта и партнера могут влиять на пользовательский опыт. Решение ML — это комбинация нескольких компонентов, работающих согласованно. Поспешность внесения слишком большого количества изменений препятствует точной атрибуции, увеличивает технический долг и приводит к неоптимальной рентабельности инвестиций.

Будущее — каким мы себе представляем 2021 год

Приоритеты в мире после КОВИДА


Метки:


прокрутка вверх