1. Прогнозная система характеристик публикаций (Views, Likes, Clicks, Comments, и т.д.)

  • Категория: NLP
  • Заказчик: Life.ru
  • Дата: 2021

Используя исторические данные из различных источников и взаимодействие, связанное с публикациями, разработана система прогнозирования, которая анализирует содержание статей для прогнозирования различных характеристик публикаций. К этим характеристикам относятся просмотры, клики по ссылкам, лайки и т. д. Используя эту систему, организации могут оптимизировать свои контент-стратегии и принимать решения на основе данных, чтобы максимизировать вовлеченность и взаимодействие со своими публикациями.

Application of predictive models

Подходы

Векторизация заголовка*

  • TF-IDF
  • BERT

Регрессионная модель**

  • FFN
  • Catboost

*Векторизация процесс выделения из данных (текста) признаков которые используются для построения прогнозных моделей

** Регрессионные модели прогнозирующая функция от независимой переменной и параметров с добавлением случайной переменной

Метрики оценки качества прогнозирующих моделей

  • Mean Squared Error (MSE)
  • RMSE
  • Mean Absolute Error (MAE) ~ 2500 просмотров

2. Специализированные системы поиска и вопросов и ответов

  • Категория: NLP
  • Клиент: ТВЦ, и другие компании
  • Дата: 2019-2023

До появления ChatGPT существовала потребность в системах, которые могли бы быстро находить ответы в конкретных, узких областях, таких как техническая документация, инструкции и руководства пользователя. В таких случаях ChatGPT может не предоставить правильное решение. Наша команда НЛП сыграла важную роль в создании таких систем, в частности:

Наша команда сыграла важную роль в создании таких систем, в том числе:

  • Системы поиска информации, способные находить конкретные статьи в обширной базе знаний с помощью текстовых описаний.
  • Голосовые помощники, которые находят нужные ответы в технической документации по неоднозначно сформулированным вопросам (поскольку пользователям часто не хватает технической терминологии)
  • Автоматизированные системы распознавания и классификации поломок и неисправностей промышленного оборудования. В случае выхода из строя производственного оборудования эти системы распознают конкретную терминологию неисправностей на основе голосовых вызовов операторов производственных машин и оперативно формируют заявки на ремонт оборудования.

3. Поисковая информационная система (локальная LLM)

  • Категория: NLP
  • Клиент: Devprom
  • Дата: 2023

Обучение и настройка локальной LLM (большой языковой модели) для русского языка с целью использования, аналогично ChatGPT для внутренних документных баз данных компании