Методы и модели машинного обучения для роботизации чата поддержки банковского продукта
Руководитель от корпоративного партнера:
Брюханов Константин, ПАО "Банк ВТБ"
Руководитель от Университета ИТМО: Авксентьева Елена Юрьевна,
Университет ИТМО
Набор в этот проект закончен.
Аннотация
Одно из самых ярких применений нейронных сетей — чат-боты. Чат-бот (виртуальный собеседник или просто бот) — это компьютерная программа, которая, имитируя живого собеседника, разговаривает с пользователем-человеком (чаще всего через Интернет).
Стремительное распространение интеллектуальных ботов обусловлено сочетанием нескольких факторов. Во-первых, пользователи уже устали загружать и устанавливать приложения. Во-вторых, люди массово переходят на службы сообщений и постоянно находятся в чатах. Таким образом, вместо очередного приложения можно создать сервис, работающий в приложении, которое уже установлено на устройстве пользователя. Чат-боты становятся востребованным и предпочтительным вариантом взаимодействия благодаря достижениям в сфере искусственного интеллекта. Созданы мощные алгоритмы машинного обучения, с помощью которых чат-бот способен поддерживать диалог с конечным пользователем при минимальном вмешательстве оператора.
Модель (внедренный в чат банка модуль):
- способна обработать без участия оператора большее количество запросов (в зависимости от темы, в некоторых случаях эффективность может достигать 70–80%);
- лучше адаптируется под нестандартные формулировки в диалоге — умеет определять интент, реальное желание пользователя по не четко сформулированному запросу;
- умеет определять, когда ответ модели адекватен, а когда в качестве «осознанности» этого ответа есть сомнения и нужно задать дополнительный уточняющий вопрос или переключиться на оператора;
- может быть дообучена автоматизированно (вместо группы разработчиков, постоянно адаптирующих и корректирующих сценарии ответов, модель дообучает специалист по Data Science, применяя соответствующие библиотеки машинного обучения).
План действий
- Определить круг задач чат-бота.
- Выбрать платформу.
- Построить коммуникационную архитектуру.
- Структурировать контент и смоделировать ответ бота.
- Спроектировать интеграцию.
- Собрать информацию для полноценного диалога.
- Обучить бота.
- Внедрить схему ведения диалога.
- Тестировать.
Решаемые технические задачи
Роботизация чата поддержки банковских продуктов
Стек технологий
1) User and Organizations
- Инструменты гибкой разработки Agile, Scrum, Kanban
- Тайм-менеджмент и планирование временем
2) System Modeling
- Системное моделирование с использованием языков UML/SysML
- Анализ требований
3) System Architecture and Infrastructure
- Методы проектирование программных систем
- Методы проектирования интеллектуальных систем
- Организация параллельных и распределенных вычислений
- Компьютерные сети
- Виртуальные системы и сервисы
4). Software Development
- Программирование на языках Java, Python
- Использование библиотек библиотек ConvNetJS, nlp_compromise, TextBlob , библиотек Python для обработки, анализа данных
- Web-разработка с использованием HTML, CSS, Java Script, PHP.
- сервисы wit.ai, api.ai 5) Software Fundamentals
- Алгоритмы и структуры данных
6) Hardware
- Архитектура вычислительных систем
Предварительный перечень курсов
- Обработка и анализ данных
- https://openedu.ru/course/ITMOUniversity/BIGDATA2035/
- Прикладной искусственный интеллект
- https://openedu.ru/course/ITMOUniversity/APPARTINT2035/
- Методы машинного обучения
- https://openedu.ru/course/ITMOUniversity/INTROML/
- Интеллектуальный анализ данных
- https://openedu.ru/course/ITMOUniversity/MLDATAN/
- Анализ текстов
- https://openedu.ru/course/hse/TEXT/
- https://www.coursera.org/learn/text-mining?action=enroll
- Распределенные база данных и знаний
- https://openedu.ru/course/spbu/DTBS/
- Мультиагентные системы
- http://window.edu.ru/resource/434/57434
- Системы поддержки принятия решений.
- Специализация Learn SQL Basics for Data Science
- https://ru.coursera.org/specializations/learn-sql-basics-data-science
- Databases and SQL for Data Science with Python
- https://www.coursera.org/learn/sql-data-science
- MongoDB for Python Developers
- https://university.mongodb.com/courses/M220P/about
- Библиотека программиста
- https://proglib.io/p/postgresql/
- Профессиональный информационно-аналитический ресурс, посвященный машинному
обучению, распознаванию образов и интеллектуальному анализу данных
- http://www.machinelearning.ru/
Кем станет студент по завершению магистратуры
Программист-стажер, программист, разработчик систем машинного обучения и ИИ
Пререквизиты
Базовые программы курсов:
- Высшая математика
- Основы программирования
- Алгоритмы и структуры данных
- Программная инженерия
- Архитектура программных систем
- Базы данных