На протяжении нескольких месяцев в Центре разработки DIRECTUM в Уфе полным ходом шла подготовка к Хакатону!
Темой Хакатона стали: внедрение машинного обучения и интеллектуальные алгоритмы в системах электронного документооборота.
Итогами мероприятия с нами поделилась HR-менеджер нашего офиса в Уфе —
Юлия Бадертдинова:
"Вот и закончился наш Хакатон, который мы проводили 21-22 апреля! Основная тематика – машинное обучение. Организовывать такое мероприятие собственными силами, оказалось гораздо сложнее, чем планировали. Но, мы все-таки справились. И, судя по отзывам участников, очень даже не плохо :-) .
В последнюю неделю выяснилось, что определенная часть аудитории стала сомневаться стоит ли участвовать в соревновании, боясь не справиться. Задачи основного зачета оказалась достаточно сложными. Поэтому, мы решили добавить более простую, но не менее интересную задачу: тот, чей бот наберет в Pacman больше очков — станет обладателем приза дополнительной номинации.
На наш Хакатон пришло около 90 человек. На экспертной сессии осталось около 70 участников, а настоящих героев, которые смогли выдержать весь Хакатон осталось чуть меньше половины, но это отличные результаты!
Участникам были предложены 6 сложных, но очень интересных задач, из которых самыми востребованными оказались:
1. Классификация входящего документооборота:
— Екатерина Глущенко и Маргарита Сахибгареева, доблестно сражались над этой задачей. Против отсутствия большого опыта в машинном обучении они противопоставили чисто женскую смекалку, и решили сложную задачу векторизации документов путем измерения расстояния до набора «ключевых слов, определенных экспертным путем» Получившиеся вектора они кластеризировали методом k-средних (k-means). В итоге, хоть и не универсальное, но зато работающее решение. В общем, жюри единогласно решило, присудить им 1 место. Награда:150 часов gpu-серверов Hyperlee.com и абонементы в фитнес Арена 3000.
— Арслан Ибатуллин, подошел к вопросу классификации, с другой стороны. Он не стал распознавать документы, а просто скормил нейронной сети их растровые изображения. То, что получилось на выходе, кластеризировал методом k-средних, и дал нам посмотреть результаты нелинейного снижения размерности (T-SNE), на котором видно, что множество разделилось. Так, что идея имеет право на жизнь. И, вполне возможно, что подобрав нейросеть можно получить приемлемые результаты (https://github.com/bashgu/NetVidSeg/blob/master/vgg/n..). За неординарность решения мы решили вручить ему купон на Microsoft Azure.
2. Предсказание объемов поставок в розничные магазины спортивных товаров:
— Команда Ballastteam, в составе Фархада Зайнуллина, Артема Сафаргалиева, Вадима Мингажева, Руслана Гаянова, Рамиля Сабирова, Ильгиза Хусаинова и Антона Железнова. Очень много работы провели по анализу исходных данных. В результате, сильно разряженную таблицу продаж исправили скользящим средним, обучили нейросеть на двух годах и спрогнозировали третий. Результат неплох, но немного занижает объем и запаздывает на пару дней. Но ребята сделали неплохую работу, особенно, в части анализа входных данных, за что заслуженное второе место, 100 часов мега-gpu-серверов Hyperlee.com и абонементы в фитнес Арена 3000.
— Булат Сулейманов, один на один с задачей бился всю ночь и решил ее применив градиентный бустинг. Погрешность у него получилась порядка 12-13%. Булат — новое лицо в AI сообществе Уфы. И, чтобы его первые шаги были тверже, мы наградили его купоном Microsoft Azure.
3. Бот играющий в Pacman
— За эту задачу взялись Максим Кучеров и Даниил Шарафутдинов из СФ БашГУ. У них неплохо получилось! Их нейросеть получила 6145 очков и сейчас занимает первую строку на gym.openai.com. Правда, мировой рекорд, поставленный человеком, составляет 3 333 360, а бот созданный google набрал 433 336 очков, так что задача имеет перспективы. И, поскольку, мы обозначили соревновательную номинацию, дадим всем желающим возможность соперничества до 1 мая.
Командное 3 место досталось Стерлитамакскому филиалу БашГУ, в составе: Арслан Ибатуллин (задача по распознаванию документов), Айнур Бухарметов (трансфер стиля изображений), talgatv (Талгат Вахитов)(чат-бот ВК), Виктор Петров (не ИИ в играх), Максим Кучеров и Даниил Шарафутдинов (обучение бота на нейросети в игру Atari Pacman) Им достались 50 часов gpu-сервера Hyperlee.com и купоны Microsoft Azure. Рустам Салаватов вырастил очень достойную смену.
Вне зачета Мухаммет Назиров и Ренат Казыханов, разработали интересную идею — алгоритм, который учится стимулировать повышение персональной эффективности человека. Чтобы они могли довести свой прототип до реального мобильного приложения мы наградили их купонами на Microsoft Azure.
Благодаря нашему первому опыту в организации хакатона, мы многому научились. В следующий раз 22.04.2018 проведем наш #HACKATHON3000 еще круче и масштабнее!
Еще больше интересной информации и фотографий смотрите в
нашей группе!"
А мы еще раз поздравляем всех победителей и участников Хакатона3000 и благодарим наших коллег из Уфы за прекрансую организацию такого крупного мероприятия!