Форум Сообщества Аналитиков

×


Помогите решить задачку(Прочитано 820 раз)
Помогите решить задачку : 06 Июня 2018, 11:20:04
Есть данные по футбольным соревнованиям 2 команд. (Список игроков, и дальше поля таблицы - время на поле каждого игрока, его личные параметры - скорость, преодоленная дистанция, количество голов и т.д., и параметры игры, в основном в % - сколько % времени мяч был у одной команды, какой % атак на ворота был успешным в то время, когда конкретный игрок находился на поле и др. Данные агрегированы по всем играм, еще известен итоговый счет каждой игры).
Надо проанализировать, за счет каких факторов А выиграла у Б всю серию игр.

Напишите, пожалуйста, с какой стороны подойти к решению этой задачи? Это вариации на тему регрессии? Здесь нет одной зависимой величины (ну или это градация выиграли/проиграли), здесь надо сравнить 2 команды по разным критериям, понять, какие из них важнее.



Re: Помогите решить задачку Ответ #1 : 13 Июня 2018, 15:13:45
Зависимой величины нет, придумаем.

У нас есть много персональных данных по каждому игроку команды. Чтобы от них перейти к критериям, необходимо как-то эти данные обобщить. Например, есть скорости 22-х игроков в каждой игре. Значит, есть средняя, максимальная (минимальная), количество игроков в верхнем дециле скоростей (все - в одной игре, а то и просто по всем играм чохом - мы же изобретаем критерии, кто ж нас ограничивает) и т.д. А вот это уже получаются критерии, корреляцию которых с результатом игры можно проверять.

Остается, правда, вопрос о смысле этих манипуляций, но это вопрос к автору задачи.