Skip to content

Latest commit

 

History

History
29 lines (22 loc) · 3.62 KB

File metadata and controls

29 lines (22 loc) · 3.62 KB

Задание для кандидатов.

Набор данных, необходимый для решения задач представлен на одноименных вкладках .xls файла data.xlsx:

Задача 1.

Написать код SQL-запроса к таблице данных результатом которого будет: 1. Количество уникальных/неуникальных ID 2. Посчитать долю значений целевого признака (target=1) в разрезе категорий образования. 3. На сколько в среднем доход семьи заемщиков с id=2n, больше дохода семьи заемщиков с id=2n+1, где n- произвольное целое число?

Задача 2.

Написать SQL-запроса к таблице данных результатом, которого будет отсортированный в порядке обратном от изначального список.

Задача 3.

Написать SQL-запроса к таблице данных результатом которого будет: 1. Таблица, в которой будет посчитана сумма операций (AMOUT) за каждый из дней (DATE) 2. Таблица, в которой будет посчитана сумма операций (AMOUT) за каждый из дней (DATE) накопительным итогом, т.е. в сумме операций дня n учитывает сумму операций дня n-1

Задача 4.

Температуру в Москве можно рассматривать как сл. Величину со средним и ст. отклонением равным 10 градусам по Цельсию. Некоторый день считается аномальным, если температура выходит за два стандартных отклонения. Какими будут границы, с которых день считается аномальным в градусах по Фаренгейту?

Задача 5.

После прохождения курса статистики Петя решил моделировать время, которое он тратит на домашние задания в неделю как экспоненциально распределенную сл. величину с неизвестным . Времена, которые он замерил в разные недели можно считать независимыми. В первые шесть недель четверти Петя потратил на задания 11, 15, 17, 9, 18 и 23 часов. Чему равна оценка максимум правдоподобия параметра ?

Задача 6.

Имеется информация по клиентам (список полей во вложении). Необходимо любым, выбранным кандидатом, способом спрогнозировать целевой признак target (бинарный признак 1/0). 1. Выбор метода моделирования и итоговой модели обосновать. Обоснование необходимо сделать по максимально возможному количеству критериев. 2. Является ли Ваш прогноз стабильным? Не переобучили ли вы Вашу модель? Объясните почему.