Сервис предоставляет пробный период: 7 дней с вероятностью 0,8 или 21 день с вероятностью 0,2. Аналитик заходит в случайный момент времени, узнаёт, сколько дней уже прошло, ждёт окончания периода и записывает общую длительность. Какова средняя длительность пробного периода (в днях), которую он запишет?
Подробное объяснение
Задача учитывает эффект length-biased sampling: более длинные периоды чаще попадают в наблюдение при случайном выборе момента времени. Вероятность наблюдать период длиной t пропорциональна t. Средняя записанная длительность вычисляется как отношение математического ожидания квадрата длительности к математическому ожиданию длительности: E[T²]/E[T]. Для данных значений: E[T] = 0,8×7 + 0,2×21 = 9,8, E[T²] = 0,8×49 + 0,2×441 = 127,4. Результат: 127,4/9,8 = 13 дней.
Часто задаваемые вопросы (FAQ)
1
Что такое length-biased sampling?
Length-biased sampling — это эффект, при котором более длинные интервалы времени имеют большую вероятность попасть в выборку при случайном выборе момента времени, так как они занимают больше временного пространства.
2
Почему нельзя просто взять среднее арифметическое 7 и 21 с учётом вероятностей?
Потому что аналитик заходит в случайный момент времени, а не в начало периода. Более длинные периоды (21 день) будут наблюдаться чаще, чем их исходная вероятность 0,2, что требует коррекции весов.
3
Как формула E[T²]/E[T] связана с задачей?
Эта формула выводится из условия равномерного распределения момента входа аналитика на временной оси. Она учитывает, что вероятность попасть в период длиной t пропорциональна t, а средняя наблюдаемая длительность равна взвешенному среднему с весами, пропорциональными t.
Типичные ошибки
1
Вычисление простого среднего: (0,8×7 + 0,2×21) = 9,8 дней.
Это неверно, так как не учитывает, что аналитик заходит в случайный момент, а не в начало периода. Более длинные периоды наблюдаются чаще из-за length-biased sampling.
2
Использование среднего арифметического прошлого и оставшегося времени как половины длительности.
Ошибка возникает из-за неверного предположения, что аналитик записывает только оставшееся время или усредняет прошлое и будущее. На самом деле он записывает полную длительность периода, которая известна после его окончания.
3
Применение формулы для условного математического ожидания без учёта смещения выборки.
Неправильно вычислять E[T|попали внутрь] как взвешенное среднее 7 и 21 с исходными вероятностями 0,8 и 0,2. Нужно пересчитать веса с учётом того, что вероятность попасть в период пропорциональна его длине.