cointegrated (cointegrated) wrote,
cointegrated
cointegrated

Category:

о пользе Байесовского подхода замолвите слово

Сигнал и шум: почему одни прогнозы сбываются, а другие - нет. Нейт Сильвер.

Это, как вы могли догадаться, книга про прогнозирование. То есть про то, как поглядев на X и Y в прошлом, сказать, что вот таким X соответствуют такие вот будущие Y. Но эта книга не про методы, как можно было подумать, исходя из довольно технического названия, а скорее про фундаментальные подходы к прогнозированию. На протяжении всего повествования автор действительно пытается разобраться и показать читателям, что отличает плохие прогнозы от хороших. Никакой математики здесь почти нет - только истории и их интерпретация.


Оказывается, в прогнозировании роста ВВП, кредитоспособности и стоимости ценных бумаг, терроризма, результатов выборов, успешности бейсбольных и баскетбольных игроков, погоды и глобального потепления, землетрясений и эпидемий, исходов игры в покер и шахматы - в общем, везде, где есть место обоснованному предсказанию, успешные прогнозы обладают схожими свойствами. Неможко притянув за уши, можно назвать эти хорошие свойства "шириной" и "глубиной". Ширина - в том, чтобы использовать все полезные X, и чтобы рассмотреть все возможные сценарии развития Y, оставив как можно меньше "неизвестных неизвестностей". Глубина - в том, чтобы подкрепить свой прогноз фундаментальными знаниями о том, как устроена предметная область.

Но назвать хорошие свойства прогноза проще, чем добиться, чтобы они выполнялись - на практике вас окружает море информации, какой угодно, но только не той, которая вам нужна. И очень легко переобучить прогнозирующую модель - заставить её повторять шум, а не сигнал (например, пытаться предсказывать результаты футбольных матчей по поведению осьминога). Как выделить сигнал в море шума, найти иголку в стоге сена, распознать ровно те предметы и события, которые сделают ваш прогноз более точным? Оказывается, универсальный ответ найден многие века назад - это простая, как пробка, формула Байеса. И на первый взгляд неприятная философия, которая за ней стоит - будь мир хоть полностью предопределённым, мы вынуждены рассматривать его как вероятностный и, более того, мы должны уметь от балды назвать априорную (желательно ненулевую!) вероятность любого события. Априорную - значит, полученную ещё до того, как мы использовали данные. Посмотрев на данные, эту вероятность можно скорректировать, чтобы на выходе получить прогноз - постериорную вероятность того или иного сценария.
И всё. Ничего лучше, чем вероятностный прогноз, у нас сделать не получится - но ничего лучше и не нужно. Вероятностного прогноза обычно достаточно для принятия решений, а если кто-то предсказывает нетривиальные вещи со 100% уверенностью в исходе, то, скорее всего, этот кто-то умеет прогнозировать не так хорошо, как пытается вам показать. И вообще, главная ошибка предсказателей - это чрезмерная уверенность в правильности и точности собственных прогнозов. И, возможно, именно её в первую очередь учит избегать Нейт Сильвер, рассматривая в своей книге десятки провальных и успешных прогнозов самых разных людей в самых разных областях знаний.

Если прогнозирование - ваша ежедневная работа, эта книга для вас; она напоминает о важных вещах, которые профессионал должен держать в сознании (если не в подсознании) и о фатальных ошибках, которые мы так склонны совершать. Если вы ещё только изучаете анализ данных и смежные дисциплины, она станет хорошим дополонением к теории, формируя правильный mindset. Если же вы бесконечно далеки от этой темы - задумайтесь, может быть, уже на следующем кейс-чемпионате вам придётся прогнозировать цены на нефть или проникновение M2M-технологий на российский рынок. И понимание, чем отличается хороший прогноз от плохого, вам будет весьма кстати.

Tags: книги, моделирование
Subscribe

  • Выходные в норке

    Завершился ШАДик, выпустились птенчики-Фениксы, построена модель NCL, и даже на диссер уже получен отзыв рецензента. Наступили выходные, и Давид, как…

  • На берегу

    Я бегу по Коломенской набережной, таращусь на песчаный берег обмелевшей ещё осенью Москвы-реки, и мне хорошо. Существует неортодоксальная точка…

  • Воргол

    Воргол История про косяки и про удачу Всё началось в какие-то незапамятные времена... Но здесь предыстория не важна - важен тот факт, что на исходе…

  • Post a new comment

    Error

    Anonymous comments are disabled in this journal

    default userpic
  • 0 comments