Вычисление π: моделирование методом Монте-Карло

Каждый год 14 марта любители математики отмечают День числа пи! Есть много способов вычислить это легендарное число π, которое примерно равно 3,14159… Обсудим все эти методы и рассмотрим три способа вычисления π с использованием моделирования методом Монте-Карло! Что такое пи? Пи  —  это число, которое выражает отношение длины окружности к её ПОДРОБНЕЕ

Все модели машинного обучения за 6 минут

Фундаментальная сегментация моделей машинного обучения Все модели машинного обучения разделяются на обучение с учителем (supervised) и без учителя (unsupervised). В первую категорию входят регрессионная и классификационная модели. Рассмотрим значения этих терминов и входящие в эти категории модели. Обучение с учителем Представляет собой изучение функции, которая преобразует входные данные в выходные ПОДРОБНЕЕ

Что такое распределение Пуассона?

Прежде чем вводить параметр λ и подставлять его в формулу, давайте задумаемся: почему Пуассону вообще пришлось изобретать такое распределение? 1. Почему Пуассон изобрел свое распределение? Чтобы предсказывать количествобудущихсобытий! Или более формально: чтобы предсказывать вероятность данного числа событий, происходящих в определенный интервал времени. В продажах, например, “событие” это покупка (сам момент ПОДРОБНЕЕ

Топ-10 ошибок анализа данных

1. Неполное понимание целевой функции 2. Это работает, но почему? 3. Вы не смотрите на данные до интерпретации 4. У вас нет простейшей базовой модели 5. Неправильное тестирование вне выборки 6. Предварительная обработка всего набора 7. Перекрёстная проверка и панельный анализ 8. Какие данные доступны при принятии решения? 9. Переобучение 10. Нужно больше данных? Аналитик данных  —  ПОДРОБНЕЕ

Статистика - это грамматика науки о данных. Часть 5

Часть 1, Часть 2, Часть 3, Часть 4, Часть 5 Условная вероятность Условная вероятность — это вероятность наступления некоторого события, при условии, что другое событие уже произошло. Условная вероятность обозначается через P(A|B), которое читается как «вероятность А при условии В». Она вычисляется по формуле: Условная вероятность А при условии В A ∩ B — это ПОДРОБНЕЕ

Статистика - это грамматика науки о данных. Часть 4

Повторение статистики для начала путешествия по науке о данных Часть 1, Часть 2, Часть 3, Часть 4, Часть 5 Введение Предположим, у нас есть диаграмма рассеяния, на которой каждая точка — это человек. На одной оси показан его профессиональный опыт в годах, на другой — доход. Диаграмма рассеяния «профессиональный опыт vs доход» В соответствии с ПОДРОБНЕЕ

Статистика - это грамматика науки о данных. Часть 3

Повторение статистики для начала путешествия по науке о данных Часть 1, Часть 2, Часть 3, Часть 4, Часть 5 Меры расположения Процентили Процентили делят упорядоченные данные на сто равных частей. В рассортированных данных процентиль — это точка, показывающая процентное отношение значений в наборе данных, находящихся ниже данной точки. 50-й процентиль — это медиана. Например, ПОДРОБНЕЕ

Статистика - это грамматика науки о данных. Часть 2

Повторение статистики для начала путешествия по науке о данных Часть 1, Часть 2, Часть 3, Часть 4, Часть 5 Функции распределения вероятностей Функция распределения вероятностей — это функция, описывающая возможность того или иного события или результата. Мы разберем разные типы распределений в зависимости от вида набора данных: непрерывный или дискретный. Функция плотности ПОДРОБНЕЕ

Статистика - это грамматика науки о данных. Часть 1

Повторение статистики для начала путешествия по науке о данных Часть 1, Часть 2, Часть 3, Часть 4, Часть 5 «Статистика — это грамматика науки» Данное высказывание приписывают английскому математику Карлу Пирсону, который считается некоторыми основателем современной статистики. Мы же поговорим о статистике в науке о данных. Такие библиотеки машинного обучения, как Tensorflow ПОДРОБНЕЕ