DATA SCIENCE - IT-МИР. ПОМОЩЬ В IT-МИРЕ. BLOCKCHAIN. WEB 3.0

Биномиальное распределение

Все знают и любят нормальное распределение. Оно используется в инвестиционном моделировании, A/B-тестах и улучшении производственных процессов (шесть сигм). Но мало кто хорошо знаком с биномиальным распределением. Между тем, результаты бросков монеты следуют биномиальному распределению. Важно, что здесь работает закон больших чисел. Я также должен сказать, что если мы многократно выполняем ПОДРОБНЕЕ

Выборки. Джентльменский набор

Простая случайная выборка Вы хотите выбрать подмножество, в котором каждый член имеет равную вероятность быть выбранным. Ниже мы случайно выбираем 100 значений из набора данных: sample_df = df.sample(100) Название говорит само за себя. Это всё. Стратифицированная выборка Нам нужно оценить среднее количество голосов для каждого кандидата на выборах. В стране ПОДРОБНЕЕ

Что такое распределение Пуассона?

Прежде чем вводить параметр λ и подставлять его в формулу, давайте задумаемся: почему Пуассону вообще пришлось изобретать такое распределение? 1. Почему Пуассон изобрел свое распределение? Чтобы предсказывать количествобудущихсобытий! Или более формально: чтобы предсказывать вероятность данного числа событий, происходящих в определенный интервал времени. В продажах, например, “событие” это покупка (сам момент ПОДРОБНЕЕ

Алгоритмы поиска, которые должен знать каждый специалист по обработке и анализу данных

В последние годы алгоритмы для решения задач автоматического планирования и диспетчеризации стали вновь популярными в области машинного обучения. Понимание принципов их работы поможет увеличить производительность ваших моделей. К тому же, благодаря разработке таких мощных вычислительных технологий, как квантовых компьютеров, вскоре вновь будет использоваться искусственный интеллект, основанный на поиске. Что такое ПОДРОБНЕЕ

Создание анимации Gapminder двумя строчками кода с помощью Plotly Express

«Дисклеймер: мною использовался новый модульplotly_express, сама анимация Gapminder не создавалась с нуля всего двумя строчками.» Один из значимых моментов в истории визуализации данных — презентация Гансом Рослингом знаменитой анимации Gapminder на TED, которое вскоре получило огромное число просмотров. С этого момента создание такой же анимации стало показателем мастерства в области визуализации данных ПОДРОБНЕЕ

Топ-10 ошибок анализа данных

1. Неполное понимание целевой функции 2. Это работает, но почему? 3. Вы не смотрите на данные до интерпретации 4. У вас нет простейшей базовой модели 5. Неправильное тестирование вне выборки 6. Предварительная обработка всего набора 7. Перекрёстная проверка и панельный анализ 8. Какие данные доступны при принятии решения? 9. Переобучение 10. Нужно больше данных? Аналитик данных — ПОДРОБНЕЕ

В каком возрасте вы получите Нобелевскую премию — визуализация на языке R.

Вы когда-нибудь пробовали решать задачи с помощью визуализации? Предлагаем решить занимательную задачу на языке R. Нобелевские премии (до 1969 года всего их было пять, а затем добавилась шестая) присуждаются ежегодно фондом, учрежденным шведским изобретателем и промышленным магнатом Альфредом Нобелем. Во всем мире Нобелевская премия считается самой престижной наградой за интеллектуальные ПОДРОБНЕЕ

Алгоритм XGBoost: пусть он царствует долго!

Хоть с того момента и прошло 15 лет, я до сих пор помню первый день на моей первой работе. Я только-только выпустился из ВУЗа и начал работать в глобальном инвестиционном банке аналитиком. В первый день я постоянно поправлял галстук и нервно вспоминал всё, чему меня учили. В то же время ПОДРОБНЕЕ

Алгоритмы машинного обучения простым языком. Часть 3

Предыдущие части: Часть 1, Часть 2 Логистическая регрессия Итак, мы уже познакомились с линейной регрессией. Она определяла влияние переменных на другую переменную при условии, что: 1) результирующая переменная непрерывна и 2) отношение между независимыми переменными и результирующей линейное. Но что, если результирующая переменная категориальная? Тогда и приходит на помощь логистическая ПОДРОБНЕЕ

Алгоритмы машинного обучения простым языком. Часть 2

Предыдущие части: Часть 1 Ридж- и лассо- регрессия Моя бабушка до сих пор не очень напугана, поэтому продолжаем! Линейная регрессия не такая уж и пугающая, правда? Это просто метод нахождения связи между чем-то. Теперь, когда мы знаем, что такое линейная регрессия, можем поговорить о других методах, похожих на неё, например, ПОДРОБНЕЕ