Random forest в Python

Практический пример машинного обучения Введение в проблему План действий Обработка данных Определение аномальных значений / потеря данных Подготовка данных Возможности, цели и преобразование данных в массивы Наборы данных для обучения и проверки Организация основных данных Тренировка модели Определение показателей эффективности Интерпретация модели и отчет о ПОДРОБНЕЕ

Как легко оптимизировать Jupyter Notebook. Часть 1

Руководство для начинающих о том, как сделать Jupyter Notebook быстрее, мощнее и круче Самое классное в технологиях— это множество людей, которые усердно трудятся для улучшения нашей жизни. Каждый день они кровью и потом создают инструменты, упрощающие нашу работу. Вам, к примеру, может казаться, что одной установки ПОДРОБНЕЕ

Вычисление π: моделирование методом Монте-Карло

Каждый год 14 марта любители математики отмечают День числа пи! Есть много способов вычислить это легендарное число π, которое примерно равно 3,14159… Обсудим все эти методы и рассмотрим три способа вычисления π с использованием моделирования методом Монте-Карло! Что такое пи? Пи  —  это число, которое выражает ПОДРОБНЕЕ

SQL в науке о данных

Введение SQL (язык структурированных запросов) — язык программирования, используемый для запроса и управления данными в реляционных базах данных. Реляционные базы данных состоят из наборов двумерных таблиц. Каждая из этих таблиц содержит фиксированное количество столбцов и строк. Наряду с Python и R, SQL считается одним из ПОДРОБНЕЕ

6 техник, которые помогут вам учиться лучше

Я осваивал машинное обучение каждый день в течение девяти месяцев, а затем нашёл работу. Узнайте, как всё было. После ухода из Apple я основал интернет-стартап. Но особого энтузиазма он у меня не вызывал, и моё начинание заглохло. Машинное обучение — вот, что меня будоражило! Мне захотелось изучить ПОДРОБНЕЕ

5 лучших библиотек машинного обучения

За последние несколько лет рост машинного обучения достиг стремительных темпов. Это связано с выпуском библиотек машинного обучения (МО)/глубокого обучения (ГО), которые абстрагируются от сложности скаффолдинга или реализации модели МО/ГО. МО/ГО включает в себя множество математических вычислений и операций, особенно Matrix. С помощью МО/ГО даже простой ПОДРОБНЕЕ

Самая лучшая идея в науке о данных

Есть три типа шаблонов данных: Шаблоны/факты, которые существуют в наборе данных и за его пределами. Шаблоны/факты, которые существуют только в наборе данных. Шаблоны/факты, которые существуют только в воображении (апофении). Шаблон данных может существовать (1) во всей совокупности, представляющей интерес, (2) только в выборке или (3) ПОДРОБНЕЕ

То, чего вам никто не расскажет о поиске работы, связанной с анализом данных

Я физик и работаю в стартапе YCombinator. Из-за специфики работы компании я получаю много писем с просьбами дать советы по построению карьеры в области анализа данных. Зачастую разными людьми задаются похожие вопросы. Благодаря тому, что я получаю большое количество таких писем и отвечаю на них, ПОДРОБНЕЕ

Как учатся машины.

С каждым днём машины становятся умнее. Когда вы заходите на YouTube, Amazon, или Facebook, то для вас автоматически подбираются рекомендованные видео, товары и посты. Машины могут генерировать изображение человеческого лица, идентифицировать рак по фотографии, понимать речь и побеждать нас в играх. Как машины стали такими ПОДРОБНЕЕ

Vaex: Python библиотека для работы с DataFrame вне памяти и быстрой визуализации

Данных становится всё больше Некоторые массивы данных слишком велики, чтобы поместиться в основной памяти обычного компьютера, не говоря уже о ноутбуке. Тем не менее, все хотят работать с большими данными, но при этом не тратить время на изучение инфраструктуры Hadoop или Spark только для того, чтобы ПОДРОБНЕЕ