6 техник, которые помогут вам учиться лучше

Я осваивал машинное обучение каждый день в течение девяти месяцев, а затем нашёл работу. Узнайте, как всё было. После ухода из Apple я основал интернет-стартап. Но особого энтузиазма он у меня не вызывал, и моё начинание заглохло. Машинное обучение — вот, что меня будоражило! Мне захотелось изучить его вдоль и поперёк, чтобы ПОДРОБНЕЕ

Самая лучшая идея в науке о данных

Есть три типа шаблонов данных: Шаблоны/факты, которые существуют в наборе данных и за его пределами. Шаблоны/факты, которые существуют только в наборе данных. Шаблоны/факты, которые существуют только в воображении (апофении). Шаблон данных может существовать (1) во всей совокупности, представляющей интерес, (2) только в выборке или (3) только в голове. Какой из ПОДРОБНЕЕ

Лучшие бесплатные источники наборов данных для анализа

Сбор высококачественных данных представляет собой важную часть любого анализа данных или проекта по машинному обучению. В целях экономии вашего драгоценного времени команда WebDataRocks подготовила тщательно отобранный список бесплатных репозиториев с реальными данными, готовыми к использованию в проекте. Приступим! Socrata OpenData Одна из крупнейших и наиболее мощных поисковых систем, в которой ПОДРОБНЕЕ

То, чего вам никто не расскажет о поиске работы, связанной с анализом данных

Я физик и работаю в стартапе YCombinator. Из-за специфики работы компании я получаю много писем с просьбами дать советы по построению карьеры в области анализа данных. Зачастую разными людьми задаются похожие вопросы. Благодаря тому, что я получаю большое количество таких писем и отвечаю на них, у меня появились шаблонные ответы ПОДРОБНЕЕ

Рекурсивное программирование

При первом знакомстве с концепцией рекурсии, она может показаться странной и отталкивающей. Это кажется почти парадоксальным: как мы можем найти решение проблемы, используя решение той же проблемы? Несмотря на это, в большинстве проектов, рекурсию используют в программировании уже на ранних стадиях производства. От рекурсии может заболеть голова Я думаю, что тем, ПОДРОБНЕЕ

Cтарая поговорка гласит: “Одна голова хорошо, а две — лучше”

Я часто слышу, как люди говорят о том, что их работа продвигается более эффективно и плодотворно когда они остаются одни. Также я знаю, что некоторые идеи/методы, полезные для одного человека, могут оказаться вредными для другого. Тем не менее, я твердо верю во фразу, которая гласит: “одна голова хорошо, а две — лучше”. Нижеприведенные ПОДРОБНЕЕ

Важные аспекты математики в науке о данных - «что» и «почему»

Введение Математика является фундаментом для любой современной научной дисциплины. И ни для кого не секрет, что почти все методы современной науки о данных (включая машинное обучение) строятся на тех или иных математических вычислениях. Порой, будучи специалистом по обработке и анализу данных (или даже junior-аналитиком ) необходимо знать базовую математику, чтобы ПОДРОБНЕЕ

Vaex: Python библиотека для работы с DataFrame вне памяти и быстрой визуализации

Данных становится всё больше Некоторые массивы данных слишком велики, чтобы поместиться в основной памяти обычного компьютера, не говоря уже о ноутбуке. Тем не менее, все хотят работать с большими данными, но при этом не тратить время на изучение инфраструктуры Hadoop или Spark только для того, чтобы поэкспериментировать с Big Data. Наша ПОДРОБНЕЕ

Руководство к использованию деревьев решений в машинном обучении и науке о данных

Деревья решений являются классом очень эффективной модели машинного обучения, позволяющей получить высокую точность в решении многих задач, сохраняя при этом высокий уровень интерпретации. Четкость представления информации делает деревья решений особенными среди других моделей машинного обучения. Освоенные деревом решений «знания» напрямую формируются в иерархическую структуру, которая хранит и представляет знания в ПОДРОБНЕЕ

Машинное обучение. С чего начать? Часть 2

Предыдущая часть: Часть 1 Очистка данных В любом проекте приходится заниматься «чисткой данных». К следующему этапу можно переходить только после приведения в порядок ваших данных. Чаще всего пропущенные данные просто добавляют. Вы можете дополнить недостающие данные разными способами: по моде, среднему значению или медиане. Пробуйте разные способы и выбирайте наиболее ПОДРОБНЕЕ