Big Data - IT-МИР. ПОМОЩЬ В IT-МИРЕ. BLOCKCHAIN. WEB 3.0

Обзор библиотеки Datatable в Python

datatable Установка Считывание данных Преобразование объекта Frame Свойства Frame Сводная статистика Обработка данных Сохранение Заключение Данные, с которыми вы работаете, уже настолько большие, что вы часами ждёте их загрузки? Пора осваивать новый инструмент, который избавит вас от долгого ожидания —datatable! “В период до 2003 года в мире было создано пять эксабайтов ПОДРОБНЕЕ

Цифровизация оборота лекарственных препаратов на примере кейса для сети аптек «Планета здоровья»

3 апреля 2020 года Президент РФ подписал закон, позволяющий аптекам продавать безрецептурные препараты через интернет. Этот закон был вынесен на рассмотрение ещё в конце 2017 года. C того времени аптеки начали готовиться к его принятию. Планировать логистику, нанимать интернет-маркетологов, разрабатывать интернет-магазины. Делать все, чтобы к моменту подписания закона быть во ПОДРОБНЕЕ

Переход от монолитного Data Lake к распределённой Data Mesh

Привет, Хабр! Представляю вашему вниманию перевод статьи «How to Move Beyond a Monolithic Data Lake to a Distributed Data Mesh» автора Zhamak Dehghani (Жамак Дегани)(все изображения взяты из этой же статьи). Все крупные компании сейчас пытаются строить огромные централизованные хранилища данных. Или же ещё более огромные кластерные Data Lakes (как ПОДРОБНЕЕ

Как мы кратно улучшили качество рекомендаций в оффлайн ритейле

Введение Как и все в начале пути, мы стартанули с обзора того, как делаются рекомендательные системы. И самой популярной оказалась архитектура следующего типа: Она состоит из двух частей: Сэмплирование кандидатов для рекомендаций простой и быстрой моделью, обычно коллаборативной. Ранжирование кандидатов более сложной и медленной контентной моделью c учётом всех возможных ПОДРОБНЕЕ

SQL в науке о данных

Введение SQL (язык структурированных запросов) — язык программирования, используемый для запроса и управления данными в реляционных базах данных. Реляционные базы данных состоят из наборов двумерных таблиц. Каждая из этих таблиц содержит фиксированное количество столбцов и строк. Наряду с Python и R, SQL считается одним из важнейших навыков в науке о ПОДРОБНЕЕ

Vaex: Python библиотека для работы с DataFrame вне памяти и быстрой визуализации

Данных становится всё больше Некоторые массивы данных слишком велики, чтобы поместиться в основной памяти обычного компьютера, не говоря уже о ноутбуке. Тем не менее, все хотят работать с большими данными, но при этом не тратить время на изучение инфраструктуры Hadoop или Spark только для того, чтобы поэкспериментировать с Big Data. Наша ПОДРОБНЕЕ