Обзор десяти инструментов Google для ИИ, которые могут использовать разработчики, компании и аналитики. Где искать качественные наборы данных и как привязать к проекту готовую модель TensorFlow.

Называть Google только поисковым гигантом было бы несправедливо – из системы нахождения релевантных сайтов он быстро превратился в движущую силу инноваций в ключевых IT-секторах. За последние годы Google пугающе укоренился почти во всём цифровом, будь то электроника (смартфоны, планшеты, ноутбуки), базовое программное обеспечение (Android, Chrome OS) или интеллектуальное ПО, поддерживаемое Google AI. В этой статье мы обсудим, какие инструменты предоставляются Google AI для разработчиков, исследователей и организаций.

I. Для разработчиков

1. TensorFlow

TensorFlow – набор программных библиотек глубокого обучения с открытым исходным кодом. Используя инструменты TensorFlow, аналитики данных могут создавать высокоточные и четко определенные модели машинного обучения. В прошлом году мы писали о версии TensorFlow 2.0, а ещё раньше – о том, как был создан интерфейс для JavaScript. В общем, фреймворк не стоит на месте!

2. ML Kit

ML Kit – это SDK для мобильных устройств, который в настоящее время доступен на Android и iOS. Он использует возможности машинного обучения Google в мобильных приложениях для решения проблем из реальной жизни. ML Kit поможет добиться успеха во многих задачах.

Идентификация языка. Передаем текст в ML Kit – получаем распознанный. Поддерживаются более сотни языков, включая хинди, арабский, китайский, не говоря уже о европейских. Полный список здесь.

Человеческие лица могут быть распознаны ML KIT. Больше примеров <a href="https://prostheticknowledge.tumblr.com/post/53395398529/anti-facial-recognition-visor-interesting" target="_blank" rel="noopener noreferrer nofollow">здесь</a>.

Распознавание объектов. Но не только язык. ML Kit хорош в распознавании текста, лиц, QR-кодов и других объектов на изображениях. Кроме того, есть API, чтобы добавлять ваши собственные модели машинного обучения в TensorFlow Lite и интегрировать их в приложения.

3. Google Open Source

Google продолжает открывать свой исходный код. И за счёт активного участия подключающегося сообщества наработки Google становятся ещё лучше. Вот пара недавних примеров больших проектов.

ClusterFuzz. В феврале 2019 г. компания открыла исходные тексты платформы ClusterFuzz, предназначенной для проведения тестирования кода с использованием кластера серверов. ClusterFuzz автоматизирует выполнение таких задач, как отправка уведомления разработчикам, создание issue, отслеживание ошибки и закрытие отчётов после исправления.

AutoFlip. В феврале этого года Google представила AutoFlip – систему интеллектуальной перестройки видео, определяющей наиболее важные объекты в кадре и соответствующим образом обрезающей ролик. За счёт этого из альбомно ориентированных видео можно получать вертикальные, портретные, которые удобно смотреть на мобильных телефонах без поворота экрана.

4. Colab

Если коротко, то Colab Laboratory или Colab – это онлайн-редактор и компилятор кода Python. Если вы знакомы с Jupyter Notebook, то это тот же инструмент, но которым можно пользоваться совместно онлайн. Идея работы в Colab кратко показана в следующем видео. При этом в течение 12 часов разрешено бесплатно пользоваться одним GPU NVidia Tesla K80 (после 12 часов расчет скидывается, но можно успеть посчитать небольшую модель).

II. Для исследователей

При погружении в новую область особенно необходимы исследования по изучаемой теме. Google упростила процесс поиска набора данных, предложив следующие инструменты.

5. Модерируемые датасеты Google Cloud

Фундаментальная проблема всякой модели ML состоит в том, чтобы обучить ее на «правильных» данных. Google Cloud Public Datasets – это наборы данных, курируемые специалистами Google, которые периодически обновляются при помощи анализа множества исследований. Форматы самые разные: изображения, транскрибированные аудио, видео и текст. Данные предназначены для широкого круга исследователей с различными сценариями использования. Поиск прочих датасетов можно выполнить с помощью следующего инструмента.

6. Поиск Google по наборам данных

В сентябре 2018 г. Google запустил поиск по наборам данных (Dataset Search). В выдаче указывается информация о ресурсе, где опубликован набор, лицензия, дата обновления, описание и доступные для скачивания форматы. Ниже на скриншоте представлен пример поиска результатов по запросу «погода в Cанкт-Петербурге». Несмотря на то что в названии датасета отсутствует имя города, набор данных соответствует запросу и содержит сведения по изменению погоды в Санкт-Петербурге и Ленинградской области. Но заметим, что обновлялся он довольно давно.

7. Crowdsource

Еще одна цель Google – повысить точность наборов данных, предлагая пользователям интересные задачи, например, распознавать различные категории изображений, такие как рисунки, письма, газеты, иллюстрации и многое другое. В этом случае Google эксплуатирует пользователей, предлагая игровую форму там, где Яндекс даёт – пусть и небольшие – но деньги.

С другой стороны, можно поучиться тому, как Google Crowdsource работает с изображениями, распознаванием почерка, выражений лиц, проверкой переводов и меток изображений. Результаты анализа Crowdsource можно перенести на собственные идеи по разметке данных в рамках игрового подхода.

III. Для организаций

Внимательно следя за рынком, Google определяет, как его сервисы могут превратить потенциально успешную идею в достигнутую цель и создаёт специальные инструменты для организаций.

8. Cloud TPU

Машинное обучение, несмотря на все достижения, требует высокопроизводительного железа. Для этого компания создала тензорный процессор (Tensor Processing Unit). Cloud TPU позволяет предприятиям за счет снижения затрат на оборудование предлагать клиентам свои лучшие услуги. Тензорный процессор относится к классу нейронных процессоров со специализированной интегральной схемой. Архитектура заточена под задачи линейной алгебры, и, например, позволяет обрабатывать в Google Фото одним процессором до 100 млн фотографий в день.

9. Cloud AI

Cloud AI позволяет внедрять возможности машинного обучения в свой бизнес. Используя Cloud AI, компании могут использовать уже имеющиеся модели, предоставляемые Google, или настроить их по своему вкусу.

Cloud AI состоит из трех компонентов: Hub, Building Blocks и Platform.

AI Hub предоставляет коллекцию готовых к использованию компонентов искусственного интеллекта с опциями для обмена и экспериментов на моделях.

AI Building Blocks позволяет разработчикам добавлять в свои приложения обработку речи, компьютерное зрение, работу с языком и структурированными данными.

AI Platform позволяет ученым, инженерам и разработчикам данных быстро развертывать свои идеи с помощью нескольких сервисов, таких как блокноты AI Platform, контейнеры глубокого обучения, сервисы создания меток и другие.

10. Cloud AutoML

Cloud AutoML используется такими популярными брендами, как Disney, Imagia и Meredith. Ниша инструмента – доступное машинное обучение для бизнеса с небольшим опытом в этой области, но исходно хорошо размеченными данными.

Заключение

Достижения в области искусственного интеллекта ошеломляют. Google последовательно внедряет инновации в этой сфере, предлагая несколько инструментов, таких как ML Kit, TensorFlow, Fire Indicators и многие другие. А искать датасеты можно не только на Kaggle, но и через специализированный поиск. Пользуетесь ли вы какими-то из перечисленных инструментов? Расскажите в комментариях.

***

Актуальные публикации Библиотеки программиста по теме ИИ:

Источники

https://towardsdatascience.com/top-google-ai-tools-for-everyone-60346ab7e08