fbpx

Каталог статей

Каталог статей для размещения статей информационного характера

Как выучить

Learning Path: Ваш наставник, чтобы стать экспертом в области машинного обучения

Путь обучения: ваш наставник, чтобы стать экспертом в области машинного обучения

Мало того, что существует огромное количество доступных ресурсов, они еще и очень быстро устаревают. Добавьте к этому большое количество технического жаргона, и вы поймете, почему люди теряются при изучении машинного обучения. Однако это только часть истории. Вы не сможете овладеть машинным обучением, если не пройдете весь путь самостоятельно. Вам придется потратить часы на понимание тонкостей разработки функций, их важности и того влияния, которое они могут оказать на ваши модели.

В этом учебном курсе мы надеемся дать вам ответ на эту проблему. Мы намеренно загрузили этот путь обучения большим количеством практических проектов. Вы не сможете овладеть машинным обучением только благодаря упорному труду! Но как только вы это сделаете, вы станете одним из самых востребованных людей в мире.

Поскольку это сложная тема, мы рекомендуем вам строго следовать шагам в последовательном порядке. Считайте это своим наставником в машинном обучении. Пропускайте шаг, только если вы уже знаете предмет, упомянутый в этом шаге.

Разминка – чем полезно машинное обучение?

Если вы только начинаете изучать машинное обучение, вот хорошая статья Джереми Ховарда, которая поможет вам понять, как машинное обучение меняет этот мир. Джереми рассказывает о различных областях применения машинного обучения и глубокого обучения. Джереми также обсуждает несколько способов, с помощью которых машинное обучение может повлиять на этот мир.

Если вы все еще не уверены, посмотрите это небольшое видео об обучении машины игре в Super Mario.

Воодушевлены тем, чего может достичь машинное обучение? Давайте рассмотрим путь обучения, который сделает вас экспертом в области машинного обучения.

Шаг 0: Основы R / Python

Существует множество языков, которые предоставляют возможности машинного обучения. Кроме того, разработка нескольких языков ведется быстрыми темпами. В настоящее время ” R ” и ” Python ” являются наиболее часто используемыми языками, и для обоих существует достаточная поддержка / сообщество. Прежде чем войти в мир ML, я бы рекомендовал вам выбрать один из этих двух языков (R или Python), который поможет сосредоточиться на машинном обучении (Что лучше – R или Python?).

Сосредоточьтесь на понимании основ языка, библиотек и структуры данных. Вот пошаговое руководство по изучению R и Python:

a) Путь изучения R: Шаг 0 – Шаг 2

b) Путь изучения Python: Шаг 0 – Шаг 2

Другие языки, которые вы можете рассмотреть: Scala, Go / Julia в ближайшее время

Шаг 1: Изучите основы описательной и инференциальной статистики

Давайте начнем или освежим наши знания по статистике. Прежде чем приступать к серьезной разработке машинного обучения, неплохо иметь представление об описательной и инференциальной статистике. Udacity предлагает курсы по описательной статистике и инференциальной статистике. Оба курса используют Excel, чтобы научить вас всем основам статистики. Если вы уже знаете их, вы можете освежить или пропустить этот шаг.

Задание: Вы можете выполнять задания обоих курсов, используя выбранный вами язык (R / Python). Вы можете ознакомиться с соответствующими статистическими библиотеками и методами для обоих языков ниже.

Шаг 2: Исследование / очистка / подготовка данных

Что отличает хорошего специалиста по машинному обучению от среднего, так это качество разработки признаков и очистки данных, которые происходят на исходных данных. Чем больше времени вы уделите этому этапу, тем лучше. Этот этап также занимает большую часть вашего времени, поэтому важно создать вокруг него структуру. Вы можете ознакомиться с серией статей ниже, чтобы узнать о различных этапах исследования данных.

Вы также можете ознакомиться с методами исследования данных в R и Python:

Упражнение / задание:

  1. Возьмите задачу о выживании титаника с сайта Kaggle, постройте ряд гипотез, затем очистите данные, добавьте новые характеристики к существующему набору данных. Подумайте, как лучше всего вписать недостающий возраст?
  2. Аналогично, возьмите задачу прогнозирования спроса на совместное использование велосипедов и повторите вышеупомянутый цикл.

Шаг 3: Введение в машинное обучение

Теперь вы должны открыть двери для машинного обучения. Существуют различные ресурсы для начала работы с методами машинного обучения. Я бы предложил вам выбрать один из следующих двух способов в зависимости от вашего стиля обучения:

  • Вариант 1: Если вы из тех, кто любит учиться маленькими шажками и нуждается в дополнительной помощи, вам стоит начать с курса по машинному обучению от Эндрю Нг: Это хороший курс для начинающих и легкий для понимания. Профессор Нг удивительным образом доносит до вас сложные понятия так легко. Курс охватывает все основные алгоритмы, а также знакомит с несколькими продвинутыми темами, такими как нейронные сети, рекомендательная система и применение машинного обучения в больших базах данных с помощью Map Reduce. Для преподавания машинного обучения он предпочитает использовать Octave / MATLAB вместо более популярных R или Python. После завершения курса вы должны перейти к упражнениям и домашним заданиям, представленным в варианте 2.
  • Вариант 2: Если вы более независимы, любите сложные задачи и можете бороться с трудными заданиями, вам следует пройти курс “Обучение формам данных” профессора Ясера Абу-Мостафы: Этот курс дает потрясающее изложение концепций машинного обучения, но имейте в виду, что в нем много математики и теории, лежащей в основе машинного обучения (например, измерение VC). Он также требует больше знаний по программированию и поэтому является более продвинутым в этом смысле. Этот курс насыщен домашними заданиями (что не обязательно плохо).

Теперь у вас есть хорошее понимание алгоритмов и методов. Давайте рассмотрим библиотеки или пакеты, доступные в R или Python. Вы можете обратиться к пути обучения (шаг 6) R (дополнительно, Алгоритмы ML в R) и Python, чтобы изучить эти пакеты и связанные с ними возможности.

Шаг 4: Участвуйте в конкурсе знаний Kaggle

Теперь у вас есть все необходимые инструменты для участия в конкурсах знаний Kaggle. Эти конкурсы знаний имеют меньший уровень сложности по сравнению с конкурсами, в которых можно выиграть приз. Вы также можете найти различные сопутствующие ресурсы, чтобы начать свое путешествие в области науки о данных. Ниже приведен список активных в настоящее время конкурсов знаний:

  • Титаник: Машинное обучение на основе катастрофы
  • Классификация преступлений в Сан-Франциско

Шаг 5: A

Наиболее полным ресурсом является deeplearning.net. Здесь вы найдете все – лекции, наборы данных, задачи, учебники.

Еще один курс от Джеффа Хинтона, который стоит попробовать в попытке понять основы нейронных сетей

Распознавание образов с помощью Python (Ресурс 1, Ресурс 2, Ресурс 3) и R (Ресурс 1)

  • Текстовый майнинг с использованием Python (Ресурс) и R (Ресурс 1, Ресурс 2)
  • Моделирование ансамблей
  • Именно здесь эксперт отличается от обычного профессионала. Ансамблевое моделирование может придать вашим моделям большую мощь и является очень успешной техникой в различных соревнованиях Kaggle. Вот одно из лучших руководств по ансамблевому моделированию, которое нам удалось найти.
  • Машинное обучение с большими данными

Как вы знаете, объем данных растет по экспоненте, но необработанные данные не приносят пользы, пока вы не начнете извлекать из них выводы. Машинное обучение – это не что иное, как обучение на основе данных, генерирование выводов или выявление закономерностей в имеющемся наборе данных. Существуют различные области применения алгоритмов машинного обучения, такие как “обнаружение спама”, “классификация веб-документов”, “обнаружение мошенничества”, “рекомендательная система” и многие другие. Ниже приведен список учебников по работе с большими данными с использованием машинного обучения.

Шаг 6: Участвуйте в основных соревнованиях Kaggle

Теперь у вас есть большинство технических и статистических навыков. Пришло время начать учиться у коллег, занимающихся изучением данных, и одновременно соревноваться с ними. Kaggle – это такое же место, как и то, что мы хотим, более активная, вовлеченная и конкурентная платформа. Ученые, изучающие данные, увлечены своим рангом и производительностью моделей. Погрузитесь в одно из живых соревнований, которые сейчас проходят на Kaggle, и попробуйте все, чему вы научились! Удачи!

Дополнительный шаг: Работа с текстом и базами данных

Если вам необходимо применить машинное обучение для анализа текстов, вы можете ознакомиться со следующим руководством по очистке текстовых данных и построению моделей на их основе. Вы также можете посмотреть на следующее соревнование Kaggle:

Веселая часть

Теперь, когда вы знаете, что и где нужно изучать, чтобы стать профессионалом в области машинного обучения, вот небольшая симуляция того, как робот на основе генетического алгоритма будет учиться ходить.

И немного серьезных вещей

Теперь, когда вы знаете о потенциале машинного обучения, представьте, какое влияние оно может оказать на современный мир. В докладе Джереми кратко упоминается об этом. Следующая статья рассказывает об этой эволюции с другой точки зрения: часть 1 и часть 2.

Надеюсь, вам понравилась эта статья о машинном обучении и о том, какое влияние оно может оказать на наше будущее. Если у вас есть предложения по улучшению этого пути обучения, пожалуйста, поделитесь ими в комментариях ниже.

Лучший способ изучения машинного обучения

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *