fbpx

Каталог статей

Каталог статей для размещения статей информационного характера

Как выучить

Типы алгоритмов машинного обучения, которые вы должны знать

Типы алгоритмов машинного обучения, которые вы должны знать

По просьбе моего друга Ричальдо, в этом посте я расскажу о типах алгоритмов машинного обучения и о том, когда следует использовать каждый из них. Я считаю, что знакомство с типами алгоритмов машинного обучения – это как бы знакомство с большой картиной ИИ и целью всего того, что делается в этой области, что позволит вам лучше разобраться с реальной проблемой и разработать систему машинного обучения.

Термины, часто используемые в этой статье:

  • Маркированные данные : Данные, состоящие из набора обучающих примеров, где каждый пример представляет собой пару, состоящую из входного сигнала и желаемого выходного значения (также называются управляющим сигналом, метками и т.д.).
  • Классификация: Цель – предсказать дискретные значения, например, , , , .
  • Регрессия: Цель – предсказать непрерывные значения, например, цены на жилье.

Типы алгоритмов машинного обучения

Существуют некоторые вариации определения типов алгоритмов машинного обучения, но обычно их можно разделить на категории в соответствии с их назначением, и основные категории следующие:

контролируемое обучение

  • I like to think of supervised learning with the concept of function approximation, where basically we train an algorithm and in the end of the process we pick the function that best describes the input data, the one that for a given X makes the best estimation of y (X -> y). В большинстве случаев мы не можем определить истинную функцию, которая всегда делает правильные предсказания, и другая причина заключается в том, что алгоритм полагается на предположение, сделанное людьми о том, как компьютер должен учиться, и эти предположения вносят предвзятость, предвзятость – это тема, которую я объясню в другом посте.
  • Здесь человеческие эксперты выступают в роли учителя, когда мы подаем компьютеру обучающие данные, содержащие входные данные/предсказатели, и показываем ему правильные ответы (выходные данные), и на основе этих данных компьютер должен уметь изучать закономерности.
  • Алгоритмы контролируемого обучения пытаются смоделировать связи и зависимости между целевым выходным сигналом предсказания и входными характеристиками таким образом, чтобы мы могли предсказать выходные значения для новых данных на основе этих связей, которые компьютер узнал из предыдущих наборов данных.

Проект

  • Модель предсказания
  • у нас есть маркированные данные
  • Основные типы задач контролируемого обучения включают задачи регрессии и классификации.

Список распространенных алгоритмов

  • Ближайший сосед
  • Наивный Байес
  • Деревья решений
  • Линейная регрессия
  • Векторные машины поддержки (SVM)
  • Нейронные сети

Обучение без контроля

  • Компьютер обучается на немаркированных данных.
  • Здесь вообще нет учителя, на самом деле компьютер может быть способен научить вас новым вещам после того, как узнает закономерности в данных. Эти алгоритмы особенно полезны в случаях, когда человек-эксперт не знает, что искать в данных.
  • Это семейство алгоритмов машинного обучения, которые в основном используются для обнаружения закономерностей и описательного моделирования. Однако здесь нет выходных категорий или меток, на основе которых алгоритм может попытаться смоделировать взаимосвязи. Эти алгоритмы пытаются использовать методы на входных данных для поиска правил, обнаружения закономерностей, обобщения и группировки точек данных, что помогает получить значимые выводы и лучше описать данные для пользователей.

Проект

  • Описательная модель
  • Основные типы алгоритмов обучения без наблюдения включают алгоритмы кластеризации и алгоритмы обучения ассоциативным правилам.

Список распространенных алгоритмов

  • кластеризация k-средних, ассоциативные правила

Полунаблюдаемое обучение

В предыдущих двух типах либо отсутствуют метки для всех наблюдений в наборе данных, либо метки присутствуют для всех наблюдений. Полунаблюдаемое обучение находится между этими двумя типами. Во многих практических ситуациях стоимость маркировки довольно высока, поскольку для этого требуются квалифицированные специалисты. Поэтому при отсутствии меток в большинстве наблюдений, но наличии их в немногих, полунаблюдаемые алгоритмы являются лучшими кандидатами для построения модели. Эти методы используют идею о том, что, хотя принадлежность к группе немаркированных данных неизвестна, эти данные несут важную информацию о параметрах группы.

Обучение с усилением

Метод направлен на использование наблюдений, полученных в результате взаимодействия с окружающей средой, для принятия действий, которые максимизируют вознаграждение или минимизируют риск. Алгоритм обучения с подкреплением (называемый агентом) непрерывно итеративно учится у окружающей среды. В ходе этого процесса агент учится на своем опыте работы с окружающей средой, пока не исследует весь спектр возможных состояний.

Обучение с применением подкрепления является одним из видов машинного обучения и, таким образом, одним из направлений искусственного интеллекта. Оно позволяет машинам и программным агентам автоматически определять идеальное поведение в определенном контексте, чтобы максимизировать свою производительность. Для того чтобы агент научился своему поведению, необходима простая обратная связь в виде вознаграждения; это называется сигналом подкрепления.

Существует множество различных алгоритмов, которые решают эту проблему. По сути, Reinforcement Learning определяется конкретным типом задачи, и все ее решения классифицируются как алгоритмы Reinforcement Learning. В этой задаче агент должен решить, какое действие лучше выбрать, основываясь на своем текущем состоянии. Когда этот шаг повторяется, проблема известна как Марковский процесс принятия решений.

Чтобы создать интеллектуальные программы (также называемые агентами), обучение с подкреплением проходит следующие шаги:

  1. Агент наблюдает за входным состоянием.
  2. Функция принятия решения используется для того, чтобы заставить агента выполнить действие.
  3. После выполнения действия агент получает вознаграждение или подкрепление от окружающей среды.
  4. Информация о вознаграждении сохраняется в паре “состояние-действие”.

Список распространенных алгоритмов

  • Q-Learning
  • Темпоральная разница (TD)
  • Глубокие адверсивные сети

Примеры использования:

Некоторые приложения алгоритмов обучения с подкреплением – это компьютерные настольные игры (шахматы, го), роботизированные руки и самоуправляемые автомобили.

Заключительные замечания

Можно использовать различные критерии для классификации типов алгоритмов машинного обучения, но я думаю, что использование задачи обучения отлично подходит для визуализации общей картины ML, и я считаю, что в зависимости от вашей проблемы и имеющихся у вас данных вы можете легко решить, будете ли вы использовать контролируемое, неконтролируемое или обучение с подкреплением. В следующих заметках я приведу больше примеров о каждом типе алгоритмов машинного обучения.

Это изображение с сайта en.proft.me ниже может помочь вам.

Дальнейшее чтение

Let

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *