fbpx

Каталог статей

Каталог статей для размещения статей информационного характера

Как выучить

Машинное обучение

Машинное обучение

Машинное обучение – это область компьютерных наук, цель которой – научить компьютеры учиться и действовать без явного программирования. Более конкретно, машинное обучение – это подход к анализу данных, который предполагает построение и адаптацию моделей, позволяющих программам “обучаться” с помощью опыта. Машинное обучение предполагает построение алгоритмов, которые адаптируют свои модели для улучшения их способности делать прогнозы.

По словам Тома Митчелла, профессора кафедры компьютерных наук и машинного обучения в Карнеги-Меллон, считается, что компьютерная программа учится на опыте E в отношении некоторой задачи T и некоторой меры производительности P, если ее производительность на T, измеряемая P, улучшается с опытом E . Математический способ сказать, что программа использует машинное обучение, если она улучшает решение задач с опытом.

Первые случаи использования и обсуждения машинного обучения относятся к 1950-м годам, и его применение резко возросло за последние 10 лет. К числу распространенных областей применения машинного обучения относятся распознавание образов, обработка естественного языка, разработка искусственного интеллекта, технология самоуправляемых автомобилей и алгоритм поиска в Интернете компании Google.

Машинное обучение против искусственного интеллекта

Стоит подчеркнуть разницу между машинным обучением и искусственным интеллектом. Машинное обучение – это область изучения компьютерных наук и подход к разработке алгоритмов. Этот подход к разработке алгоритмов позволяет создавать и проектировать искусственно интеллектуальные программы и машины.

Приложения и примеры машинного обучения

Машинное обучение – это область изучения и подход к решению проблем. Существует множество различных приложений, в которых могут применяться методы машинного обучения. Ниже перечислены некоторые из многочисленных областей применения стратегий и методов машинного обучения:

Обработка естественного языка

Обработка естественного языка (NLP) – это область компьютерных наук, которая в первую очередь занимается взаимодействием между компьютерами и естественными (человеческими) языками. Основными направлениями обработки естественного языка являются распознавание речи, понимание естественного языка и генерация естественного языка. Методы машинного обучения могут применяться в каждой из этих областей.

Анализ страховых претензий

В страховой отрасли машинное обучение применяется несколькими способами. Наиболее интересным является то, что некоторые компании используют алгоритмы машинного обучения для прогнозирования будущих страховых случаев, которые используются для определения цены страховых премий. Кроме того, некоторые компании в страховой и банковской отраслях используют машинное обучение для выявления мошенничества.

Биоинформатика и медицинская диагностика

Объем биологических данных, собираемых учеными-исследователями, растет с экспоненциальной скоростью. Это привело к возникновению проблем с эффективным хранением и управлением данными, а также с возможностью извлечения полезной информации.

Также предпринимаются усилия по применению методов машинного обучения и распознавания образов к медицинским записям для классификации и лучшего понимания различных заболеваний. Ожидается, что эти подходы также помогут диагностировать заболевания путем выявления сегментов населения, наиболее подверженных риску развития определенных заболеваний.

Обработка изображений и распознавание образов

Использование компьютеров для выявления закономерностей и идентификации объектов в изображениях, видео и других медиафайлах гораздо менее практично без применения методов машинного обучения. Написание программ для идентификации объектов на изображении было бы не очень практичным, если бы для каждого объекта, который вы хотите идентифицировать, нужно было писать специальный код.

Вместо этого алгоритмы распознавания изображений, также называемые классификаторами изображений, могут быть обучены классифицировать изображения на основе их содержания. Эти алгоритмы обучаются путем обработки множества образцов изображений, которые уже были классифицированы. Используя сходства и различия уже обработанных изображений, эти программы совершенствуются, обновляя свои модели каждый раз, когда они обрабатывают новое изображение. Эта форма машинного обучения, используемая в обработке изображений, обычно осуществляется с помощью искусственной нейронной сети и известна как глубокое обучение.

Поисковые машины

Веб-поиск также выигрывает от применения глубокого обучения, используя его для улучшения результатов поиска и лучшего понимания запросов пользователей. Анализируя поведение пользователя в зависимости от запроса и выдаваемых результатов, такие компании, как Google, могут улучшить результаты поиска и понять, какой набор результатов является наилучшим для данного запроса. Поисковые предложения и исправления орфографии также создаются с помощью тактики машинного обучения на основе совокупности запросов всех пользователей.

Анализ финансовых рынков

Алгоритмическая торговля и анализ рынка стали основными направлениями использования машинного обучения и искусственного интеллекта на финансовых рынках. Управляющие фондами теперь полагаются на алгоритмы глубокого обучения для определения изменений в тенденциях и даже совершения сделок. Фонды и трейдеры, использующие этот автоматизированный подход, совершают сделки быстрее, чем они могли бы, если бы использовали ручной подход к определению тенденций и совершению сделок.

Дополнительные применения машинного обучения

Машинное обучение, поскольку это всего лишь научный подход к решению проблем, имеет практически безграничные возможности применения. Помимо вышеперечисленных областей применения, методы машинного обучения можно использовать в генетике для классификации последовательностей ДНК, в банковской сфере для выявления мошенничества, в онлайн-рекламе для совершенствования таргетинга объявлений и во многих других отраслях для повышения эффективности и возможностей обработки данных.

Как работает машинное обучение?

Очевидно, что сегодня существует множество способов применения машинного обучения. Но как оно используется? Что на самом деле делают эти программы для более эффективного решения проблем? Чем эти подходы отличаются от исторических методов решения проблем?

Как было сказано выше, машинное обучение – это область компьютерной науки, цель которой – наделить компьютеры способностью обучаться без

Все алгоритмы машинного обучения нацелены на обучение и повышение своей точности по мере обработки большего количества данных. Один из способов классификации задач, которые решают алгоритмы машинного обучения, заключается в том, сколько обратной связи они предоставляют системе. В некоторых сценариях компьютеру предоставляется значительное количество маркированных обучающих данных, что называется контролируемым обучением. В других случаях меченые данные не предоставляются, и это известно как обучение без наблюдения. И наконец, при полуконтролируемом обучении предоставляется некоторое количество маркированных учебных данных, но большая часть учебных данных не маркирована. Давайте рассмотрим каждый тип более подробно:

Контролируемое обучение

Контролируемое обучение – это наиболее практичная и широко распространенная форма машинного обучения. Оно предполагает создание математической функции, которая связывает входные переменные с желаемыми выходными переменными. Предоставляется большое количество маркированных обучающих наборов данных, которые являются примерами данных, которые будет обрабатывать компьютер.

Задачи контролируемого обучения можно далее разделить на задачи “классификации” и “регрессии”. В задачах классификации используются статистические методы классификации для получения категоризации, например, “хот-дог” или “не хот-дог”. Проблемы регрессии, с другой стороны, используют статистический регрессионный анализ для получения числовых результатов.

Полусамостоятельное обучение

Полуконтролируемое обучение – это фактически то же самое, что и контролируемое обучение, за исключением того, что из предоставленных обучающих данных маркируется лишь ограниченное количество.

Распознавание изображений является хорошим примером полунаблюдаемого обучения. В этом примере мы можем предоставить системе несколько помеченных изображений, содержащих объекты, которые мы хотим идентифицировать, а затем в процессе обучения обработать еще много не помеченных изображений.

Бесподчиненное обучение

В задачах обучения без наблюдения все входные данные не имеют меток, и алгоритм должен самостоятельно создать структуру из входных данных. Задачи кластеризации (или кластерного анализа) – это задачи обучения без надзора, которые направлены на обнаружение группировок в исходных наборах данных. Примером могут служить закономерности в данных о запасах или потребительских тенденциях. Нейронные сети также часто используются для решения задач обучения без наблюдения.

Алгоритмы машинного обучения и подходы к решению проблем

Алгоритм – это подход к решению проблемы, а машинное обучение предлагает множество различных подходов к решению самых разных проблем. Ниже приведен список некоторых наиболее распространенных и полезных алгоритмов и подходов, используемых сегодня в приложениях машинного обучения. Имейте в виду, что для решения конкретной задачи приложения часто используют многие из этих подходов вместе:

Искусственные нейронные сети

Искусственная нейронная сеть – это вычислительная модель, основанная на биологических нейронных сетях, таких как человеческий мозг. Она использует ряд функций для обработки входного сигнала или файла и преобразования его на нескольких этапах в ожидаемый выходной сигнал. Этот метод часто используется в распознавании изображений, переводе языка и других распространенных сегодня приложениях.

Глубокое обучение

Глубокое обучение

Кластерный анализ пытается сгруппировать объекты в “кластеры” предметов, которые более похожи друг на друга, чем предметы в других кластерах. Способ, которым объекты похожи друг на друга, зависит от данных, которые предоставляются компьютерной программе. Поскольку кластерный анализ чаще всего используется в задачах обучения без наблюдения, обучение не предусмотрено.

Программа будет использовать любые предоставленные данные для описания каждого входного объекта и сравнивать значения с данными об объектах, которые она уже проанализировала. После того как будет проанализировано достаточное количество объектов, чтобы обнаружить группировки в точках данных и объектах, программа может начать группировать объекты и определять кластеры.

Кластеризация на самом деле не является одним конкретным алгоритмом; на самом деле существует множество различных путей для выполнения кластерного анализа. Это общая задача в статистическом анализе и добыче данных.

Байесовские сети

Байесовская сеть – это графическая модель переменных и их зависимостей друг от друга. Алгоритмы машинного обучения могут использовать байесовскую сеть для построения и описания своей системы убеждений. Одним из примеров использования байесовских сетей являются программы, предназначенные для вычисления вероятности тех или иных заболеваний. Симптомы могут быть приняты в качестве входных данных, а вероятность заболеваний – выходными данными.

Обучение с применением подкрепления

Обучение с подкреплением относится к области машинного обучения, в которой обратная связь с системой осуществляется в виде поощрений и наказаний, а не в виде прямых указаний “правильно” или “неправильно”. Это актуально, когда важно найти правильный ответ, но также важно найти его своевременно.

Поэтому важным элементом обучения с подкреплением является нахождение баланса между “исследованием” и “эксплуатацией”. Как часто программа должна “исследовать” новую информацию по сравнению с использованием уже имеющейся? Вознаграждая обучающий агент за желаемое поведение, программа может оптимизировать свой подход, чтобы достичь наилучшего баланса между исследованием и эксплуатацией.

Обучение с помощью дерева решений

Обучение с помощью дерева решений – это подход к машинному обучению, который обрабатывает входные данные с помощью серии классификаций, которые приводят к выходу или ответу. Обычно такие деревья решений, или деревья классификации, выдают дискретный ответ; однако при использовании деревьев регрессии выход может принимать непрерывные значения (обычно вещественные числа).

Машинное обучение на основе правил

Машинное обучение на основе правил относится к классу методов машинного обучения, которые генерируют “правила” для анализа моделей, применяют эти правила при анализе моделей и адаптируют правила для улучшения производительности (обучения). Этот метод используется в искусственных иммунных системах и для создания алгоритмов обучения по ассоциативным правилам, о которых речь пойдет далее.

Обучение по ассоциативным правилам

Обучение ассоциативным правилам – это метод машинного обучения, направленный на выявление взаимосвязей между переменными в базе данных. Одним из примеров применения обучения по ассоциативным правилам является случай, когда маркетологи используют большие наборы данных о транзакциях в супермаркетах для определения корреляций между покупками различных продуктов. Например, “клиенты, покупающие соленые огурцы и салат, также, скорее всего, купят нарезанный сыр”. Подобные корреляции или “правила ассоциации” могут быть обнаружены с помощью обучения правилам ассоциации.

Индуктивное логическое программирование

Чтобы понять индуктивное логическое программирование, важно сначала понять “логическое программирование”. Логическое программирование – это парадигма в компьютерном программировании, в которой программы пишутся как набор выражений, в которых излагаются факты или правила, часто в форме “если

это, то это”. Понимая, что “логическое программирование” вращается вокруг использования набора логических правил, мы можем начать понимать индуктивное логическое программирование.

Индуктивное логическое программирование – это область исследований, в которой используются как машинное обучение, так и логическое программирование. В задачах ILP фоновые знания, которые использует программа, запоминаются как набор логических правил, которые программа использует для выведения гипотезы решения задач.

Приложения индуктивного логического программирования сегодня можно найти в обработке естественного языка и биоинформатике.

Машины опорных векторов

Машины опорных векторов – это инструмент контролируемого обучения, обычно используемый в задачах классификации и регрессии. Компьютерную программу, использующую машины опорных векторов, можно попросить классифицировать входные данные по одному из двух классов. Программа получает обучающие примеры каждого класса, которые могут быть представлены в виде математических моделей, построенных в многомерном пространстве (количество измерений равно количеству признаков входного сигнала, которые программа будет оценивать).

Программа строит графики представления каждого класса в многомерном пространстве и определяет “гиперплоскость” или границу, которая разделяет каждый класс. Когда анализируется новый входной сигнал, его выходной сигнал попадает на одну из сторон этой гиперплоскости. Сторона гиперплоскости, на которой находится выход, определяет, к какому классу относится вход. Эта гиперплоскость и есть машина опорных векторов.

Репрезентативное обучение

Обучение представлениям, также называемое обучением признакам, – это набор методов в рамках машинного обучения, позволяющий системе автоматически создавать представления объектов, которые наилучшим образом позволят ей распознавать и обнаруживать признаки, а затем различать различные объекты. Таким образом, признаки также используются для проведения анализа после их идентификации системой.

Обучение признакам очень распространено в задачах классификации изображений и других медиа. Поскольку изображения, видео и другие виды сигналов не всегда имеют математически удобные модели, обычно выгодно позволить компьютерной программе создать собственное представление, с помощью которого можно выполнить следующий уровень анализа.

Обучение по сходству

Обучение по сходству – это метод обучения представлений и область контролируемого обучения, которая очень тесно связана с классификацией и регрессией. Однако цель алгоритма обучения сходству – определить, насколько похожи или различны два или более объекта, а не просто классифицировать объект. Сегодня это имеет множество различных применений, включая распознавание лиц на телефонах, системы ранжирования/рекомендаций и проверку голоса.

Обучение по разреженному словарю

Обучение по разреженным словарям – это просто пересечение обучения по словарям и обучения по разреженным представлениям.

Хотя машинное обучение оказалось очень полезным для изучения генома человека и смежных областей науки, фраза “генетические алгоритмы” относится к классу алгоритмов машинного обучения и подходу, который они используют для решения проблем, а не к приложениям машинного обучения, связанным с генетикой. Генетические алгоритмы на самом деле черпают вдохновение в биологическом процессе естественного отбора. Эти алгоритмы используют математические эквиваленты мутации, отбора и кроссинговера для создания множества вариантов возможных решений.

История машинного обучения

Сегодня машинное обучение предоставляет людям огромное количество преимуществ, и число применений машинного обучения растет быстрее, чем когда-либо. Тем не менее, машинное обучение прошло долгий путь, прежде чем стало популярным.

Ранняя история и основа исследований

Термин “машинное обучение” был впервые введен пионером искусственного интеллекта и компьютерных игр Артуром Самуэлем в 1959 году. Однако на самом деле Сэмюэл написал первую программу машинного обучения, работая в компании IBM в 1952 году. Программа представляла собой игру в шашки, в которой компьютер совершенствовался каждый раз, когда играл, анализируя, какие ходы составляют выигрышную стратегию.

В 1957 году Фрэнк Розенблатт создал первую искусственную компьютерную нейронную сеть, также известную как перцептрон, которая была разработана для имитации мыслительных процессов человеческого мозга.

В 1967 году был разработан алгоритм “ближайшего соседа”, который положил начало базовому распознаванию образов с помощью компьютеров.

Эти ранние открытия были значительными, но отсутствие полезных приложений и ограниченные вычислительные мощности той эпохи привели к длительному периоду застоя в машинном обучении и ИИ вплоть до 1980-х годов.

Машинное обучение расширяется в сторону от ИИ

До 80-х и начала 90-х годов машинное обучение и искусственный интеллект были почти одним целым. Но примерно в начале 90-х годов исследователи начали находить новые, более практические применения для методов решения проблем, которые они создали, работая над созданием ИИ.

Поиск более практических применений машинного обучения открыл двери для новых подходов, основанных больше на статистике и вероятности, чем на человеческом и биологическом поведении. Машинное обучение превратилось в самостоятельную область исследований, в которую начали вносить свой вклад многие университеты, компании и независимые исследователи.

Современное машинное обучение

Сегодня машинное обучение используется в большом количестве приложений и ежедневно затрагивает миллионы (если не миллиарды) людей. Огромное количество исследований в области машинного обучения привело к разработке множества новых подходов, а также к появлению множества новых случаев использования машинного обучения. В действительности методы машинного обучения можно использовать везде, где требуется анализ большого количества данных, что является распространенной потребностью в бизнесе.

Три основные причины привели к массовому внедрению машинного обучения в бизнес и исследовательские приложения: (1) вычислительная мощность значительно возросла и стала намного дешевле за последние два года.

Google использует машинное обучение для лучшего понимания поисковых запросов своих пользователей.

Google также использует машинное обучение для улучшения результатов поиска, измеряя вовлеченность пользователей в выдаваемые результаты.

Медицинские исследовательские организации используют машинное обучение для анализа огромных массивов данных о состоянии здоровья человека в попытках выявить закономерности в заболеваниях и состояниях и улучшить медицинское обслуживание.

Такие приложения для обмена поездками, как Lyft, используют машинное обучение для оптимизации маршрутов и цен в зависимости от времени суток и местоположения.

Программы электронной почты используют методы машинного обучения, чтобы определить, что должно находиться в папке “Спам”.

  • Банки используют машинное обучение для выявления подозрительных или мошеннических транзакций и поведения.
  • Это лишь несколько из тысяч примеров того, где сегодня используются методы машинного обучения. Машинное обучение – это захватывающая и быстро развивающаяся область исследований, а области его применения кажутся бесконечными. По мере того как все больше людей и компаний узнают об использовании этой технологии, а инструменты становятся все более доступными и простыми в применении, ожидайте, что машинное обучение станет еще большей частью повседневной жизни.
  • Если вы являетесь разработчиком или просто хотите узнать больше о машинном обучении, ознакомьтесь с некоторыми ресурсами по машинному обучению и искусственному интеллекту, доступными на DeepAI.
  • Самый полный в мире глоссарий по науке о данных и искусственному интеллекту
  • Исследования, в которых упоминается машинное обучение
  • Глубокое обучение на основе графов для медицинской диагностики и анализа: Прошлое, настоящее и будущее

05/27/2021 ∙ by David Ahmedt-Aristizabal ∙ 632

Разложение матриц и его применение

01/01/2022 ∙ by Jun Lu ∙ 386

Вычислительные пределы глубокого обучения

07/10/2020 ∙ Нил К. Томпсон ∙ 378

Байесовские нейронные сети на практике – учебник для пользователей глубокого обучения

07/14/2020 ∙ Лоран Валентин Жоспен ∙ 356

Механизм внимания в нейронных сетях: Куда оно приходит и куда уходит

04/27/2022 ∙ автор Дерья Сойданер ∙ 325

Прощание с компромиссом между погрешностью и дисперсией? Обзор теории перепараметризованного машинного обучения

09/06/2021 ∙ Иегуда Дар ∙ 308

DoubleML – объектно-ориентированная реализация двойного машинного обучения на Python

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *