fbpx

Каталог статей

Каталог статей для размещения статей информационного характера

Как выучить

Как начать изучать машинное обучение?

Как начать изучать машинное обучение?

И это было началом машинного обучения! В наше время Machine Learning является одной из самых популярных (если не самой популярной!) профессий. По данным опроса, инженер машинного обучения – лучшая работа десятилетия, и ожидается, что она будет расти год от года на 22% (в период 2020-2030 гг.), а средняя базовая зарплата составляет $122 000 в год в США и INR 8,5LPA в Индии.

Что такое машинное обучение?

Машинное обучение подразумевает использование искусственного интеллекта для того, чтобы машины могли научиться выполнять определенную задачу на основе опыта, не программируя их специально для выполнения этой задачи. (Короче говоря, машины учатся автоматически, без участия человека). Этот процесс начинается с предоставления им качественных данных, а затем обучения машин путем построения различных моделей машинного обучения с использованием данных и различных алгоритмов. Выбор алгоритмов зависит от того, какие данные у нас есть и какую задачу мы пытаемся автоматизировать.

Почему мы используем машинное обучение?

Поскольку мы движемся вперед в цифровом мире, огромное количество данных генерируется каждую минуту наряду с доступностью высокоскоростного интернета. Это является основным фактором для разработки автоматизированных систем, которые могут обрабатывать данные в таких объемах, точно используя различные алгоритмы для сложных наборов данных. Сегодня компании всех масштабов используют этот метод для управления затратами, снижения рисков, а также для повышения качества продукции и услуг. Сегодня эта технология получила широкое распространение во многих отраслях, и скоро она станет важной частью нашей жизни. (что уже началось)

Как начать изучать ML?

Это примерная дорожная карта, которой вы можете следовать на пути к тому, чтобы стать безумно талантливым инженером в области машинного обучения. Конечно, вы всегда можете изменить шаги в соответствии с вашими потребностями, чтобы достичь желаемой конечной цели!

Шаг 1 – Понять предварительные условия

Если вы гений, вы можете сразу приступить к ML, но обычно есть некоторые предварительные условия, которые вам необходимо знать, включая линейную алгебру, многомерное исчисление, статистику и Python. А если вы не знаете этих языков, не бойтесь! Вам не нужна степень доктора философии по этим темам, чтобы начать работу, но базовое понимание вам необходимо.

(а) Изучите линейную алгебру и многомерное исчисление

И линейная алгебра, и многомерное исчисление важны для машинного обучения. Однако то, насколько они вам необходимы, зависит от вашей роли как специалиста по изучению данных. Если вы занимаетесь машинным обучением, ориентированным на прикладные задачи, то математика вам не понадобится, так как существует множество общих библиотек. Но если вы хотите сосредоточиться на исследованиях и разработках в области машинного обучения, то владение линейной алгеброй и многомерным исчислением будет полезно.

Данные играют огромную роль в машинном обучении. Фактически, около 80% вашего времени в качестве эксперта по ML будет потрачено на сбор и очистку данных. А статистика – это область, которая занимается сбором, анализом и представлением данных. Поэтому нет ничего удивительного в том, что вам необходимо ее изучать. Некоторые из ключевых понятий в статистике, которые важны, – это статистическая значимость, распределения вероятностей, проверка гипотез, регрессия и т.д. Также очень важной частью ML является байесовское мышление, в котором рассматриваются различные понятия, такие как условная вероятность, приор и апостериор, максимальное правдоподобие и т.д.

(c) Изучите Python

Некоторые люди предпочитают пропускать линейную алгебру, многомерное исчисление и статистику и изучать их по ходу дела методом проб и ошибок. Но есть одна вещь, которую категорически нельзя пропускать – это Python! Хотя есть и другие языки, которые можно использовать для машинного обучения, такие как R, Scala и т.д., Python в настоящее время является самым популярным языком. Python в настоящее время является самым популярным языком для ML. На самом деле, существует множество библиотек Python, которые специально полезны для искусственного интеллекта и машинного обучения, такие как Keras, TensorFlow, Scikit-learn и др. Поэтому, если вы хотите изучать ML, лучше всего выучить Python! Вы можете сделать это, используя различные онлайн-ресурсы и курсы, такие как Fork Python, доступные бесплатно на GeeksforGeeks.

Шаг 2 – Изучение различных концепций ML

Теперь, когда вы закончили с предварительными условиями, вы можете перейти к изучению ML (где начинается самое интересное). Лучше всего начать с основ, а затем перейти к более сложным вещам. Некоторые из основных понятий в ML следующие:

(a) Терминология машинного обучения

Модель – Модель – это конкретное представление, полученное из данных путем применения некоторого алгоритма машинного обучения. Модель также называют гипотезой.

  • Признак – признак – это отдельное измеряемое свойство данных. Набор числовых признаков можно удобно описать вектором признаков. Векторы признаков подаются на вход модели. Например, для прогнозирования фруктов могут использоваться такие признаки, как цвет, запах, вкус и т.д.
  • Цель (метка) – целевая переменная или метка – это значение, которое должно быть предсказано нашей моделью. Для примера с фруктами, рассмотренного в разделе характеристик, меткой для каждого набора входных данных будет название фрукта, например, яблоко, апельсин, банан и т.д.
  • Обучение – Идея заключается в том, чтобы дать набор входных данных (признаков) и ожидаемых выходных данных (меток), таким образом, после обучения у нас будет модель (гипотеза), которая будет сопоставлять новые данные с одной из категорий, на которых проводилось обучение.
  • Прогнозирование – Когда наша модель готова, ей можно подать набор входных данных, на которые она выдаст прогнозируемый выход (метку).
  • (b) Типы машинного обучения

Контролируемое обучение – предполагает обучение на основе обучающего набора данных с метками с использованием моделей классификации и регрессии. Этот процесс обучения продолжается до тех пор, пока не будет достигнут требуемый уровень производительности.

  • Неконтролируемое обучение – предполагает использование немаркированных данных, а затем поиск базовой структуры в данных для того, чтобы узнать все больше и больше о том.
  • Обучение с подкреплением – предполагает обучение оптимальным действиям методом проб и ошибок. Таким образом, решение о следующем действии принимается путем обучения поведению, основанному на текущем состоянии и максимизирующем вознаграждение в будущем.
  • (c) Как применять машинное обучение на практике?
  • Самой трудоемкой частью ML является сбор, интеграция, очистка и предварительная обработка данных. Поэтому обязательно потренируйтесь в этом, потому что вам нужны высококачественные данные, а большие объемы данных часто бывают грязными. Поэтому именно здесь пройдет большая часть вашего времени.

Изучайте различные модели и практикуйтесь на реальных наборах данных. Это поможет вам сформировать интуицию относительно того, какие типы моделей подходят в различных ситуациях.

  • Наряду с этими шагами не менее важно понять, как интерпретировать результаты, полученные с помощью различных моделей. Это легче сделать, если вы понимаете различные параметры настройки и методы регуляризации, применяемые к различным моделям.
  • (d) Ресурсы для изучения машинного обучения:
  • Существуют различные онлайн и офлайн ресурсы (как бесплатные, так и платные!), которые можно использовать для изучения Machine Learning. Некоторые из них представлены здесь:

Для широкого введения в машинное обучение довольно популярен курс “Машинное обучение” Эндрю Нг в Стэнфорде. Он посвящен машинному обучению, поиску данных и статистическому распознаванию образов, а поясняющие видеоролики очень помогают прояснить теорию и основные понятия, лежащие в основе машинного обучения.

Если вы хотите получить руководство по самостоятельному изучению машинного обучения, то вам идеально подойдет курс Geeksforgeeks Machine Learning Basic and Advanced – Self Paced. На этом курсе вы узнаете о различных концепциях машинного обучения, а также получите практический опыт их применения в учебной среде.

  • Шаг 3 – Участвуйте в соревнованиях
  • После того как вы поняли основы машинного обучения, можно переходить к самой сумасшедшей части. Соревнования! Они, по сути, сделают вас еще более опытным в ML, объединив ваши в основном теоретические знания с практической реализацией. Здесь приведены некоторые из основных конкурсов, с которых вы можете начать на Kaggle и которые помогут вам укрепить уверенность в себе:

Титаник: Машинное обучение после катастрофы: The

Титаник: Машинное обучение после катастрофы

  • challenge – очень популярный проект для начинающих в области ML, поскольку по нему доступно множество обучающих материалов. Это отличное введение в такие концепции ML, как исследование данных, разработка признаков и настройка модели. Распознаватель цифр: The Распознаватель цифр
  • это проект, который можно выполнять после того, как у вас есть некоторые знания Python и основ ML. Это отличное введение в захватывающий мир нейронных сетей с использованием классического набора данных, включающего предварительно извлеченные признаки.После того, как вы завершите эти соревнования и другие подобные простые задачи… Поздравляем. Вы на пути к тому, чтобы стать полноценным инженером в области машинного обучения, и можете продолжать совершенствовать свои навыки, работая над все новыми и новыми задачами и создавая все более креативные и сложные проекты в области машинного обучения.Изучайте машинное обучение

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *