fbpx

Каталог статей

Каталог статей для размещения статей информационного характера

Как выучить

Как выучить математику для науки о данных, путь самостоятельной работы

Как выучить математику для науки о данных, путь самостоятельной работы

Нужно ли вам иметь докторскую степень по математике, чтобы стать специалистом по анализу данных? Абсолютно нет! Это руководство покажет вам, как выучить математику для науки о данных и машинного обучения, не посещая медленных и дорогих курсов.

Количество математики, которую вы будете использовать ежедневно в качестве специалиста по анализу данных, сильно зависит от вашей роли. Продолжайте читать, чтобы узнать, какие понятия вам нужно освоить, чтобы добиться успеха в достижении своих целей.

Для изучения этого руководства вам понадобятся хотя бы базовые навыки программирования на языке Python*. Мы будем изучать математику прикладным, практическим способом.

Ознакомьтесь с нашим руководством “Как выучить Python для Data Science, путь самостоятельного стартапера” – это самый быстрый способ освоить Python. Мы рекомендуем пройти хотя бы до Шага 2 в этом руководстве.

*Примечание: другие языки тоже подойдут, но примеры будут на Python.

Математика, необходимая для науки о данных

Объем математических знаний, которые вам понадобятся, зависит от вашей роли. Во-первых, каждый специалист по работе с данными должен знать статистику и теорию вероятности. Для этого у нас есть руководство:

А как насчет других видов математики? Ну, здесь ответ более тонкий… это зависит от того, сколько оригинальных исследований в области машинного обучения вы будете проводить.

Должности, связанные с машинным обучением

На практике, особенно на начальных должностях, вы часто будете использовать готовые реализации ML. Во многих языках программирования существуют надежные библиотеки общих библиотек. Вам не нужно изобретать колесо.

Тем не менее, интервьюеры все равно могут проверить ваши базовые знания линейной алгебры и многомерного исчисления. Почему они это делают?

В какой-то момент вашей команде может потребоваться создание собственных реализаций алгоритмов ML. Например, вам может понадобиться адаптировать один из них к вашему технологическому стеку или расширить его базовую функциональность. Для этого вы должны уметь разбираться в алгоритмах ML и работать с их внутренностями.

Должности, связанные с исследованиями и разработками в области машинного обучения

На других должностях требуется гораздо больше оригинальных исследований и разработок в области ML. Вам может понадобиться перевести алгоритмы из научных статей в рабочий код. Или же вы можете исследовать усовершенствования, основанные на уникальных задачах вашего бизнеса.

Другими словами, вам гораздо чаще придется внедрять алгоритмы с нуля.

Для этих должностей необходимо владение линейной алгеброй и многомерным исчислением.

Лучший способ изучения математики для Data Science

Самостоятельный способ изучения математики для науки о данных – учиться, “делая дерьмо”. Поэтому мы будем изучать линейную алгебру и исчисление, используя их в реальных алгоритмах!

Несмотря на это, вы захотите выучить или просмотреть основную теорию. Вам не нужно читать целый учебник, но вы захотите сначала выучить ключевые понятия.

Вот 3 шага к изучению математики, необходимой для науки о данных и машинного обучения:

  1. Линейная алгебра для науки о данных – матричная алгебра и собственные значения.
  2. Калькуляция для Data Science – производные и градиенты.
  3. Градиентный спуск с нуля – Реализация простой нейронной сети с нуля.

Шаг 1: Линейная алгебра для науки о данных

Многие концепции машинного обучения связаны с линейной алгеброй. Например, для PCA требуются собственные значения, а для регрессии – умножение матриц.

Кроме того, большинство приложений ML работают с данными высокой размерности (данные с большим количеством переменных). Такой тип данных лучше всего представлять с помощью матриц.

Вот несколько лучших бесплатных ресурсов, которые мы нашли для изучения линейной алгебры для науки о данных.

Для ролей, требующих большого количества приложений:

    имеет короткие, практические уроки линейной алгебры. Они охватывают наиболее важные темы.

Для ролей, связанных с исследованиями и разработками:

    предлагает строгий курс линейной алгебры. Видеолекции и материалы курса включены в комплект.

А если вам нужен только обзор:

    – Это дополнительные обзорные видео по линейной алгебре для курса Эндрю Нг по машинному обучению. Всю серию из 6 частей (с 3.1 по 3.6) можно просмотреть менее чем за 1 час. Рекомендуется, если вы уже проходили линейную алгебру и вам нужен быстрый обзор. – Отличный справочный ресурс по матричной алгебре.

Шаг 2: Калькуляция для науки о данных

Исчисления важны для нескольких ключевых приложений ML. Например, вам нужно уметь вычислять производные и градиенты для оптимизации. Фактически, одним из наиболее распространенных методов оптимизации является градиентный спуск.

Вот некоторые из лучших ресурсов для изучения исчисления для науки о данных.

Для ролей, требующих большого количества приложений:

    имеет короткие, практические уроки по многомерному исчислению. Они охватывают наиболее важные понятия.

Для ролей, связанных с исследованиями и разработками:

    предлагает строгий курс по многомерному исчислению. Видеолекции и материалы курса включены в комплект.

А если вам нужен только обзор:

    – Это быстрый обзор многомерного исчисления в формате решения практических задач. Рекомендуется, если вы уже изучали многомерное исчисление и вам просто нужен быстрый обзор.

Шаг 3: Простая нейронная сеть с нуля

Поздравляем! Вы разобрались с теорией. Теперь настало время для действительно интересной части.

Один из лучших способов изучить математику для науки о данных и машинного обучения – построить простую нейронную сеть с нуля.

Вы будете использовать линейную алгебру для представления сети и вычисления для ее оптимизации. В частности, вы создадите градиентный спуск с нуля.

[images style=”0″ image=”https%3A%2F%2Fdatonauts.com%2Fwp-content%2Fuploads%2F2016%2F10%2Fgradient-ascent.jpg” width=”640″ align=”center” top_margin=”0″ alt_text=”Learn Math for Data Science” full_width=”Y”].

Пока что не стоит слишком сильно беспокоиться о тонкостях нейронных сетей. Ничего страшного, если вы будете просто следовать инструкциям и писать код. Мы подробно рассмотрим машинное обучение в другом руководстве, так как это руководство предназначено для целенаправленной математической практики.

Следуйте учебникам и изучайте теорию по ходу дела. Кроме того, у вас будет классный проект, который вы сможете добавить в свое портфолио.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *