fbpx

Каталог статей

Каталог статей для размещения статей информационного характера

Как выучить

Как изучать математику для машинного обучения

Как изучать математику для машинного обучения

Так сколько же математики нужно знать, чтобы работать в сфере data science? Ответ: Не так много, как вы думаете.

Изображение geralt на Pixabay

Один из самых распространенных вопросов, который задают желающие заниматься наукой о данных: “Сколько математики мне нужно знать для машинного обучения? “Студенты, желающие попасть в сферу машинного обучения, часто считают математику огромным барьером для входа.

Привратники в отрасли не помогают в этом вопросе, называя студентов неквалифицированными, если у них нет степени магистра или доктора философии по данному предмету.

Так сколько же математики нужно знать, чтобы работать в индустрии науки о данных?

Ответ: Не так много, как вы думаете.

Большинство компаний решают очень похожие задачи с помощью данных. Им требуются специалисты по исследованию данных для построения моделей машинного обучения, которые могут предсказывать отток клиентов, проводить сегментацию и прогнозировать продажи.

Подход, используемый для решения этих проблем, схож, и задача становится достаточно повторяющейся. Не нужно изобретать велосипед, и они используют готовые алгоритмы ML.

Даже если возникнет ситуация, когда вам нужно построить индивидуальную модель машинного обучения, достаточно интуитивного понимания конкретных тем. Чтобы стать специалистом по изучению данных, вам не нужно углубляться и уж точно не нужно быть экспертом в математике.

Например, мы знаем, что градиентный спуск используется для нахождения линии наилучшего соответствия в линейной регрессии. Вам не нужно начинать учиться решать дифференциальные уравнения, достаточно понять принципы исчисления, чтобы получить представление о том, как это делается.

Аналогичным образом, если вы хотите построить нейронную сеть с помощью Tensorflow – вам нужно будет выполнить множество манипуляций с матрицами, но вы будете делать это с помощью компьютерной программы. Поэтому вам не нужно возвращаться и практиковаться в решении алгебраических уравнений. Вам просто нужно понять, как они работают.

В этой статье я укажу вам на ресурсы, которые помогут вам начать изучение математики для науки о данных. Я сосредоточусь на трех областях – линейной алгебре, исчислении и статистике.

Линейная алгебра

Линейная алгебра – от основ до границ: Этот курс на edX научит вас линейной алгебре на уровне бакалавра. Он начинается с медленного места, и вы сможете пройти этот курс, если у вас есть знания по математике на уровне средней школы.

Самое лучшее в этом курсе то, что он обучает вас линейной алгебре на практических примерах в Matlab, что заставляет вас взглянуть на предмет через призму алгоритмов и программирования. Такой подход к обучению особенно полезен, если вашей целью является изучение линейной алгебры для машинного обучения.

Этот курс можно прослушать бесплатно. Если вы хотите получить сертификат об окончании курса, вы можете подать заявку на получение финансовой помощи.

3Blue1Brown – Essence of Linear Algebra: Я не проходил этот курс раньше, но много раз натыкался на него во время своих поисков ресурсов для изучения математики.

Многие желающие изучать машинное обучение клянутся этим курсом, поскольку он дает учащимся концептуальное понимание линейной алгебры. Вместо того чтобы заучивать произвольные формулы или механически выводить их, вы получите интуитивное представление о том, как работает линейная алгебра. Это очень полезно, если ваша конечная цель – применить эти понятия к моделям машинного обучения.

Calculus

Есть два курса, которые я рекомендую для изучения исчисления для машинного обучения. The Essence of Calculus – отличный вводный курс по исчислению от 3Blue1Brown. Опять же, он даст вам интуитивное понимание концепций исчисления, а также объяснит значение формул, а не просто заставит вас их запомнить.

Далее, вы можете пройти курс “Нейронные сети” от 3Blue1Brown. Если вы знаете, как реализовать нейронные сети с помощью таких библиотек, как Keras, но не совсем понимаете, как работают эти модели, вам стоит пройти этот курс. В нем вы получите исчерпывающее объяснение алгоритма градиентного спуска, а также концепции исчисления, лежащие в его основе.

Calculus Made Easy 2nd ed, 1914, Chapter 1 (отредактировано автором статьи для удаления неинклюзивных формулировок).

Статистика

Это один из лучших вводных курсов по статистике, который я когда-либо проходил, и он предлагается Лондонским университетом. Этот курс предназначен для студентов, специализирующихся на предметах, не связанных с математикой, таких как бизнес и финансы.

Благодаря этому статистические концепции объясняются в простой и понятной манере, с большим количеством реальных примеров.

После прохождения этого курса вы будете иметь представление об описательной и инференциальной статистике, различных распределениях выборки, методах выборки, доверительных интервалах и способах расчета p-значений.

Все эти понятия имеют прямое применение в анализе реальных данных.

Это еще один отличный курс для изучения интуиции, лежащей в основе моделей машинного обучения.

Как и другие ресурсы в этом списке, этот курс меньше сосредоточен на математических формулах и объясняет модели машинного обучения концептуально.

Однако для прохождения этого курса рекомендуется иметь некоторые знания по исчислению, поскольку преподаватели склонны использовать обозначения, которые могут сбить вас с толку.

Вы изучите такие понятия, как линейная и логистическая регрессия, а также методы регуляризации, такие как гребневая и лассо-регрессия, и когда их следует использовать. Целая лекция посвящена методам, используемым для смягчения чрезмерной подгонки, и объясняется математическая интуиция, лежащая в их основе.

Это один из самых полезных курсов, которые я когда-либо посещал, поскольку он помог мне перестать относиться к моделям машинного обучения как к черным ящикам. Я получил представление о том, где следует использовать различные типы моделей, когда следует применять сокращение размерности и когда следует применять различные методы отбора признаков.

Я потратил много времени, пытаясь вернуться и выучить вычисления и линейную алгебру на уровне бакалавриата. Однако, несмотря на то, что я потратил много времени на изучение формул и решение дифференциальных уравнений, в моих знаниях был пробел, поскольку я так и не понял, как эти понятия связаны с алгоритмами машинного обучения.

Приведенные выше ресурсы – отличный способ преодолеть этот барьер, поскольку они дают вам концептуальное понимание математики, лежащей в основе машинного обучения, а не уводят вас в кроличью нору.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *