Машина опорных векторов — обзор для начинающих

День 6 — Quantum30 Challenge 2.0

Сегодняшняя тема — машины опорных векторов (SVM), концепция машинного обучения, широко используемая для таких задач, как классификация изображений и текста, а также распознавание лиц. SVM подпадает под категорию контролируемого обучения в машинном обучении. В рамках контролируемого обучения мы учим компьютер распознавать закономерности в данных, и он использует эти закономерности для прогнозирования новых, невидимых данных. В случае SVM мы обучаем компьютер на прошлых данных, и на основе этого обучения он учится делать прогнозы относительно будущих данных.

Работающий

Чтобы проиллюстрировать, как работает SVM, представьте, что вы хотите разделить людей на две команды: «Мистер. Индия», состоящая из людей в красной форме, и «Могамбо», состоящая из людей в черной форме. Вы обучили свой компьютер данным о людях из этих двух команд на основе их одежды. Теперь, когда появится новый человек, модель SVM проанализирует его одежду и поместит либо в «Команду Мистер Индия», либо в «Команду Могамбо».

Модель SVM действует аналогичным образом, но более математическим способом. Он находит лучшую линию, разделяющую два класса (в данном случае команды), гарантируя, что расстояние между этой линией и ближайшими точками данных обеих команд будет максимальным.

Вот три ключевых термина, с которыми можно столкнуться в SVM.

Векторы поддержки: это точки данных, которые наиболее близки к линии наилучшего соответствия. Они имеют решающее значение для определения положения линии.
Гиперплоскость. Это оптимальная линия, эффективно разделяющая два класса. Проще говоря, это граница принятия решений между «мистером». Индия» и «Могамбо».
Поля. Поля — это пространство или расстояние между опорными векторами (точками данных) и гиперплоскостью. SVM стремится максимизировать эту разницу, проводя при этом наилучшую линию.

Преимущества СВМ

А что, если ваши данные настолько перепутаны, что трудно провести четкую линию, разделяющую команды? Здесь в игру вступают функции ядра. Функции ядра — это инструменты, которые преобразуют ваши данные в многомерное пространство. Если ваши данные сложно классифицировать в одном измерении (например, рисование прямой линии), функции ядра могут преобразовать проблему в два или более измерения. Эта способность эффективно работать в многомерных пространствах является одной из сильных сторон моделирования SVM.

Краткое содержание

SVM — мощный инструмент для задач классификации в машинном обучении.
Он учится на прошлых данных, чтобы делать прогнозы относительно новых данных, и делает это, находя лучшую линию для разделения разных классов, максимизируя при этом пространство между ними.
Если данные сложные, SVM может использовать функции ядра, чтобы упростить задачу.

Ссылка

В статье содержится ссылка на вводное видео SVM от Simplilearn. Следующее видео также проведет вас через вычислительную часть.

Квантовые вычисленияИндия

Машина опорных векторов — обзор для начинающих

Работающий

Преимущества СВМ

Краткое содержание

Ссылка

Вопросы по теме