Ограниченный учебник по машине Больцмана | Концепции глубокого обучения

В эпоху машинного обучения и глубокого обучения Ограниченная машина Больцмана Алгоритм играет важную роль в уменьшении размерности, классификации, регрессии и многом другом, который используется для выбора и извлечения признаков. Этот Ограниченное руководство по машине Больцмана предоставит вам полное представление об RBM в следующей последовательности:

Давайте начнем наш учебник по ограниченной машине Больцмана с самого основного и фундаментального вопроса:

Что такое ограниченные машины Больцмана?

Картинка1-4-300x167.png

Ограниченная машина Больцмана — это неориентированная графическая модель, которая в последнее время играет важную роль в Deep Learning Framework. Первоначально он был представлен как Фисгармония Павлом Смоленским в 1986 году и приобрела большую популярность в последние годы в контексте Приз Нетфликс где Restricted Boltzmann Machines достигли самых современных результатов в совместной фильтрации и победили большинство конкурентов.

Это алгоритм, который полезен для уменьшения размерности, классификации, регрессии, совместной фильтрации, изучения признаков и моделирования тем.

Теперь давайте посмотрим, чем Ограниченная машина Больцмана отличается от других автоэнкодеров.

Разница между автоэнкодерами и RBM

Автоэнкодер представляет собой простую трехслойную нейронную сеть, в которой выходные единицы напрямую связаны с входными единицами. Обычно количество скрытых единиц намного меньше, чем количество видимых. Задача обучения — минимизировать ошибку или реконструкцию, т. е. найти наиболее эффективное компактное представление входных данных.

Картинка1-4-528x264.png

УКР разделяет аналогичную идею, но использует стохастические единицы с определенным распределением вместо детерминированного распределения. Задача обучения — выяснить, как эти два набора переменных на самом деле связаны друг с другом.

Одним из аспектов, который отличает RBM от других автоэнкодеров, является то, что он два предубеждения.

  • Скрытая предвзятость помогает RBM производить активацию на пас вперед пока
  • Предубеждения видимого слоя помогают RBM изучать реконструкции на обратный проход.

Теперь, когда мы знаем, что такое ограниченная машина Больцмана и в чем разница между RBM и автоэнкодерами, давайте продолжим наше учебное пособие по ограниченной машине Больцмана и посмотрим на их архитектуру и работу.

Слои в ограниченной машине Больцмана

Ограниченные машины Больцмана — это неглубокие двухслойные нейронные сети, которые составляют строительные блоки сети глубокого доверия. Первый уровень RBM называется видимый или входной слой, а второй — скрытый слой. Каждый круг представляет собой нейроноподобную единицу, называемую узлом. Узлы связаны друг с другом через слои, но никакие два узла одного и того же слоя не связаны.

1-9-380x300.png

ограничение в ограниченной машине Больцмана состоит в том, что существует нет внутриуровневой связи. Каждый узел — это место вычислений, которые обрабатывают входные данные и начинают с принятия стохастических решений о том, передавать ли эти входные данные или нет.

Работа ограниченной машины Больцмана

Каждый видимый узел берет функцию низкого уровня из элемента в наборе данных, который необходимо изучить. В узле 1 скрытого слоя х умножается по масса и добавлен в предвзятость. Результат этих двух операций подается в функция активации который производит выход узла или силу сигнала, проходящего через него, при заданном входе x.

шаг1-528x257.png

Далее давайте посмотрим, как несколько входов будут объединены в одном скрытом узле. Каждый х умножается по отдельному весу произведения суммируются, добавляются к смещению, и снова результат передается через функцию активации для получения выходных данных узла.

шаг2-528x249.png

В каждом скрытом узле каждый вход х умножается по соответствующему весу w. То есть один вход x будет иметь здесь три веса, что дает всего 12 весов (4 входных узла x 3 скрытых узла). Веса между двумя слоями всегда будут формировать матрицу, в которой строки равны входным узлам, а столбцы равны выходным узлам.

шаг3-528x260.png

Каждый скрытый узел получает четыре входа, умноженные на соответствующие веса. Сумма этих продуктов снова добавлено к уклону (что вызывает по крайней мере некоторые активации), и результат передается через алгоритм активации, производящий один выход для каждого скрытого узла.

Теперь, когда у вас есть представление о том, как работает ограниченная машина Больцмана, давайте продолжим наше учебное пособие по ограниченной машине Больцмана и рассмотрим шаги, связанные с обучением RBM.

Обучение ограниченной машине Больцмана

Тренировка на Ограниченной машине Больцмана отличается от тренировки на обычной машине. нейронные сети через стохастический градиентный спуск.

Два основных этапа обучения:

Первая часть обучения называется Выборка Гиббса. Учитывая входной вектор в мы используем р (ч | v) для предсказания скрытых значений час Зная скрытые значения, которые мы используем р (v | ч) :

02-528x73.jpg

для предсказания новых входных значений в. Этот процесс повторяется к раз. После к итераций, мы получаем еще один входной вектор в_к который был воссоздан из исходных входных значений v_0.

06-528x76.jpg

  • Контрастный шаг дивергенции

Обновление весовой матрицы происходит во время Контрастное расхождение шаг. Векторы v_0 а также в_к используются для расчета вероятности активации скрытых значений ч_0 а также ч_к :

02-528x73.jpg

Разница между внешними произведениями этих вероятностей с входными векторами v_0 а также в_к приводит к обновленной матрице:

05-528x76.jpg

Используя матрицу обновления, новые веса можно рассчитать с помощью градиента. восхождение, предоставлено:

01-300x72.jpg

Теперь, когда у вас есть представление о том, что такое ограниченные машины Больцмана и слои RBM, давайте перейдем к нашему учебному пособию по ограниченным машинам Больцмана и поймем их работу с помощью примера.

Ограниченное руководство по машине Больцмана: совместная фильтрация

а-528x241.png

RBM нашли применение в уменьшении размерности, классификации, совместной фильтрации и многом другом. Их можно обучать как под наблюдением, так и без присмотра, в зависимости от задачи.

Распознавание скрытых факторов в данных

Предположим, что некоторых людей попросили оценить набор фильмов по шкале от 1 до 5, и каждый фильм можно было бы объяснить с точки зрения набора скрытых факторов, таких как драма, фантастика, действие и многие другие. Ограниченные машины Больцмана используются для анализа и выявления этих основных факторов.

exmp-528x287.png

Анализ скрытых факторов выполняется двоичным способом, т. е. пользователь только говорит, понравился ли ему (оценка 1) конкретный фильм или нет (оценка 0), и это представляет входные данные для входного/видимого слоя. Получив входные данные, RMB затем пытается обнаружить скрытые факторы в данных, которые могут объяснить выбор фильма, и каждый скрытый нейрон представляет один из скрытых факторов.

Давайте рассмотрим следующий пример, когда пользователю нравится Властелин колец а также Гарри Поттер но не любит Матрица,Бойцовский клуб а также Титаник. Хоббита еще никто не видел, поэтому он получает оценку -1. Учитывая эти входные данные, машина Больцмана может определить три скрытых фактора. Драма,Фантазия а также Научная фантастика которые соответствуют жанрам фильмов.

Использование скрытых факторов для предсказания

После этапа обучения цель состоит в том, чтобы предсказать бинарный рейтинг для фильмов, которые еще не были просмотрены. Учитывая обучающие данные конкретного пользователя, сеть может идентифицировать скрытые факторы на основе предпочтений пользователя, а выборку из распределения Бернулли можно использовать, чтобы выяснить, какие из видимых нейронов теперь становятся активными.

exmp2-528x290.png

На изображении показаны новые рейтинги после использования скрытых значений нейронов для вывода. Сеть определила Фантазия как предпочтительный жанр кино и рейтинг Хоббит как фильм, который хотел бы пользователь.

Процесс от подготовка к прогноз фаза проходит следующим образом:

  • Обучить сеть на данных всех пользователей
  • Во время вывода возьмите обучающие данные конкретного пользователя
  • Используйте эти данные для получения активаций скрытых нейронов.
  • Используйте скрытые значения нейронов, чтобы получить активации входных нейронов
  • Новые значения входных нейронов показывают оценку, которую пользователь поставил бы еще не просмотренным фильмам.

На этом мы подошли к концу этого ограниченного учебного пособия по машине Больцмана. Надеюсь, вам понравилась эта статья, и вы поняли, как работают RBM и как они используются для распаковки изображений. Итак, если вы прочитали это, вы уже не новичок в Ограниченной Машине Больцмана. А если вы добавите больше своих знаний об искусственном интеллекте и машинном обучении, вы сможете читайте похожие статьи здесь

Есть к нам вопрос? Пожалуйста, укажите это в разделе комментариев «Ограниченное учебное пособие по машине Больцмана», и мы свяжемся с вами.

Похожие записи

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *