Целью системы коллективного обучения Fetch.ai является более широкое предоставление преимуществ искусственного интеллекта отдельным лицам, малому и среднему бизнесу. Это изменит тенденцию к тому, что горстка гигантских технологических компаний получит большую часть прибыли от бума машинного обучения. Благодаря совместной трансграничной работе эти методы коллективного обучения позволят отраслям достичь огромного повышения эффективности без необходимости полагаться на «большие технологии». В этой статье мы описываем ключевые идеи, лежащие в основе сети коллективного обучения Fetch.ai.

Блокчейны и коллективное обучение

Криптография - ключевая часть технологии блокчейн. Криптографические подписи могут использоваться, чтобы гарантировать, что только владельцу открытого ключа разрешено передавать монеты в открытых сетях, таких как Биткойн. Логика может быть расширена, чтобы обеспечить возможность голосования и реализации многих других типов приложений на программируемых блокчейнах, таких как Ethereum и сеть Fetch.ai. Эти процедуры голосования, как и в реальной жизни, позволяют различным участникам сети прийти к консенсусу в отношении того, какие действия им следует предпринять. Путем повторения раундов голосования участники могут согласовывать обновления, которые приводят к постепенному повышению точности общей модели машинного обучения. Важно отметить, что это может быть достигнуто без того, чтобы кто-либо из участников делился своими данными, которые остаются конфиденциальными.

Ключевые особенности, которые отличают систему коллективного обучения Fetch.ai от стандартных блокчейнов, заключаются в том, что пользователи, которых мы называем «учащимися», также имеют доступ к локальным данным обучения и возможность обучать модели машинного обучения. Это может включать любую из популярных фреймворков машинного обучения, реализующих согласованный алгоритм обучения и архитектуру модели.

Модель коллективного обучения, разделяемая всеми учащимися, начинается с модели генезиса, которая содержит случайные веса. Эта модель изначально плохо работает на всех индивидуальных тренировках учащихся. После этапа инициации протокол консенсуса выбирает одного из учащихся, чтобы произвести первое обновление модели. Этот учащийся выполняет несколько шагов алгоритма обучения, чтобы улучшить производительность модели на своем собственном локальном наборе данных. Затем учащийся передает сообщение, содержащее новую и улучшенную модель, другим учащимся в сети.

Получив обновленную модель, другой учащийся оценивает ее производительность на своем собственном локальном наборе данных по сравнению с его предшественником. Учащийся передает положительный голос за модели, которые улучшили производительность, отклоняя обновления, которые снизили производительность с их точки зрения. Затем этот процесс повторяется много раз с разными учениками, обучающими модель в каждую эпоху, до тех пор, пока не будет завершено фиксированное количество раундов или не будет достигнута конкретная цель. Злоумышленники, которые пытаются «отравить» модель или учащихся, данные которых несовместимы с большинством, не будут участвовать в процессе обучения.

Сохранение конфиденциальности и повышение производительности

Эта система коллективного обучения, опосредованная блокчейном, позволяет нескольким заинтересованным сторонам создавать общую модель машинного обучения без необходимости полагаться на центральный орган. Однако есть много потенциальных возможностей для будущих улучшений. В настоящее время мы работаем над некоторыми важными вопросами, такими как; «Как участников побуждают вести себя хорошо?», Или «Кто платит за хранение данных в сети?», Или «А как насчет валидаторов с данными, несовместимыми с другими?». Наряду с этими проблемами мы также улучшаем стабильность и эффективность коллективного обучения, которое мы будем описывать в будущих статьях и выпусках исходного кода.

В этом видео моя коллега Эмма Смит описывает, как протокол коллективного обучения может быть использован в сфере здравоохранения. В будущем мы объясним, как методы сохранения конфиденциальности из проекта Openmined, спонсируемого Deepmind, могут быть использованы для защиты конфиденциальности пациентов, данные которых используются в нашей системе коллективного обучения.