OpenLedger: создание инфраструктуры AI-экономики, основанной на данных и комбинируемых моделях

Подробный исследовательский отчет по OpenLedger: Построение управляемой данными и компонуемой агентской экономикой на основе OP Stack+EigenDA

Один. Введение | Переход модели Crypto AI

Данные, модели и вычислительная мощность являются тремя основными элементами инфраструктуры ИИ, аналогично топливу (данные), двигателю (модель) и энергии (вычислительная мощность), которые необходимы друг для друга. Как и в традиционном ИИ, путь эволюции инфраструктуры в области Crypto AI также прошел через аналогичные этапы. В начале 2024 года рынок был в значительной степени под контролем децентрализованных GPU проектов, которые в основном подчеркивали логику грубого роста "состязания в вычислительной мощности". Однако с наступлением 2025 года внимание отрасли постепенно смещается на уровень моделей и данных, что знаменует собой переход Crypto AI от конкуренции за базовые ресурсы к более устойчивой и ценностной среде на среднем уровне.

Универсальная большая модель (LLM) против специализированной модели (SLM)

Традиционные крупные языковые модели (LLM) сильно зависят от крупных наборов данных и сложной распределенной архитектуры, размер параметров составляет от 70B до 500B, а стоимость одной тренировки часто достигает нескольких миллионов долларов. В то время как SLM (Специализированная языковая модель) является легковесным подходом к тонкой настройке, основанным на повторно используемых базовых моделях, обычно основывающихся на открытых моделях, таких как LLaMA, Mistral, DeepSeek и т.д., в сочетании с небольшим количеством высококачественных профессиональных данных и технологиями LoRA, что позволяет быстро создавать экспертные модели со специфическими знаниями в определенной области, значительно снижая затраты на обучение и технические барьеры.

Стоит отметить, что SLM не будет интегрирован в веса LLM, а будет взаимодействовать с LLM через архитектуру Agent, динамическую маршрутизацию плагинов, горячую замену модулей LoRA, RAG (усиление генерации с помощью поиска) и другие способы. Эта архитектура сохраняет широкие возможности LLM и одновременно усиливает профессиональные показатели с помощью модулей тонкой настройки, создавая высоко гибкую комбинированную интеллектуальную систему.

Ценность и границы Crypto AI на уровне модели

Крипто-AI проекты по своей сути сложно напрямую улучшить основные возможности больших языковых моделей (LLM), и основная причина заключается в том, что

  • Технический порог слишком высок: объем данных, вычислительных ресурсов и инженерных возможностей, необходимых для обучения Foundation Model, чрезвычайно велик, в настоящее время только такие технологические гиганты, как США и Китай, обладают соответствующими возможностями.
  • Ограничения открытой экосистемы: хотя такие основные модели, как LLaMA и Mixtral, уже открыты, действительно прорывные достижения в моделях по-прежнему сосредоточены в научных учреждениях и закрытых инженерных системах, а участие проектов на блокчейне на уровне основных моделей ограничено.

Тем не менее, на основе открытых базовых моделей проект Crypto AI все еще может осуществлять расширение ценности через тонкую настройку специализированных языковых моделей (SLM) и сочетание проверяемости и механизмов стимулирования Web3. В качестве «периферийного интерфейсного слоя» цепочки поставок AI это проявляется в двух основных направлениях:

  • Достоверный уровень проверки: через запись на блокчейне пути генерации модели, данные о вкладе и использовании, повышается прослеживаемость и стойкость к подделке AI-выходов.
  • Механизм стимулов: с помощью родного токена, используемого для стимуляции загрузки данных, вызова моделей, выполнения агентов и других действий, создание положительного цикла обучения моделей и обслуживания.

Анализ классификации типов AI моделей и их применимости в блокчейне

Таким образом, можно увидеть, что жизнеспособные направления модели типа Crypto AI в основном сосредоточены на легкой настройке небольших SLM, интеграции и проверке данных в цепочке для архитектуры RAG, а также на локальном развертывании и стимулировании Edge моделей. В сочетании с проверяемостью блокчейна и токеномикой, Crypto может предоставить уникальную ценность для этих сцен с низкими и средними ресурсами, формируя дифференцированную ценность слоя интерфейса AI.

Блокчейн AI цепь на основе данных и моделей может четко и неизменно фиксировать источники вклада каждой отдельной данные и модели в цепочке, значительно повышая доверие к данным и отслеживаемость обучения моделей. В то же время, благодаря механизму смарт-контрактов, при вызове данных или моделей автоматически инициируется распределение вознаграждений, превращая действия AI в измеримую и торгуемую токенизированную ценность, создавая устойчивую систему стимулов. Кроме того, пользователи сообщества также могут оценивать производительность моделей через голосование токенами, участвовать в разработке и итерации правил, совершенствуя децентрализованную структуру управления.

! [Подробный исследовательский отчет OpenLedger: Построение управляемой данными, компонуемой агентной экономикой на основе модели на основе OP Stack+EigenDA](https://img-cdn.gateio.im/social/ моменты-62b3fa1e810f4772aaba3d91c74c1aa6)

Два, Обзор проекта | Видение AI цепи OpenLedger

OpenLedger — это один из немногих проектов блокчейн AI на рынке, который фокусируется на механизмах стимуляции данных и моделей. Он впервые предложил концепцию «Payable AI», нацеленную на создание справедливой, прозрачной и комбинируемой среды для работы AI, которая стимулирует участников, предоставляющих данные, разработчиков моделей и строителей AI-приложений, чтобы они могли сотрудничать на одной платформе и получать收益 на блокчейне в зависимости от их фактического вклада.

OpenLedger предоставляет полный цикл от «предоставления данных» до «развертывания моделей» и «вызова распределения прибыли», его ключевые модули включают:

  • Модельная фабрика: без программирования можно использовать LoRA для тонкой настройки, обучения и развертывания настраиваемых моделей на основе открытой LLM;
  • OpenLoRA: поддержка совместного существования тысяч моделей, динамическая загрузка по мере необходимости, значительно снижает затраты на развертывание;
  • PoA (Proof of Attribution): реализация измерения вклада и распределения вознаграждений через записи вызовов в блокчейне;
  • Datanets: структурированные сетевые данные, ориентированные на вертикальные сценарии, создаваемые и проверяемые сообществом;
  • Платформа предложений моделей (Model Proposal Platform): совместимый, вызываемый и платёжный рынок моделей на блокчейне.

С помощью вышеуказанных модулей OpenLedger построил инфраструктуру «умной экономики», основанную на данных и комбинируемых моделях, способствуя ончейн-реализации ценностной цепочки ИИ.

А в области применения технологии блокчейн OpenLedger использует OP Stack + EigenDA в качестве основы, создавая высокопроизводительную, низкозатратную и проверяемую среду для работы с данными и контрактами для моделей ИИ.

  • Построено на основе OP Stack: основано на технологии Optimism, поддерживающей высокую пропускную способность и низкие затраты на выполнение;
  • Расчет в основной сети Ethereum: Обеспечение безопасности транзакций и целостности активов;
  • EVM совместимость: удобно для разработчиков быстро развертывать и расширять на основе Solidity;
  • EigenDA предоставляет поддержку доступности данных: значительно снижает затраты на хранение и обеспечивает проверяемость данных.

В отличие от NEAR, который более ориентирован на уровень базовых технологий и акцентирует внимание на суверенитете данных и архитектуре «AI Agents on BOS», OpenLedger больше сосредоточен на создании специализированной цепочки AI, ориентированной на поощрение данных и моделей, стремясь обеспечить возможность отслеживания, комбинирования и устойчивого замыкания ценностей в разработке и вызове моделей на цепи. Это инфраструктура поощрения моделей в мире Web3, которая объединяет хостинг моделей в стиле HuggingFace, выставление счетов за использование в стиле Stripe и комбинируемые интерфейсы на цепи в стиле Infura, способствуя реализации концепции «модель как актив».

! [Подробный исследовательский отчет OpenLedger: Построение управляемой данными, компонуемой агентной экономикой на основе модели на основе OP Stack+EigenDA](https://img-cdn.gateio.im/social/ моменты-19c2276fccc616ccf9260fb7e35c9c24)

Три, основные компоненты и технологическая архитектура OpenLedger

3.1 Модельный завод, не требующий кодирования

ModelFactory является крупной платформой для дообучения языковых моделей (LLM) в экосистеме OpenLedger. В отличие от традиционных фреймворков дообучения, ModelFactory предлагает чисто графический интерфейс, не требуя командной строки или интеграции API. Пользователи могут дообучать модели на основе данных, которые были авторизованы и проверены на OpenLedger. Реализован интегрированный рабочий процесс, включающий авторизацию данных, обучение моделей и развертывание, основные этапы которого включают:

  • Контроль доступа к данным: пользователь отправляет запрос на данные, провайдер проверяет и утверждает, данные автоматически подключаются к интерфейсу обучения модели.
  • Выбор и настройка модели: поддержка основных LLM (таких как LLaMA, Mistral), настройка гиперпараметров через GUI.
  • Легкая настройка: встроенный движок LoRA / QLoRA, отображающий процесс обучения в реальном времени.
  • Оценка и развертывание модели: встроенные инструменты оценки, поддерживающие экспорт для развертывания или совместного использования в экосистеме.
  • Интерфейс проверки взаимодействия: предоставляет чат-интерфейс, удобный для прямого тестирования способностей модели к ответам на вопросы.
  • Генерация RAG для отслеживания источников: Ответы с указанием источников, повышающие доверие и возможность аудита.

Архитектура системы Model Factory включает шесть основных модулей, охватывающих аутентификацию личности, управление данными, микронастройку моделей, оценку и развертывание, а также RAG-отслеживание, создавая безопасную и управляемую, интерактивную в реальном времени и устойчивую платформу интегрированных модельных услуг.

! [Подробный исследовательский отчет OpenLedger: Построение управляемой данными, компонуемой агентной экономикой на основе модели на основе OP Stack+EigenDA](https://img-cdn.gateio.im/social/ моменты-f23f47f09226573b1fcacebdcfb8c1f3)

Сводная таблица возможностей больших языковых моделей, поддерживаемых ModelFactory, представлена ниже:

  • Серия LLaMA: экосистема самая широкая, сообщество активное, универсальная производительность высокая, является одной из самых популярных открытых базовых моделей в настоящее время.
  • Mistral: Архитектура эффективна, производительность вывода отличная, подходит для гибкого развертывания в условиях ограниченных ресурсов.
  • Qwen: Продукт от Alibaba, отлично справляется с китайскими задачами, имеет высокие комплексные способности, подходит для отечественных разработчиков в качестве первого выбора.
  • ChatGLM: выдающие результаты на китайском языке, подходит для специализированной службы поддержки и локализованных сценариев.
  • Deepseek: обладает превосходными показателями в генерации кода и математическом выводе, подходит для инструментов помощи в интеллектуальной разработке.
  • Gemma: Легкая модель, разработанная Google, с четкой структурой, легко освоить и экспериментировать.
  • Falcon: Ранее был эталоном производительности, подходит для фундаментальных исследований или сравнительных тестов, но активность сообщества снизилась.
  • BLOOM: поддержка множества языков довольно сильная, но производительность вывода слабая, подходит для исследований, охватывающих языки.
  • GPT-2: классическая ранняя модель, подходит только для учебных и верификационных целей, не рекомендуется для реального развертывания.

Хотя модельный набор OpenLedger не включает в себя последние высокопроизводительные модели MoE или мультимодальные модели, его стратегия не устарела, а основана на реальных ограничениях развертывания на цепочке (стоимость вывода, адаптация RAG, совместимость LoRA, среда EVM), что приводит к конфигурации с приоритетом практичности.

Model Factory как инструмент без кода, все модели встроены в механизм доказательства вклада, обеспечивающий права данных участников и разработчиков моделей, обладает низким порогом, возможностью монетизации и комбинирования, по сравнению с традиционными инструментами разработки моделей:

  • Для разработчиков: предоставление полного пути к инкубации, распространению и доходу моделей;
  • Для платформы: формирование модели обращения и комбинации активов в экосистеме;
  • Для пользователей: можно комбинировать модели или агенты так же, как при вызове API.

! [Подробный исследовательский отчет OpenLedger: Построение управляемой данными, компонуемой агентной экономикой на основе модели на основе OP Stack+EigenDA](https://img-cdn.gateio.im/social/ моменты-909dc3f796ad6aa44a1c97a51ade4193)

3.2 OpenLoRA, активы на блокчейне для дообучения моделей

LoRA (Low-Rank Adaptation) — это эффективный метод тонкой настройки параметров, который обучает новые задачи путем вставки «низкоранговых матриц» в предобученные большие модели, не изменяя параметры оригинальной модели, что значительно снижает затраты на обучение и требования к хранению. Традиционные большие языковые модели (такие как LLaMA, GPT-3) обычно имеют десятки миллиардов, а то и сотни миллиардов параметров. Чтобы использовать их для конкретных задач (таких как юридические вопросы, медицинские консультации), требуется тонкая настройка (fine-tuning). Основная стратегия LoRA состоит в следующем: «заморозить параметры оригинальной большой модели, обучая только вставленные новые матричные параметры». Этот метод эффективен по параметрам, обеспечивает быстрое обучение и гибкое развертывание, что делает его наиболее подходящим среди современных методов тонкой настройки для развертывания моделей Web3 и комбинированного вызова.

OpenLoRA — это легковесный фреймворк для вывода, разработанный OpenLedger, специально предназначенный для развертывания нескольких моделей и совместного использования ресурсов. Его основной целью является решение распространенных проблем, связанных с развертыванием AI моделей, таких как высокие затраты, низкая повторная использование и расточительство ресурсов GPU, а также содействие внедрению «оплачиваемого AI» (Payable AI).

Основные компоненты архитектуры системы OpenLoRA, основанные на модульном дизайне, охватывают ключевые этапы, такие как хранение моделей, выполнение вывода, маршрутизация запросов и обеспечивают эффективные и малозатратные возможности развертывания и вызова нескольких моделей:

  • Модуль хранения LoRA адаптеров (LoRA Adapters Storage): откалиброванный LoRA адаптер размещается на OpenLedger, обеспечивая загрузку по мере необходимости, избегая предварительной загрузки всех моделей в видеопамять, что экономит ресурсы.
  • Модельное хранилище и динамический слой融合 (Model
OP-1.49%
Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • 6
  • Поделиться
комментарий
0/400
DaoGovernanceOfficervip
· 12м назад
*вздыхает* еще одна модельная композиционная работа, лишенная четких KPI и токеномики... эмпирически говоря, это не будет масштабироваться
Посмотреть ОригиналОтветить0
PanicSellervip
· 21ч назад
Не могу понять, мошенничество.
Посмотреть ОригиналОтветить0
tokenomics_truthervip
· 21ч назад
Отраслевые бездельники
Посмотреть ОригиналОтветить0
GasFeeThundervip
· 21ч назад
Плата за газ настолько высокая, о какой тут модельной инновации можно говорить
Посмотреть ОригиналОтветить0
SchroedingerAirdropvip
· 21ч назад
Эй, не надо так сильно напрягаться, хорошо?
Посмотреть ОригиналОтветить0
SadMoneyMeowvip
· 21ч назад
Модельные данные все еще просто炒个概念
Посмотреть ОригиналОтветить0
  • Закрепить