OpenLedger: بناء بنية تحتية اقتصادية قائمة على الذكاء الاصطناعي مدفوعة بالبيانات وقابلة للتكوين.

تقرير بحثي متعمق ل OpenLedger: بناء اقتصاد وكيل قائم على البيانات وقابل للتركيب استنادا إلى OP Stack + EigenDA

١. المقدمة | الانتقال في طبقة نموذج Crypto AI

البيانات والنماذج وقوة الحوسبة هي العناصر الثلاثة الأساسية لبنية الذكاء الاصطناعي، وتشبه الوقود (البيانات) والمحرك (النموذج) والطاقة (قوة الحوسبة) التي لا يمكن الاستغناء عنها. مثلما حدث في مسار تطور بنية الذكاء الاصطناعي التقليدي، شهدت مجال الذكاء الاصطناعي في العملات الرقمية مراحل مماثلة. في أوائل عام 2024، سيطرت مشاريع وحدات معالجة الرسوميات اللامركزية على السوق، مع التركيز على منطق النمو الواسع القائم على "تجميع قوة الحوسبة". ومع دخول عام 2025، بدأت الصناعة في تحويل اهتمامها تدريجياً نحو طبقات النماذج والبيانات، مما يرمز إلى انتقال الذكاء الاصطناعي في العملات الرقمية من تنافس الموارد الأساسية إلى بناء طبقة متوسطة أكثر استدامة وقيمة تطبيقية.

نماذج كبيرة عامة (LLM) مقابل نماذج متخصصة (SLM)

تتطلب نماذج اللغة الكبيرة التقليدية (LLM) تدريبًا يعتمد بشكل كبير على مجموعات بيانات ضخمة وهياكل موزعة معقدة، حيث تصل أحجام المعلمات إلى 70B~500B، وغالبًا ما تصل تكلفة التدريب لمرة واحدة إلى عدة ملايين من الدولارات. بينما تُعتبر SLM (نموذج اللغة المتخصص) كإحدى نماذج الأساس القابلة لإعادة الاستخدام، فهي تعتمد عادةً على نماذج مفتوحة المصدر مثل LLaMA وMistral وDeepSeek، وتجميعها مع كمية قليلة من البيانات المهنية عالية الجودة وتقنيات مثل LoRA، مما يتيح بناء نماذج خبراء تمتلك معرفة في مجالات محددة بسرعة، مما يقلل بشكل ملحوظ من تكاليف التدريب والحواجز التقنية.

من الجدير بالذكر أن SLM لن يتم دمجه في أوزان LLM، بل سيتم تشغيله بالتعاون مع LLM من خلال استدعاء هيكل الوكيل، ونظام المكونات الإضافية للتوجيه الديناميكي، وإمكانية توصيل وحدة LoRA، و RAG (التوليد المعزز بالاسترجاع) وغيرها. تحافظ هذه البنية على قدرة LLM الواسعة، بينما تعزز الأداء المتخصص من خلال وحدات التعديل الدقيق، مما يشكل نظام ذكاء مركب مرن للغاية.

قيمة و حدود الذكاء الاصطناعي في طبقة النموذج

مشاريع الذكاء الاصطناعي للعملات المشفرة في جوهرها صعبة في تحسين القدرات الأساسية لنموذج اللغة الكبير (LLM) بشكل مباشر، والسبب الرئيسي في ذلك هو

  • عائق تقني مرتفع: حجم البيانات والموارد الحاسوبية والقدرات الهندسية المطلوبة لتدريب نموذج Foundation ضخمة للغاية، حيث لا تمتلك القدرة اللازمة لذلك سوى شركات التكنولوجيا الكبرى مثل الولايات المتحدة والصين.
  • قيود النظام البيئي المفتوح: على الرغم من أن النماذج الأساسية السائدة مثل LLaMA و Mixtral قد تم فتح مصدرها، إلا أن المفتاح الحقيقي لدفع النموذج لتحقيق اختراق لا يزال مركزيًا في المؤسسات البحثية وأنظمة الهندسة المغلقة، مما يحد من مساحة المشاركة للمشاريع على السلسلة في طبقة النموذج الأساسية.

ومع ذلك، يمكن لمشاريع Crypto AI أن تحقق قيمة ممتدة من خلال تعديل نماذج اللغة المتخصصة (SLM) على نماذج الأساس المفتوحة، بالاستفادة من قابلية التحقق وآليات التحفيز في Web3. كـ "طبقة واجهة محيطة" لسلسلة صناعة الذكاء الاصطناعي، تتجلى في اتجاهين رئيسيين:

  • طبقة التحقق الموثوق: من خلال تسجيل مسار توليد النموذج ومساهمات البيانات واستخدامها على السلسلة، تعزز القابلية للتتبع ومقاومة التلاعب في مخرجات الذكاء الاصطناعي.
  • آلية التحفيز: بالاستفادة من الرمز الأصلي، لتحفيز سلوكيات تحميل البيانات، واستدعاء النماذج، وتنفيذ الوكلاء، لبناء دورة إيجابية لتدريب النماذج والخدمات.

تحليل ملاءمة نوع نموذج الذكاء الاصطناعي وتصنيفه مع البلوكشين

من هنا، يتضح أن النقاط القابلة للتطبيق لمشاريع Crypto AI من نوع نموذجية تتركز بشكل رئيسي على تحسين خفة الوزن لنماذج SLM الصغيرة، وتكامل البيانات والتحقق على السلسلة في بنية RAG، وكذلك نشر وتشجيع النماذج المحلية. بالجمع بين القابلية للتحقق من خلال البلوكشين وآلية الرموز، يمكن لـ Crypto أن تقدم قيمة فريدة لهذه السيناريوهات ذات الموارد المتوسطة والمنخفضة، مما يشكل قيمة مميزة لطبقة واجهة AI.

سلسلة blockchain AI المعتمدة على البيانات والنماذج، يمكن أن تسجل بوضوح وغير قابلة للتغيير مصدر مساهمة كل بيانات ونموذج على السلسلة، مما يعزز بشكل ملحوظ من مصداقية البيانات وقابلية تتبع تدريب النماذج. في الوقت نفسه، من خلال آلية العقود الذكية، يتم تفعيل توزيع المكافآت تلقائيًا عند استدعاء البيانات أو النماذج، مما يحول سلوك الذكاء الاصطناعي إلى قيمة رمزية قابلة للقياس والتداول، لبناء نظام تحفيز مستدام. بالإضافة إلى ذلك، يمكن لمستخدمي المجتمع أيضًا تقييم أداء النماذج من خلال التصويت بالرموز، والمشاركة في وضع القواعد والتكرار، لتحسين هيكل الحوكمة اللامركزية.

! [تقرير بحثي متعمق ل OpenLedger: بناء اقتصاد وكيل قائم على البيانات وقابل للتركيب على أساس OP Stack+EigenDA](https://img-cdn.gateio.im/social/ Moments-62B3FAe810F4772AABA3D91C74C1AA6)

ثانياً، نظرة عامة على المشروع | رؤية OpenLedger للذكاء الاصطناعي

OpenLedger هو أحد المشاريع القليلة في سوق blockchain AI التي تركز على آليات تحفيز البيانات والنماذج. لقد طرح مفهوم «Payable AI» لأول مرة، ويهدف إلى بناء بيئة تشغيل AI عادلة وشفافة وقابلة للتجميع، لتحفيز مساهمي البيانات ومطوري النماذج وبناة تطبيقات AI للتعاون على نفس المنصة، والحصول على عوائد على السلسلة بناءً على المساهمات الفعلية.

OpenLedger يوفر حلقة مغلقة كاملة من "توفير البيانات" إلى "نشر النموذج" ثم إلى "استدعاء توزيع الأرباح"، تشمل وحداته الأساسية:

  • مصنع النموذج: دون الحاجة إلى برمجة، يمكن استخدام LoRA لضبط وتدريب ونشر نماذج مخصصة بناءً على LLM مفتوح المصدر؛
  • OpenLoRA: يدعم التعايش مع آلاف النماذج، التحميل الديناميكي حسب الحاجة، مما يقلل بشكل كبير من تكاليف النشر؛
  • PoA (إثبات النسبة): تحقيق قياس المساهمة وتوزيع المكافآت من خلال سجلات الاستدعاء على السلسلة;
  • Datanets: شبكة بيانات هيكلية موجهة نحو سيناريوهات عمودية، تم بناؤها والتحقق منها من خلال التعاون المجتمعي؛
  • منصة اقتراح النماذج (Model Proposal Platform): سوق نماذج على السلسلة يمكن تجميعها واستدعاؤها ودفع ثمنها.

من خلال الوحدات المذكورة أعلاه، قامت OpenLedger ببناء "بنية تحتية للاقتصاد الذكي" قائمة على البيانات وقابلة للتجميع، مما يعزز نقل سلسلة قيمة الذكاء الاصطناعي إلى السلسلة.

وفي اعتماد تقنية blockchain، تستخدم OpenLedger قاعدة OP Stack + EigenDA لبناء بيئة تشغيل بيانات وعقود عالية الأداء ومنخفضة التكلفة وقابلة للتحقق لنماذج AI.

  • مبني على OP Stack: مبني على تقنية Optimism، يدعم تنفيذ عالي من حيث الإخراج ومنخفض من حيث التكاليف؛
  • التسوية على الشبكة الرئيسية للإيثيريوم: تأكد من أمان المعاملات وسلامة الأصول؛
  • متوافق مع EVM: يسهل على المطورين نشر وتوسيع بسرعة بناءً على Solidity؛
  • EigenDA يوفر دعم توفر البيانات: يقلل بشكل كبير من تكاليف التخزين ويضمن قابلية التحقق من البيانات.

بالمقارنة مع سلاسل AI العامة مثل NEAR التي تركز أكثر على الطبقة الأساسية وتروج لسيادة البيانات وهياكل "وكلاء الذكاء الاصطناعي على BOS"، تركز OpenLedger بشكل أكبر على بناء سلاسل AI المتخصصة التي تركز على تحفيز البيانات والنماذج، حيث تسعى إلى تحقيق تطوير النماذج واستدعائها على السلسلة بطريقة قابلة للتتبع والتجميع والاستدامة. إنها بنية تحتية لتحفيز النماذج في عالم Web3، تجمع بين استضافة النماذج بطريقة HuggingFace، والفوترة على الاستخدام بطريقة Stripe، وواجهات قابلة للتجميع على السلسلة بطريقة Infura، مما يدفع نحو تحقيق "النموذج كأصل".

! [تقرير بحثي متعمق ل OpenLedger: بناء اقتصاد وكيل قائم على البيانات وقابل للتركيب على أساس OP Stack+EigenDA](https://img-cdn.gateio.im/social/ Moments-19C2276FCCC616CCF9260FB7E35C9C24)

ثلاثة، المكونات الأساسية لـ OpenLedger وهيكلها التكنولوجي

3.1 مصنع النماذج، بدون الحاجة إلى كود نموذج المصنع

ModelFactory هو منصة لتعديل نموذج اللغة الكبيرة (LLM) تحت نظام OpenLedger البيئي. على عكس إطارات التعديل التقليدية، يوفر ModelFactory واجهة رسومية بالكامل، دون الحاجة إلى أدوات سطر الأوامر أو تكامل API. يمكن للمستخدمين تعديل النموذج بناءً على مجموعة البيانات التي تم الموافقة عليها والمراجعة على OpenLedger. تم تحقيق سير العمل المتكامل لمصادقة البيانات، وتدريب النموذج ونشره، وتشتمل العملية الأساسية على:

  • التحكم في الوصول إلى البيانات: يقوم المستخدم بتقديم طلبات البيانات، يراجعها المزود ويوافق عليها، وتتم إدخال البيانات تلقائيًا في واجهة تدريب النموذج.
  • اختيار النموذج وإعداده: يدعم LLM الشائع (مثل LLaMA، Mistral)، من خلال واجهة المستخدم الرسومية لتكوين المعلمات الفائقة.
  • التعديل الخفيف: محرك LoRA / QLoRA المدمج، يعرض تقدم التدريب في الوقت الحقيقي.
  • تقييم النموذج ونشره: أدوات تقييم مدمجة، تدعم تصدير النشر أو مشاركة استدعاء النظام البيئي.
  • واجهة تحقق تفاعلية: توفر واجهة محادثة، مما يسهل اختبار قدرة النموذج على الإجابة.
  • توليد تتبع RAG: استجابة مع مراجع مصدرية، لتعزيز الثقة والقابلية للتدقيق.

يتكون هيكل نظام Model Factory من ستة وحدات، تشمل المصادقة على الهوية، وأذونات البيانات، وتعديل النموذج، ونشر التقييم وRAG، مما يخلق منصة خدمات نموذج متكاملة آمنة وقابلة للتحكم، وتفاعلية في الوقت الحقيقي، وقابلة للتحقيق المستدام.

! [تقرير بحثي متعمق ل OpenLedger: بناء اقتصاد وكيل قائم على البيانات وقابل للتركيب على أساس OP Stack+EigenDA](https://img-cdn.gateio.im/social/ Moments-F23F47F09226573B1FCACEBDCFB8c1f3)

جدول ملخص القدرات الحالية لنموذج ModelFactory المدعوم من اللغات الكبيرة كما يلي:

  • سلسلة LLaMA: الأكثر شمولاً في النظام البيئي، المجتمع نشط، والأداء العام قوي، وهي واحدة من النماذج الأساسية مفتوحة المصدر الأكثر شيوعًا حاليًا.
  • Mistral: هيكل فعال، أداء استدلال ممتاز، مناسب للنشر المرن والسيناريوهات ذات الموارد المحدودة.
  • Qwen: منتج من علي بابا، أداء ممتاز في المهام الصينية، قدرة شاملة قوية، مناسب كخيار أول للمطورين المحليين.
  • ChatGLM: تأثير المحادثة باللغة الصينية بارز، مناسب لخدمة العملاء العمودية والسيناريوهات المحلية.
  • Deepseek: يتفوق في توليد الشيفرة واستنتاج الرياضيات، مناسب لأدوات المساعدة في التطوير الذكي.
  • Gemma: نموذج خفيف الوزن تم إطلاقه من قبل Google، هيكل واضح، سهل الاستخدام السريع والتجريب.
  • فالكون: كانت تُعتبر معيار الأداء، مناسبة للأبحاث الأساسية أو اختبارات المقارنة، ولكن نشاط المجتمع قد انخفض.
  • BLOOM: دعم متعدد اللغات قوي، ولكن أداء الاستدلال ضعيف، مناسب للأبحاث التي تغطي اللغات.
  • GPT-2: نموذج كلاسيكي مبكر، مناسب فقط للأغراض التعليمية والتحقق، لا يُنصح باستخدامه في النشر الفعلي.

على الرغم من أن مجموعة نماذج OpenLedger لا تشمل أحدث نماذج MoE عالية الأداء أو النماذج متعددة الوسائط، إلا أن استراتيجيتها ليست عتيقة، بل هي تكوين "الأولوية العملية" الذي تم اتخاذه بناءً على القيود الواقعية للنشر على السلسلة (تكاليف الاستدلال، توافق RAG، توافق LoRA، بيئة EVM).

Model Factory كأداة بدون كود، جميع النماذج تحتوي على آلية إثبات المساهمة المدمجة، لضمان حقوق المساهمين في البيانات ومطوري النماذج، وتتميز بعوائق منخفضة، وقابلية للتسييل، وقابلية للتجميع، مقارنة بأدوات تطوير النماذج التقليدية:

  • للمطورين: توفير مسار كامل لنموذج الحضانة والتوزيع والإيرادات؛
  • بالنسبة للمنصة: تشكيل تدفق أصول النموذج وبيئة التركيب؛
  • بالنسبة للمستخدمين: يمكن دمج استخدام النماذج أو الوكيل كما لو كنت تستدعي API.

! [تقرير بحثي متعمق ل OpenLedger: بناء اقتصاد وكيل قائم على البيانات وقابل للتركيب على أساس OP Stack+EigenDA](https://img-cdn.gateio.im/social/ moments-909dc3f796ad6aa44a1c97a51ade4193)

3.2 OpenLoRA ، الأصول على السلسلة للنموذج المعدل

LoRA (التكيف منخفض الرتبة) هي طريقة فعالة لتعديل المعلمات، من خلال إدخال "مصفوفة منخفضة الرتبة" في نموذج كبير مدرب مسبقًا لتعلم مهام جديدة دون تعديل معلمات النموذج الأصلي، مما يقلل بشكل كبير من تكلفة التدريب واحتياجات التخزين. تحتوي النماذج اللغوية الكبيرة التقليدية (مثل LLaMA وGPT-3) عادةً على عدة مليارات أو حتى تريليونات من المعلمات. لاستخدامها في مهام محددة (مثل الأسئلة القانونية، الاستشارات الطبية)، يلزم إجراء تعديل (fine-tuning). تتمثل الاستراتيجية الأساسية لـ LoRA في: "تجميد معلمات النموذج الكبير الأصلي، وتدريب فقط مصفوفة المعلمات الجديدة المدخلة." إنها فعالة من حيث المعلمات، وسريعة في التدريب، ومرنة في النشر، وهي الطريقة الرئيسية الأنسب لنشر نماذج Web3 واستدعاء التركيب.

OpenLoRA هو إطار استدلال خفيف الوزن تم بناؤه بواسطة OpenLedger، مصمم خصيصًا لنشر النماذج المتعددة ومشاركة الموارد. الهدف الأساسي منه هو معالجة المشكلات الشائعة في نشر نماذج الذكاء الاصطناعي الحالية مثل التكاليف العالية، وانخفاض إعادة الاستخدام، وإهدار موارد GPU، ودفع تنفيذ "الذكاء الاصطناعي القابل للدفع".

المكونات الأساسية لهندسة نظام OpenLoRA، مبنية على تصميم معياري، تغطي تخزين النماذج، تنفيذ الاستدلال، توجيه الطلبات وغيرها من الجوانب الرئيسية، لتحقيق قدرة نشر واستدعاء متعددة النماذج بشكل فعال وبتكلفة منخفضة:

  • وحدة تخزين محولات LoRA ( تخزين محولات LoRA ): يتم استضافة محول LoRA المدرب مسبقًا على OpenLedger، مما يتيح التحميل عند الطلب، وتجنب تحميل جميع النماذج مسبقًا في ذاكرة الوصول العشوائي، مما يوفر الموارد.
  • استضافة النموذج وطبقة الدمج الديناميكي (Model
OP8.64%
شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • 8
  • إعادة النشر
  • مشاركة
تعليق
0/400
MissedAirdropBrovip
· 07-24 23:59
مرة أخرى ai، إلى متى ستستمر في الارتفاع؟
شاهد النسخة الأصليةرد0
blocksnarkvip
· 07-24 15:44
متى يمكنني الحصول على نموذج AI الكبير مجانًا؟
شاهد النسخة الأصليةرد0
DaoGovernanceOfficervip
· 07-23 12:04
*sigh* ورقة نموذجية أخرى تفتقر إلى مؤشرات الأداء الرئيسية الواضحة واقتصاد العملة... من الناحية التجريبية، لن تتوسع هذه.
شاهد النسخة الأصليةرد0
PanicSellervip
· 07-22 15:15
لا أفهم ، نشمر المال واهرب
شاهد النسخة الأصليةرد0
tokenomics_truthervip
· 07-22 14:56
أطفال الصناعة الكسالى
شاهد النسخة الأصليةرد0
GasFeeThundervip
· 07-22 14:53
الغاز费 مرتفعة جداً، ماذا عن ابتكار النماذج؟
شاهد النسخة الأصليةرد0
SchroedingerAirdropvip
· 07-22 14:49
آه، لا تتدحرج بهذه الشدة، حسنًا؟
شاهد النسخة الأصليةرد0
SadMoneyMeowvip
· 07-22 14:47
بيانات النموذج ليست سوى مفهوم مضخم
شاهد النسخة الأصليةرد0
  • تثبيت