تاريخ النشر: 12 ديسمبر 2024، تاريخ آخر تعديل: 20 مايو 2025
باستخدام واجهات برمجة تطبيقات الذكاء الاصطناعي المضمّنة، يمكن لتطبيق الويب تنفيذ مهام مستندة إلى الذكاء الاصطناعي بدون الحاجة إلى نشر نماذج الذكاء الاصطناعي الخاصة به أو إدارتها. نحن نعمل على توحيد هذه واجهات برمجة التطبيقات على جميع المتصفّحات.
المتطلبات
لاستخدام الذكاء الاصطناعي المدمج، يجب استيفاء متطلبات النموذج والأجهزة.
النماذج
تنزّل واجهات برمجة التطبيقات Prompt API وSummarizer API وWriter API وRewriter API نموذجًا لغويًا كبيرًا مصمّمًا للعمل على أجهزة الكمبيوتر المكتبية والمحمولة. لا تعمل واجهات برمجة التطبيقات هذه على الأجهزة الجوّالة. قبل استخدام واجهات برمجة التطبيقات هذه، يجب الإقرار بسياسة الاستخدام المحظور للذكاء الاصطناعي التوليدي المتّبعة في Google.
تتيح واجهات Summarizer API وWriter API وRewriter API استخدام النص فقط. تتوفّر واجهة برمجة التطبيقات Prompt API التي تتضمّن إمكانات متعدّدة الوسائط للمشاركين في "برنامج المعاينة المبكرة" من أجل إنشاء نماذج أولية محلية.
أجهزة
تتوفّر المتطلبات التالية للمطوّرين والمستخدمين الذين يشغّلون الميزات باستخدام واجهات برمجة التطبيقات هذه في Chrome. قد تتطلّب المتصفّحات الأخرى متطلبات تشغيل مختلفة.
تعمل واجهتا برمجة التطبيقات Language Detector وTranslator في متصفّح Chrome على أجهزة الكمبيوتر المكتبي. ولا تعمل واجهات برمجة التطبيقات هذه على الأجهزة الجوّالة. تعمل واجهات برمجة التطبيقات Prompt API وSummarizer API وWriter API وRewriter API في Chrome عند استيفاء الشروط التالية:
- نظام التشغيل: Windows 10 أو 11 أو macOS 13 (Ventura والإصدارات الأحدث) أو Linux أو ChromeOS (الإصدار 16389.0.0 والإصدارات الأحدث) على أجهزة [Chromebook Plus](https://www.google.com/chromebook/chromebookplus/) لا تتوافق واجهات برمجة التطبيقات التي تستخدم Gemini Nano بعد مع Chrome على أجهزة Android وiOS وChromeOS غير Chromebook Plus.
- مساحة التخزين: يجب توفّر مساحة خالية لا تقل عن 22 غيغابايت على وحدة التخزين التي تحتوي على ملفك الشخصي على Chrome.
- وحدة معالجة الرسومات (GPU): يجب أن تكون ذاكرة الوصول العشوائي للفيديو (VRAM) أكبر من 4 غيغابايت.
- الشبكة: بيانات غير محدودة أو اتصال غير محدود.
قد يختلف حجم Gemini Nano الدقيق مع تحديث المتصفّح للنموذج. لتحديد الحجم الحالي، انتقِل إلى chrome://on-device-internals
ثم إلى حالة النموذج. افتح مسار الملف المُدرَج لتحديد حجم النموذج.
بدء التطوير
تتوفّر العديد من واجهات برمجة التطبيقات المضمّنة المستندة إلى الذكاء الاصطناعي في مراحل مختلفة من التطوير. بعضها متاح في إصدار Chrome الثابت، وبعضها الآخر متاح للمشاركين في التجارب الأصلية، وبعضها الآخر متاح فقط للمشاركين في "برنامج المعاينة المبكرة".
تتضمّن كل واجهة برمجة تطبيقات مجموعة التعليمات الخاصة بها لبدء الاستخدام وتنزيل النموذج، سواء كان ذلك في النماذج الأولية المحلية أو في بيئات الإنتاج مع التجارب الأصلية.
- Translator API
- Language Detector API
- Summarizer API
- Prompt API
- تتضمّن Prompt API في إضافات Chrome تعليمات محدّدة لمساعدة مطوّري الإضافات في استخدام Prompt API.
- Writer API وRewriter API
يمكن استخدام جميع واجهات برمجة التطبيقات هذه عند إنشاء إضافات Chrome.
تنزيل النموذج
تكون واجهات برمجة التطبيقات مضمَّنة في Chrome، وكذلك النماذج. في المرة الأولى التي يتفاعل فيها المستخدم مع واجهات برمجة التطبيقات هذه، يجب تنزيل النموذج إلى المتصفّح.
لتحديد ما إذا كانت واجهة برمجة التطبيقات قابلة للاستخدام وجاهزة، استدعِ الدالة غير المتزامنة availability()
، التي تعرض وعدًا يتضمّن إحدى القيم التالية:
-
"unavailable"
: لا يتوافق جهاز المستخدم أو خيارات الجلسة المطلوبة مع هذه الميزة. قد لا يتوفّر للجهاز طاقة أو مساحة تخزين كافية. "downloadable"
: يجب تنزيل ملفات إضافية لإنشاء جلسة، وقد يشمل ذلك نموذجًا متخصصًا أو نموذجًا للغة أو عملية ضبط دقيق. قد يكون من الضروري تفعيل المستخدم لطلب الإجراءcreate()
."downloading"
: عمليات التنزيل قيد التقدّم ويجب إكمالها قبل أن تتمكّن من استخدام جلسة."available"
: يمكنك إنشاء جلسة على الفور.
تفعيل حساب المستخدم
يجب أن يتفاعل المستخدم مع الصفحة لتنزيل النماذج والإعدادات اللازمة إلى المتصفّح. إذا كان موقعك الإلكتروني أو تطبيق الويب هو أول تفاعل للمستخدم مع واجهة برمجة تطبيقات مدمجة معيّنة مستندة إلى الذكاء الاصطناعي، يجب أن يتفاعل المستخدم بشكل مؤقت لبدء جلسة مع create()
.
استخدِم السمة UserActivation.isActive
لتأكيد تفعيل أحد المستخدمين، والذي يمكن أن يكون
نقرة أو لمسة أو ضغطة مفتاح.
// Check for user activation.
if (navigator.userActivation.isActive) {
// Create an instance of a built-in API
}
على سبيل المثال، باستخدام Summarizer API، يمكنك أن تطلب من المستخدمين النقر على زر "تلخيص" لتفعيل Summarizer.create()
.
استخدام واجهات برمجة التطبيقات على المضيف المحلي
تتوفّر جميع واجهات برمجة التطبيقات على localhost
في Chrome.
- الانتقال إلى
chrome://flags/#prompt-api-for-gemini-nano
- اختَر مفعّل.
- انقر على إعادة التشغيل أو أعِد تشغيل Chrome.
للتأكّد من أنّ Gemini Nano تم تنزيله ويعمل على النحو المنشود، افتح DevTools واكتب await LanguageModel.availability();
في وحدة التحكّم. من المفترض أن تعرض هذه الدالة available
.
تحديد المشاكل في localhost وحلّها
إذا لم يعمل النموذج على النحو المتوقّع، اتّبِع الخطوات التالية:
- أعِد تشغيل Chrome.
- الانتقال إلى
chrome://on-device-internals
- انقر على علامة التبويب حالة النموذج وتأكَّد من عدم وجود أي أخطاء.
- افتح "أدوات مطوّري البرامج" واكتب
LanguageModel.availability();
في وحدة التحكّم. من المفترض أن تعرض هذه السمة القيمةavailable
.
انتظِر بعض الوقت وكرِّر هذه الخطوات إذا لزم الأمر.
عملية المعايير
نحن نعمل على توحيد هذه واجهات برمجة التطبيقات، لكي تعمل على جميع المتصفّحات. يعني هذا أنّنا اقترحنا واجهات برمجة التطبيقات على منتدى منصات الويب، ونقلناها إلى مجموعة W3C Web Incubator Community Group لمناقشتها بشكل أكبر.
نطلب الحصول على ملاحظات من W3C وMozilla وWebKit بشأن كل واجهة برمجة تطبيقات.
التفاعل مع الملاحظات ومشاركتها
إذا جرّبت الذكاء الاصطناعي المضمّن وكانت لديك ملاحظات، يسرّنا معرفتها.
- التعرّف على جميع واجهات برمجة تطبيقات الذكاء الاصطناعي المدمجة
- الانضمام إلى برنامج "الميزات التجريبية" لإلقاء نظرة مبكرة على واجهات برمجة التطبيقات الجديدة والوصول إلى قائمتنا البريدية
- إذا كانت لديك ملاحظات حول طريقة تنفيذ Chrome لهذه الميزة، يُرجى إرسال تقرير عن خلل Chromium.
- مزيد من المعلومات عن معايير الويب