Imagen 2 : ذكاء اصطناعي ثوري لتحويل النص إلى صورة

freemium

Imagen 2 هو مولد الصور الأكثر تطوراً وفعالية الذي يقدمه فريق Google. أنشئ صورًا فوتوغرافية أو صورًا واقعية جدًا بسهولة.

زيارة الموقع

Description

Imagen هو نموذج انتشار من النص إلى الصورة تم تطويره بواسطة Google، ويقدم مستوى غير مسبوق من الواقعية الفوتوغرافية وفهمًا عميقًا للغة. يستخدم هذا النموذج قوة نماذج اللغة الكبيرة التحويلية لفهم النص ونماذج الانتشار لتوليد صور عالية الجودة. اكتشافنا الرئيسي هو أن نماذج اللغة الكبيرة العامة (مثل T5)، المدربة مسبقًا على مجموعات نصية فقط، فعالة بشكل مدهش في ترميز النص لتوليف الصور. ومع ذلك، من خلال زيادة حجم نموذج اللغة، لاحظنا تحسنًا في دقة العينة ومحاذاة الصورة بالنص. يحقق Imagen 2 درجة FID جديدة تبلغ 7.27 على مجموعة بيانات COCO، دون التدريب على COCO على الإطلاق. وجد المقيمون البشريون أيضًا أن عينات Imagen كانت مكافئة لبيانات COCO نفسها من حيث محاذاة الصورة بالنص. لقد استخدمنا أيضًا DrawBench، وهو معيار شامل ومليء بالتحديات لنماذج النص إلى الصورة. لمقارنة Imagen 2 بالأساليب الحديثة الأخرى، فضل المقيمون البشريون ذكاء Google الاصطناعي على النماذج الأخرى في المقارنات المباشرة. أحد أفضل الأشياء في Imagen هو أن هذا الذكاء الاصطناعي متاح بالفعل عبر منصة Vertex AI. لذلك، يمكنك إنشاء الصور بسرعة، ولكن أيضًا استخدام واجهة برمجة التطبيقات (API) الخاصة به دون صعوبة وفي إطار آمن. مزيد من المعلومات التقنية حول Imagen 2 هنا. نص كتبه إنسان

Informations

الفئة Image Generators

Description

Informations

هل تحتاج مساعدة في دمج هذه الأداة؟