تقدم Google ميزة إنشاء تحويل النص إلى صورة AI إلى Android باستخدام لوحة مفاتيح Gboard

يعد Gboard من Google أحد أفضل تطبيقات لوحة المفاتيح المتوفرة على Android اليوم ولسبب وجيه. بالإضافة إلى لوحة مفاتيح كاملة الميزات، يشتمل التطبيق على إيماءات مفيدة لتحريك المؤشر أو تحديد النص، بالإضافة إلى التعبيرات المناسبة من خلال مكتبة رموز تعبيرية واسعة النطاق. لو الأحرف القياسية المعتمدة من قبل Unicode Consortium ليست كافية للسماح لك بعمل بعض المجموعات المجنونة مع Emoji Kitchen. نحن الآن نتعرف على خطط Google لدمج ذكاء اصطناعي نابض بالحياة يسمى Imagen للمساعدة في التعبير الإبداعي.

فيديو الشرطة الروبوت اليوم

إذا لم تكن مألوفًا، فإن Imagen هو أحد مشاريع Google البحثية التي تم إطلاقها في مايو 2022. يستخدم الذكاء الاصطناعي لتحويل الرسائل النصية إلى صور واقعية، تمامًا مثل الأدوات الشائعة DALL-E 2 و Midjourney. يتكون نموذج AI من أداة تشفير نصية ونموذج نشر نص إلى صورة وملف نموذج الانتشار المحسن القرار. بعد البحث في سلاسل التعليمات البرمجية في أحدث إصدار تجريبي من Gboard (الإصدار 12.7.05.507749191)، أبلغت 9to5Google عن العثور على إشارات إلى “لوحة مفاتيح Imagen”. قد يكون هذا علامة على تكامل Imagen القادم مع Gboard. ربما يمكن أن يكون Imagen تمت الإضافة في قسم Gboard Shortcuts مع خيارات مثل إعدادات السمات ومنتقي GIF وتكامل الترجمة من Google.

How-Imagen-works

Source:  Google Research

لا يبدو أن احتمال ظهور هذا التكامل الجديد للذكاء الاصطناعي أمامنا بعيد المنال. على مدار أشهر، كانت Google تبحث عن طرق لدمج الذكاء الاصطناعي في خدماتها، وهو ما يتجلى في الإدخال غير المتوقع لروبوت محادثة محادثة يسمى Bard. ومع ذلك، يقول بحث Google لم يحظ الاستخدام العام لـ Imagen باهتمام كبير.

لم يتم الإعلان عن نموذج الذكاء الاصطناعي لأن Google تخشى أن يسيء استخدامه. سترى أن الذكاء الاصطناعي الخاص بشركة Imagen قد تم تدريبه أيضًا باستخدام مجموعات البيانات التي تحتوي على مواد إباحية وصور مأخوذة من الويب، وكلاهما يحتوي على (على الأقل بعض) محتوى غير لائق. إذا كانت الصورة قد تسيء نتائج استخدام البيانات إلى مجتمعات معينة أو تظهر على أنها عنصرية ونمطية.

4 Images

Imagen-Sample-1
Imagen-Sample-2
Imagen-Sample-3
Imagen-Sample-4

تعهدت Google بضمان تطبيق الإجراءات الأمنية قبل طرح Imagen للعامة، ولكن قد يستغرق ذلك وقتًا غير محدد. على الجانب الإيجابي، تتمتع Imagen أيضًا بميزة كبيرة – فهي تعتمد على نموذج الانتشار وتعمل على النحو الأمثل حتى على الأجهزة المحمولة، على سبيل المثال الهاتف الذكي دون خسارة كبيرة في الأداء أو عمر البطارية. تظل النتائج وفية لإشاراتهم النصية، وتتفوق على التقييمات البشرية. لذلك لا نتفاجأ من أن Gboard تستفيد من المزيد من تكامل الذكاء الاصطناعي في المستقبل. حتى يكتشف جوجل ذلك يمكنك الاعتماد على التفاصيل الفنية لـ Emoji Kitchen لتصميم بعض الشخصيات من عالم آخر.

المصدر