أداة "Whisk" الجديدة من جوجل.. توليد الصور باستخدام الصور نفسها دون الحاجة للأوامر النصية

الجمعة، 20 ديسمبر 2024 09:06 ص

Whisk

Whisk

في خطوة مبتكرة، أطلقت جوجل أداة "Whisk" الجديدة التي تسعى لتبسيط عملية إنشاء الصور باستخدام الذكاء الاصطناعي، الأداة تتيح للمستخدمين توليد صور جديدة بناءً على صور مدخلة، دون الحاجة لوصف دقيق أو أوامر نصية معقدة، ما يمثل طفرة في عالم الإبداع الفني الرقمي.

كيف تعمل أداة "Whisk"؟

أداة "Whisk" هي أداة تجريبية من جوجل، تعمل بتقنيات الذكاء الاصطناعي الحديثة مثل "Gemini" و"Imagen 3"، وتستند إلى عملية متطورة لتحليل الصور المدخلة واستخراج العناصر الرئيسية منها. 

هذه العناصر تشمل:

  • الموضوع: العنصر الرئيسي في الصورة، مثل شخص أو حيوان أليف أو أي كائن آخر.
  • المشهد: الخلفية أو المكان الذي يحيط بالموضوع، مثل الشاطئ أو المدينة.
  • الأسلوب: النمط الفني للصورة، مثل الألوان المائية أو الرسوم المتحركة.

تعمل الأداة على تحليل الصورة المدخلة، حيث يقوم نموذج "Gemini" بفحص الصورة بشكل شامل لتحديد تفاصيلها، من الموضوع إلى الخلفية والنمط الفني، بعد ذلك، يتم تحويل هذه التحليلات إلى أوصاف نصية دقيقة تستخدم كمدخلات لنموذج "Imagen 3" لتوليد صورة جديدة.

لبدء استخدام الأداة، يجب على المستخدمين زيارة صفحة أداة "Whisk" على الإنترنت وتسجيل الدخول باستخدام حساب جوجل. بعد ذلك، يمكنهم اختيار قالب من ثلاثة قوالب أساسية، كل منها له تأثير بصري مختلف:

  1. قالب الملصق (Sticker): لإنتاج صور مسطحة ثنائية الأبعاد تشبه الملصقات الرقمية.
  2. قالب (Enamel Pin): لإضفاء عمق وبريق على الصورة، مما يعطيها مظهرًا أنيقًا.
  3. قالب (Plushie): لتحويل الصورة إلى شكل ثلاثي الأبعاد يشبه الدمى، مما يضفي لمسة مرحة على الصورة.

بعد اختيار القالب، يقوم المستخدمون بتحديد الصورة التي يرغبون في استخدامها كموضوع للصورة الجديدة. يمكنهم تحميل صورهم الخاصة أو اختيار واحدة من مكتبة الصور المتاحة في الأداة.

تتيح الأداة أيضًا خيارًا إضافيًا يُسمى "البدء من الصفر" (Start from Scratch)، حيث يمكن للمستخدمين تحديد جميع العناصر الأساسية مثل الموضوع، المشهد، والأسلوب باستخدام الصور أو الأوامر النصية، وبمجرد تحديد هذه العناصر، تقوم الأداة بإنشاء صورة جديدة بناءً على تلك الاختيارات.

إذا لم يكن المستخدم راضيًا عن النتيجة الأولية، يمكنه تعديل الصور المدخلة أو تغيير المطالبات النصية للحصول على نتيجة مختلفة، كما توفر الأداة خيار "Refine" لتحسين النتائج بشكل أكبر، من خلال تغيير الصور أو تعديل الأوامر النصية.

لا تقتصر أداة "Whisk" على كونها أداة ممتعة فحسب، بل توفر إمكانيات متعددة في مجالات عدة، من أبرزها:

  • التصميم الجرافيكي: تمكّن المصممين من ابتكار نماذج أولية بسرعة عن طريق دمج صور إلهامية من مصادر مختلفة.
  • التسويق: تتيح للعلامات التجارية إنشاء صور دعائية فريدة تتناسب مع أسلوب الحياة والعملاء.
  • إنشاء المحتوى: تقدم للمدونين والمؤثرين وسيلة سريعة لإنشاء صور مبتكرة وجذابة.

على سبيل المثال، يمكن للمستخدمين دمج صورة عائلية مع مشهد جبلي ثلجي ونمط بطاقة بريدية قديمة لإنشاء صورة تهنئة فريدة في ثوانٍ معدودة.

تعتبر أداة "Whisk" خطوة كبيرة نحو المستقبل في مجال الإبداع الرقمي، حيث تتيح للمستخدمين مزيدًا من التحكم في العملية الإبداعية، على عكس الأدوات التي تعتمد على خوارزميات ثابتة، توفر "Whisk" توازنًا بين الإبداع الشخصي والتحكم الدقيق، ومع تطور هذه الأداة، قد تصبح أداة أساسية للفنانين والمصممين وكل من يسعى لتوسيع آفاقه الإبداعية.

تسلط هذه الأداة الضوء على التزام جوجل بتطوير الذكاء الاصطناعي التوليدي، والذي من المتوقع أن يكون له تأثير كبير في المستقبل، حيث يمكّن المستخدمين من دمج التكنولوجيا مع الخيال بشكل لم يكن ممكنًا من قبل.

ابحث عن مواصفات هاتفك

Back Top