نموذج EG3D قادر على تكوين وجوه جديدة بواسطة الذكاء الاصطناعي

EG3D

قطعت تقنيات الذكاء الاصطناعي شوطا كبيراً في السنوات الأخيرة، وحتى أن المستخدمين العاديين مثلنا سوف يصبح بإمكانهم قريباً استخدام تلك التقنيات لبناء وتعديل أشكال ثلاثية الأبعاد الأقرب للواقع، وذلك فقط بواسطة أجهزة الكمبيوتر الخاصة بهم.

EG3D
تقنية EG3D

 كانت تقنيات الذكاء الاصطناعي سابقا قادرة فقط على إنشاء صور ثنائية الأبعاد، لكن هذا تغير بشكل كبير مؤخرا بالرغم من صعوبة التحكم والتعديل على المجسمات ثلاثية الأبعاد، وذلك بسبب الحاجة إلى قوة معالجة هائلة. وبما أن تلك التقنيات توفر سهولة كبيرة في إنشاء صور واقعية للغاية، فإنها قد تحدث ثورة تقنية في طريقة صناعة المحتوى سواء على مواقع التواصل الاجتماعي أو حتى في أفلام هوليوود، وحتى بالنسبة لألعاب الفيديو وتقنيات CGI الخاصة بأفلام الحركة والأكشن.

تقنية EG3D الجديدة

قام فريق من الأكاديميين في جامعة ستانفورد بتطوير نموذج جديد من الذكاء الاصطناعي باسم EG3D، وذلك لإنتاج صور عشوائية عالية الدقة لوجوه جديدة وأشياء أخرى ذات بنية هندسية معينة. هذا النموذج هو الأول من نوعه مع ثلاثة نماذج أخرى بالنسبة للأجسام ثلاثية الأبعاد، ويعد من الحلول الأفضل حالياً للوصول إلى جودة صور أقرب إلى الواقع.

الذكاء الاصطناعي

تستخدم تقنية EG3D طريقة تعلم آلي شائعة جداً باسم GAN أو generative adversarial network، ومهمتها الأساسية هي إنشاء الرسومات. ومن خلال استخدام شبكة عصبية أحادية لإنشاء الصور، وشبكة ثانية لتقييم دقتها، فذلك يقوم مبدئيا بدمج شبكتين عصبيتين ببعضهما البعض، ويتم تكرار هذه العملية عدة مرات للوصول إلى نتيجة ظاهرية مقبولة.

قام الباحثون بإنشاء مكون يمكنه تحويل تلك الصور أو الرسومات إلى أشكال ضمن مساحة ثلاثية الأبعاد، وهذا بفضل الجمع بين شبكات GAN ثنائية الأبعاد عالية الدقة الموجودة مسبقا. هذا المكون سريع بما يكفي للظهور في الوقت الفعلي على جهاز كمبيوتر محمول، ويمكن استخدامه لإنشاء تصاميم معقدة ثلاثية الأبعاد، وهو متوافق مع شرائح المعالجة الموجودة حالياً واستهلاكه للطاقة يعتبر معتدلا نسبيا.

aI Technology

بالرغم من قدرة EG3D على تكوين صور ثلاثية الأبعاد، إلا أن صعوبة تعديلها بواسطة برامج التصميم ما تزال قائمة حتى الآن. سبب ذلك الأساسي، هو أنه يمكن رؤية الصورة التي تم إنشاؤها بوضوح، إلا أنه من غير الواضح كيف تم إنشاؤها بواسطة شبكة GAN. أحد الحلول لتلك المشكلة قد يكون نموذج تعلم آلي طوره باحثو جامعة ويسكونسن-ماديسون باسم GiraffeHD، وهو فعال في إزالة خصائص الصور ثلاثية الأبعاد القابلة للتلاعب، حيث تسمح للمستخدم باختيار عدة عناصر مثل الشكل واللون والمشهد أو خلفية الصورة.

تم تطوير نموذج GiraffeHD بواسطة عدد لا يحصى من الصور، وهو يقوم بالبحث عن العوامل الكامنة الأساسية في الصورة، وهذا لإنشاء صور بطريقة تتصرف فيها كمتغيرات يمكن التحكم بها. ذلك سوف يمكن المستخدمين من تغيير خصائص الصور بدقة عالية عن طريق تحرير الميزات القابلة للتحكم ضمن الصور ثلاثية الأبعاد.

الطريقة الجديدة التي يتم استخدمها لتكوين صور ثلاثية الأبعاد بواسطة الذكاء الصناعي، تعد الأكثر تطورا حالياً، وتحديدا بنماذج مثل GiraffeHD و EG3D. ولكن، ما يزال هناك الكثير من العمل المطلوب فيما يخص تحيز الخوارزميات وقابلة التطبيق على مدى أوسع، ونوع تغذية تلك النماذج عبر البيانات ما يزال محدودا، ولكن البحث جاري الآن لمعالجة جميع تلك المشاكل.