Unboxing Geeks

شات جي بي تي أصبح يدعم إدخال الصور والصوت في الأوامر

شات جي بي تي أصبح يدعم إدخال الصور والصوت في الأوامر

أعلنت OpenAI، الشركة الرائدة في مجال الذكاء الاصطناعي، عن تطويرات جديدة لنموذجها اللغوي شات جي بي تي، حيث يمكن الآن استعمال الخدمة عبر إدخال الصور والصوت في الأوامر بدلًا من النصوص فقط.

هذه الميزات الجديدة ستتوفر للمشتركين في خدمة شات جي بي تي خلال الأسبوعين المقبلين، وستتاح لجميع المستخدمين “قريباً” حسب ما أعلنت عنه شركة OpenAI.

الصور والصوت في أوامر شات جي بي تي

فيما يتعلق بالأوامر الصوتية، الأمر بسيط: يضغط المستخدم على زر ويطرح سؤاله، حيث يقوم شات جي بي تي بتحويل الكلام إلى نص، وتغذية النموذج اللغوي الكبير به، ثم يحصل على الإجابة ويحولها مرة أخرى إلى كلام، ويعلن الإجابة بصوت مسموع.

وتأمل شركة OpenAI أن تكون الإجابات أفضل بفضل التكنولوجيا الأساسية المحسّنة.

يقوم نموذج Whisper من شركة OpenAI بالكثير من العمل في تحويل الكلام إلى نص، وتطوّر الشركة نموذج جديد لتحويل النص إلى كلام قادر على توليد “صوت بشري واقعي من مجرد نص وبضع ثوانٍ من عينة الكلام”.

كذلك، سيُتاح للمستخدمين اختيار اختيار الصوت الخاص بـ شات جي بي تي من بين خمس خيارات.

ومع ذلك، فإن القدرة على بناء صوت اصطناعي قادر ببضع ثوانٍ من الصوت فقط تفتح الباب للكثير من أنواع الاستخدام القابلة للمشاكل.

ذو صلة: ChatGPT API متاح الآن للمطورين لدمج الذكاء الاصطناعي في تطبيقاتهم

وتقول الشركة في مدونة تعلن عن الميزات الجديدة: “تعرض هذه القدرات أيضًا مخاطر جديدة، مثل إمكانية استغلال الأشخاص الخبيثين هذه الخاصية لتقليد الشخصيات العامة أو ارتكاب الاحتيال”.

لذلك، قررت OpenAI أن يكون النموذج غير متاح للاستخدام العام لهذا السبب.

بالنسبة للبحث بالصور، الأمر مشابه لخدمة Google Lens. يمكنك التقاط صورة لما يثير اهتمامك، وسيحاول شات جي بي تي فهم ما تسأل عنه والرد وفقاً لذلك.

كما يمكنك استخدام أداة الرسم في التطبيق لتوضيح استفسارك، أو الكلام أو كتابة الأسئلة مع الصورة.

وهنا يكون طابع شات جي بي تي التفاعلي مفيدًا: بدلاً من إجراء البحث، والحصول على الإجابة الخاطئة، ثم إجراء بحث آخر، يمكنك توجيه روبوت الدردشة وتحسين الإجابة أثناء التقدم.

اقرأ: 5 بدائل ChatGPT يجب أن تطلّع عليها الآن

ومع ذلك، فإن البحث بالصور يواجه مشكلات محتملة. أحدها هو ما يمكن أن يحدث عند استفسارك عن شخص: تقول OpenAI إنها قامت عمداً بتقييد قدرة شات جي بي تي على “تحليل وإصدار تصريحات مباشرة حول الأشخاص” لأسباب الدقة والخصوصية.

بعد مضي عام تقريباً على إطلاق شات جي بي تي، يبدو أن OpenAI ما زالت تحاول معرفة كيفية تزويد روبوت الدردشة الذكي بالمزيد من الميزات والقدرات دون إحداث مجموعة جديدة من المشكلات والسلبيات.

ومع هذه التطويرات، حاولت الشركة الموازنة بين القدرات الجديدة والسلامة عبر تقييد ما يمكن للنماذج الجديدة القيام به.