مايكروسوفت تقود الذكاء الاصطناعي لتحويل الصور ومقاطع الصوت إلى وجوه ناطقة

سفاري نت – متابعات

أعلنت شركة مايكروسوفت عن تطوير أداة ذكاء اصطناعي جديدة باسم “فاسا-1” VASA-1، قادرة على تحويل صورة وجه ومقطع صوتي إلى فيديو واقعي لشخص يتكلم.

وتهدف الأداة، حسب ما أوضحته الشركة، إلى تمكين المستخدمين من إنشاء محتوى إبداعي وذو جودة عالية، أي استخدامه في استخدامات الإيجابية مثل إنشاء الصور الرمزية الافتراضية (أفاتار).

ومع ذلك، تُثير إمكانيات الاستخدام السيئ لهذه التقنية قلقًا متزايدًا، خاصةً مع سهولة استخدامها لإنشاء محتوى مضلل أو مُضلّل.

وأكدت مايكروسوفت، وهي مستثمر أساسي في شركة Open AI التي ابتكرت برنامج Chat GPT، أنها لا تعتزم إتاحة الأداة الجديدة أو تقديم معلومات تقنية في حال وذلك لحين التأكد من استخدامها بشكل مسؤول يتوافق مع القوانين المعمول بها.

تُشارك شركات أخرى، مثل “رَنواي Runway ” في سباق تطوير تقنيات الذكاء الاصطناعي التوليدي للفيديو، مع برنامج “فلوغر” من “غوغل” الذي يمتاز بقدرته على إنشاء مقاطع فيديو واقعية لوجوه ناطقة.

وتعمل شركات مثل “رَنواي” و”غوغل” على تطوير تقنية الذكاء الاصطناعي لإنشاء مقاطع فيديو واقعية، حيث قام باحثو “غوغل” بإنشاء برنامج ذكاء اصطناعي يسمى “فلوغر” قادر على إنشاء مقاطع فيديو لوجوه ناطقة واقعية.

وأشارت شركة مايكروسوفت إلى فوائد أداة تحويل الصور ومقاطع الصوت إلى فيديوهات ناطقة، مثل تعزيز المساواة في التعليم، ومساعدة ذوي صعوبات التواصل، وتقديم الدعم العلاجي، تبرر الجهود المبذولة في تطويرها، مع التأكيد على استخدامها بشكل مسؤول وأخلاقي.

الذكاء الاصطناعيمايكروسوفت