يضع MAI‑Image‑1 شركة Microsoft في لعبة الذكاء الاصطناعي الفنية – هذه المرة بفرشاة خاصة بها

- أطلقت Microsoft MAI‑Image‑1، وهو أول نموذج داخلي لها لتحويل النص إلى صورة
- يركز النموذج على السرعة والواقعية والمرونة، بهدف تجنب الاستعارات البصرية المتكررة
- MAI-Image-I سيأتي قريبًا إلى Copilot وBing
طرحت Microsoft للتو MAI‑Image‑1، وهو أول مولد داخلي لها لتحويل النص إلى صورة. من خلال بناء النموذج داخليًا، تطالب Microsoft بمطالبة جديدة، حيث لا تتنافس فقط مع الشركات ذات الوزن الثقيل في الصناعة مثل Nano Banana وMidjourney من Google، ولكن أيضًا مع شريكها المقرب جدًا، وهو خط OpenAI الخاص من نماذج صور الذكاء الاصطناعي.
لقد تمكنت MAI‑Image‑1 بالفعل من الوصول إلى المراكز العشرة الأولى في قائمة صدارة LMArena، وهي منصة عامة لقياس الأداء حيث تعد المكان الوحيد الذي تتوفر فيه في الوقت الحالي. ومع ذلك، سيتغير هذا قريبًا، حيث تقول Microsoft إن النموذج سيتم طرحه قريبًا في Copilot وBing Image Creator.
تفتخر Microsoft بشكل خاص بقيم الإنتاج الواقعية لـ MAI-Image-1 والإضاءة والأنسجة التي يمكن التحكم فيها. كانت فكرة الشركة هي تقديم صور الذكاء الاصطناعي التي لا تشبه تلك التي تصنعها النماذج الأخرى، مما يميزها عن الجمالية الشائعة المألوفة لأي شخص شاهد العديد من صور الذكاء الاصطناعي، لا سيما الشكل “المائل” المنتشر على وسائل التواصل الاجتماعي.
كان المفتاح هو تنظيم بيانات التدريب والعمل مع المبدعين المحترفين لضبط النموذج واختباره مقابل كيفية استخدامه من قبل الشخص العادي. تأمل Microsoft أن تجعل MAI نماذج Midjourney أو Stable Diffusion تبدو غير منتظمة وبطيئة بالمقارنة.
صور الذكاء الاصطناعي الخاصة بشركة Microsoft
لقد استثمرت مايكروسوفت بكثافة في دمج الذكاء الاصطناعي في كل ما تصنعه، ولكن هذا يعني في الغالب أدوات OpenAI.
لكن هذا يتغير حتى الآن. تنضم MAI-Image-1 الآن إلى نماذج اللغة والكلام المحلية MAI‑1 وMAI‑Voice‑1. MAI‑Image‑1 هي قطعة اللغز التالية.
وبطبيعة الحال، فإن الشخص العادي لن يلاحظ أي شيء من ذلك. سوف يعجبون أو ينزعجون من أي صورة ينتجها الذكاء الاصطناعي لبرنامج Microsoft PowerPoint عندما يقومون بإنشاء عرض تقديمي. وتقول الشركة إن تركيزها على الواقعية والفائدة يعني أن الناس سيكونون سعداء للغاية. سيكون هناك عدد أقل من النقط التي تشبه الحلم والمزيد من الصور التي تعمل فعليًا في المستندات والإعلانات والعروض التقديمية.
لأن السؤال ليس “من لديه نموذج الصورة؟” إنه “من لديه أداة مفيدة سيستخدمها الناس بالفعل في الأدوات الحقيقية؟” هذا هو المكان الذي تراهن فيه Microsoft على أن MAI‑Image‑1 سوف تتألق.
بالنسبة للمحترفين المبدعين، قد يعني هذا مسارًا أسرع من المفهوم السريع إلى المفهوم المصقول. بالنسبة للمستخدمين العاديين، فهذا يعني تقليل الفجوات المحبطة بين الفكرة والتنفيذ. وبالنسبة لشركة Microsoft، إذا أحب المستخدمون هذا النموذج، فإن ذلك يجعل النظام البيئي AI Copilot بأكمله أكثر جاذبية. إذا تعثرت، فقد تحتاج إلى العودة إلى OpenAI للحصول على المساعدة.
في الوقت الحالي، يبدو أن عصر اعتماد Microsoft على OpenAI قد انتهى. سوف يتمحور مستقبل أدوات الذكاء الاصطناعي حول من يقوم ببنائها وأين تظهر، بقدر ما سيتمحور حول ما يمكنها فعله بالفعل والمشكلات التي تحلها. مع MAI‑Image‑1، تقول Microsoft إنها تريد الإجابة على كل هذه الأسئلة بنفسها.
اتبع TechRadar على أخبار جوجل و أضفنا كمصدر مفضل للحصول على أخبار الخبراء والمراجعات والآراء في خلاصاتك. تأكد من النقر على زر المتابعة!
وبالطبع يمكنك أيضًا اتبع TechRadar على TikTok للحصول على الأخبار والمراجعات وفتح الصناديق في شكل فيديو، والحصول على تحديثات منتظمة منا على واتساب أيضاً.