يمكن لهذه الشريحة الصغيرة أن تزيح وحدات معالجة الرسوميات من Nvidia عن طريق دمج الحوسبة والذاكرة للحصول على سرعة وكفاءة الذكاء الاصطناعي المذهلة

- تعمل وحدة GSI Gemini-I APU على تقليل الخلط المستمر للبيانات بين المعالج وأنظمة الذاكرة
- يكمل مهام الاسترداد بشكل أسرع بنسبة تصل إلى 80% من وحدات المعالجة المركزية المماثلة
- سوف توفر وحدة APU GSI Gemini-II إنتاجية أعلى بعشر مرات
تعمل تقنية GSI على الترويج لنهج جديد لمعالجة الذكاء الاصطناعي الذي يضع العمليات الحسابية مباشرة داخل الذاكرة.
ولفتت دراسة جديدة أجرتها جامعة كورنيل الانتباه إلى هذا التصميم، المعروف باسم وحدة المعالجة الترابطية (APU).
ويهدف إلى التغلب على حدود الأداء والكفاءة طويلة الأمد، مما يشير إلى أنه يمكن أن يتحدى هيمنة أفضل وحدات معالجة الرسومات المستخدمة حاليًا في أدوات الذكاء الاصطناعي ومراكز البيانات.
منافس جديد في أجهزة الذكاء الاصطناعي
تم نشر بحث كورنيل في مجلة ACM وتم تقديمه في مؤتمر Micro ’25 الأخير، حيث قام بتقييم وحدة Gemini-I APU من GSI مقابل وحدات المعالجة المركزية ووحدات معالجة الرسومات الرائدة، بما في ذلك Nvidia’s A6000، باستخدام أعباء عمل الجيل المعزز للاسترجاع (RAG).
امتدت الاختبارات إلى مجموعات بيانات تتراوح من 10 إلى 200 جيجابايت، مما يمثل ظروف استدلال واقعية للذكاء الاصطناعي.
من خلال إجراء العمليات الحسابية داخل ذاكرة الوصول العشوائي الثابتة، تقلل وحدة APU من خلط البيانات المستمر بين المعالج والذاكرة.
يعد هذا مصدرًا رئيسيًا لفقد الطاقة ووقت الاستجابة في بنيات وحدة معالجة الرسومات التقليدية.
أظهرت النتائج أن وحدة APU يمكنها تحقيق إنتاجية من فئة GPU مع استهلاك طاقة أقل بكثير.
ذكرت GSI أن وحدة APU الخاصة بها تستخدم طاقة أقل بنسبة تصل إلى 98% من وحدة معالجة الرسومات القياسية وتكمل مهام الاسترجاع بنسبة تصل إلى 80% أسرع من وحدات المعالجة المركزية المماثلة.
مثل هذه الكفاءة يمكن أن تجعلها جذابة للأجهزة المتطورة مثل الطائرات بدون طيار، وأنظمة إنترنت الأشياء، والروبوتات، وكذلك للاستخدام في مجال الدفاع والفضاء، حيث تكون حدود الطاقة والتبريد صارمة.
على الرغم من هذه النتائج، لا يزال من غير الواضح ما إذا كانت تكنولوجيا الحوسبة في الذاكرة يمكن أن تصل إلى نفس مستوى النضج والدعم الذي تتمتع به أفضل منصات GPU.
تستفيد وحدات معالجة الرسومات حاليًا من أنظمة بيئية برمجية متطورة تسمح بالتكامل السلس مع أدوات الذكاء الاصطناعي الرئيسية.
بالنسبة لأجهزة الحوسبة في الذاكرة، يظل التحسين والبرمجة من المجالات الناشئة التي يمكن أن تؤدي إلى إبطاء الاعتماد على نطاق أوسع، خاصة في عمليات مراكز البيانات الكبيرة.
تقول GSI Technology إنها تواصل تحسين أجهزتها، ومن المتوقع أن يوفر جيل Gemini-II إنتاجية أعلى بعشر مرات وزمن وصول أقل.
هناك تصميم آخر، يُسمى Plato، قيد التطوير لزيادة توسيع أداء الحوسبة لأنظمة الحافة المدمجة.
وقال لي لين شو، رئيس مجلس الإدارة والرئيس التنفيذي لشركة GSI Technology: “يؤكد التحقق المستقل من كورنيل ما كنا نؤمن به منذ فترة طويلة، وهو أن الحوسبة في الذاكرة لديها القدرة على تعطيل سوق استدلال الذكاء الاصطناعي بقيمة 100 مليار دولار”.
“توفر وحدة APU أداءً من فئة وحدة معالجة الرسومات بجزء بسيط من تكلفة الطاقة، وذلك بفضل بنيتها عالية الكفاءة التي تركز على الذاكرة. ويمكن للجيل الثاني من وحدة APU التي تم إصدارها مؤخرًا، Gemini-II، توفير إنتاجية أسرع بما يقرب من 10 مرات وزمن وصول أقل لأحمال عمل الذكاء الاصطناعي التي تتطلب ذاكرة كبيرة.”
عبر TechPowerUp
اتبع TechRadar على أخبار جوجل و أضفنا كمصدر مفضل للحصول على أخبار الخبراء والمراجعات والآراء في خلاصاتك. تأكد من النقر على زر المتابعة!
وبالطبع يمكنك أيضًا اتبع TechRadar على TikTok للحصول على الأخبار والمراجعات وفتح الصناديق في شكل فيديو، والحصول على تحديثات منتظمة منا على واتساب أيضاً.