كيف يغير الذكاء الاصطناعي مراكز البيانات ، ودور وحدات المعالجة المركزية مقابل وحدات معالجة الرسومات ، والتصميم المستدام: ساندرا ريفيرا من إنتل
لا يفكر معظم الناس حقًا في مراكز البيانات ، لكننا جميعًا نستخدم التطبيقات المتصلة بالإنترنت وخدمات البث وأدوات الاتصال التي تعتمد على معالجة وتخزين كميات هائلة من المعلومات. نظرًا لأن العالم أصبح أكثر ارتباطًا وأصبح من الأسهل إنشاء وتوزيع كميات هائلة من البيانات ، فإن الأنظمة والعمليات اللازمة للتعامل مع كل ذلك تستمر في التطور. ساندرا ريفيرا ، نائب الرئيس التنفيذي والمدير العام لشركة إنتل ، مركز البيانات ومجموعة AI ، كانت مؤخرًا في بنغالورو ، وأتيحت الفرصة لـ Gadgets 360 لسماعها حول الاتجاهات الحالية ورؤيتها للمستقبل. لقد تغير الكثير بفضل الوباء ، وبالطبع يعد الذكاء الاصطناعي جزءًا كبيرًا من القصة في المستقبل.
قدمنا لك أولاً تعليقات ساندرا ريفيرا حول عمل Intel المستمر في الهند وكل ما تفعله الشركة هنا. الآن ، إليك بعض المقتطفات من تلك المحادثة ، حول الابتكار في الأجهزة والبرامج ، والطبيعة المتطورة لمراكز البيانات ، والتنافس مع Nvidia.
كيف أصبحت مراكز البيانات أكثر أهمية ، وكيف تغيرت الأشياء في الماضي القريب:
ساندرا ريفيرا: من الواضح أن جميع ابتكاراتنا ومنتجاتنا يقودها عملاؤنا. نحن في TAM كبيرة ومتنامية [Total Addressable Market] وبينما نمضي قدمًا ، لا يوجد مكان أكثر وضوحًا من الهند ، مع التحول الرقمي ورقمنة كل جزء من حياتنا. نحن بحاجة إلى مزيد من الحوسبة ؛ نحن نخلق المزيد من البيانات. يجب ضغطها وتأمينها وتسليمها عبر شبكة وتخزينها. يجب تقديمه ، وتحتاج أيضًا إلى الحصول على رؤى قيمة من ذلك ، وهذا بالطبع هو المكان الذي يأتي فيه الذكاء الاصطناعي.
أحد الأشياء المثيرة للاهتمام التي حدثت خلال COVID هو أنه بسبب قيود سلسلة التوريد التي كافحنا جميعًا من خلالها ، رأينا العملاء يميلون إلى المزيد من الاستفادة من البنية التحتية التي لديهم. الذكاء الاصطناعي والشبكات والأمن متعطشون جدًا لأحدث الابتكارات والحلول ، ولكن الكثير من مستوى الويب ؛ تطبيقات المكتب التي تعمل في البنية التحتية السحابية ؛ أنظمة تخطيط موارد المؤسسات نظم المحاسبة؛ إلخ ، في الواقع تركز بشدة على الاستخدام.
أكبر نمو يحدث في ما نسميه حافة الشبكة ، أو في أماكن العمل. الحساب يقترب من نقطة إنشاء البيانات واستهلاك البيانات. هناك الكثير من التحديات التي تواجهنا تتمثل في الشراكة مع مصنعي المعدات الأصلية لتبسيط نشر التطبيقات في مكان العمل لمعالجة تلك البيانات ؛ لتشغيل التعلم الآلي والذكاء الاصطناعي وتحليلات البيانات وإمكانيات الشبكات والأمن. هذا كثير من العمل في كل من الأجهزة وبالطبع في البرمجيات.
هذا صحيح هنا في الهند أيضًا. [Some of it] مدفوعة بقيود الطاقة ، وبالتالي إذا كان بإمكانهم الحصول على طاقة مخصصة لتلك التطبيقات والبنية التحتية المتطورة ومن ثم وضع حد للطاقة على المزيد من التطبيقات السائدة ، فهذا استخدام ذكي لميزانية الطاقة ، وهو أمر كبير.
لقد كانت الهند مهمة جدًا بالنسبة لنا من منظور البحث والتطوير ؛ أعني أننا كنا هنا منذ عقود. نرى أيضًا مع كل الاستثمارات التي تقوم بها الحكومة في التحول الرقمي والبنية التحتية ، أن الهند ستكون سوقًا استهلاكيًا ضخمًا لنا أيضًا. إن فرصة إنشاء المزيد من البنية التحتية هنا ، والمزيد من مراكز البيانات ، والمزيد من حلول المؤسسات ، وحلول النظم البيئية للبرامج ، والخدمات ، أمر مثير للغاية. نواصل الاستثمار ليس فقط في القوى العاملة ولكن أيضًا في فرص السوق هنا.
الأهمية المستمرة لوحدات المعالجة المركزية حتى عندما تكون وحدات معالجة الرسومات مطلوبة ، وكيف يؤدي ذلك إلى تعطيل تصميم مراكز البيانات:
ساندرا ريفيرا: هناك أعباء عمل عالية النمو مثل الذكاء الاصطناعي والشبكات مدفوعة بالانتشار المستمر لشبكة الجيل الخامس ، فضلاً عن الأمان والتخزين. إحدى الديناميكيات التي نراها في السوق هي أنه على المدى القريب ، هناك الكثير من الاهتمام بالحوسبة المتسارعة ، وهذا يعني وحدات معالجة الرسومات ومسرعات الذكاء الاصطناعي.
يتطلع العملاء إلى تحويل جزء من نفقاتهم الرأسمالية نحو وحدات معالجة الرسومات. تعد وحدة المعالجة المركزية جزءًا من المعادلة ، ولكن على المدى القريب ، سيذهب المزيد من الإنفاق الرأسمالي هذا إلى وحدات معالجة الرسومات. لا نعتقد أن هذه حالة سوق دائمة. تعد وحدة المعالجة المركزية جيدة جدًا من منظور التكلفة والأداء وقابلية البرمجة للعديد من أعباء عمل الذكاء الاصطناعي. في كثير من الحالات ، يكون لدى العملاء بالفعل وحدة المعالجة المركزية Xeon ، وبالتالي حقيقة أنه يمكنهم القيام بالتعلم الآلي للذكاء الاصطناعي [with that] ريح خلفية لأعمالنا.
إنتل AI Continuum
[All that] يتحدث الجميع الآن عن الذكاء الاصطناعي التوليدي ونماذج اللغة الكبيرة ، لكن الذكاء الاصطناعي أكثر من ذلك بكثير ، أليس كذلك؟ الذكاء الاصطناعي هو كل عملية تحضير البيانات التي تحدث قبل تدريب النموذج ؛ إنها إدارة البيانات والتصفية والتنظيف. لذلك إذا كنت تحاول إنشاء تطبيق للتعرف على القطط ، [for example] لا تريد أي كلاب في تلك الصور. يتم كل ذلك مقدمًا باستخدام وحدة المعالجة المركزية ، وفي الواقع يتم بشكل حصري تقريبًا مع Xeon اليوم. هذا جزء من سير عمل الذكاء الاصطناعي. ثم تصل إلى مرحلة التدريب النموذجي الفعلي. تتمتع وحدة المعالجة المركزية بموقع جيد للغاية للتعامل مع النماذج الصغيرة والمتوسطة الحجم – 10 مليار معلمة أو أقل – أو أعباء العمل المختلطة حيث يكون التعلم الآلي أو تحليلات البيانات جزءًا من تطبيق أوسع. تتميز وحدة المعالجة المركزية بأنها مرنة للغاية وقابلة للبرمجة بدرجة كبيرة ، ومن المحتمل أن يكون لديك بالفعل وحدات معالجة مركزية.
عندما تتحدث عن أكبر النماذج ، مع 100 ، 200 ، 300 مليار معلمة – هناك حاجة إلى بنية أكثر توازيًا ، وهو ما توفره وحدة معالجة الرسومات ، وتستفيد أيضًا من تسريع التعلم العميق المخصص ، كما هو الحال في Gaudi. بعد تدريب النموذج ، تصل إلى ما نسميه مرحلة الاستدلال أو النشر. عادة ما تكون في مكان العمل هناك. إذا كنت تعمل في مؤسسة بيع بالتجزئة أو في مطعم للوجبات السريعة ، فعادة ما تقوم بتشغيل ذلك إما على وحدة المعالجة المركزية أو على مُسرع أقل استهلاكًا للطاقة وأقل تكلفة. في مرحلة الاستدلال ، يمكننا التنافس بشكل فعال للغاية مع وحدات المعالجة المركزية الخاصة بنا وبعض وحدات معالجة الرسومات والمسرعات الأصغر لدينا.
في الوقت الحالي ، هناك الكثير من الاهتمام حول أكبر نماذج اللغة والذكاء الاصطناعي التوليدي. نرى المزيد من العملاء يقولون إنهم يريدون التأكد من أن لديهم بعض إمكانيات وحدة معالجة الرسومات. نحن نرى أن السوق معقد ، ولكن على المدى الطويل. انه ينمو. نحن في الأيام الأولى للذكاء الاصطناعي. نعتقد أن لدينا فرصة جيدة للغاية للعب مع اتساع القدرات التي لدينا عبر محفظتنا. لذا لا أعتقد أن الذكاء الاصطناعي التوليدي صغير ؛ لكنها لا يمكن معالجتها فقط باستخدام وحدة معالجة الرسومات واسعة النطاق.
كيف ترى Intel Nvidia وكيف تخطط للمنافسة
ساندرا ريفيرا: يعلم الجميع أن Nvidia تقوم بعمل رائع في توصيل وحدات معالجة الرسومات إلى السوق. إنه لاعب عملاق. اسمحوا لي أن أضع ذلك في منظور. يتميز Gaudi 2 بأداء أفضل من Nvidia A100 ، وهو أكثر وحدات معالجة الرسومات انتشارًا اليوم. ليس لديها المزيد من الأداء الخام مقابل H100 في الوقت الحالي ، ولكن من منظور السعر والأداء ، فهي في الواقع في وضع جيد للغاية. أحد تنسيقات البيانات المدعومة في جهاز Gaudi 2 هو FP8 ، والبرنامج الذي يدعم ذلك سيصدر في الربع القادم. نتوقع أن نرى أداءً جيدًا للغاية ، ولكن سيتعين عليك الانتظار ورؤية ما ننشره في نوفمبر. في العام المقبل ، سيكون لدينا Gaudi 3 في السوق والذي سيتنافس بشكل فعال للغاية مع H100 وحتى الجيل القادم على خريطة طريق Nvidia. تبدو توقعاتنا جيدة جدا. نحن أسعارنا قوية للغاية. يريد العملاء بدائل ونريد بالتأكيد أن نكون بديلاً لأكبر لاعب في السوق. سيكون ما نفعله ، وليس ما نقوله.
خارطة طريق إنتل لبناء مراكز بيانات مستدامة.
ساندرا ريفيرا: نستخدم أكثر من 90 بالمائة وفي بعض الحالات 100 بالمائة من الطاقة المتجددة في جميع الصناعات التحويلية الخاصة بنا في جميع أنحاء العالم. نحن في المرتبة الثانية لا أحد في مجال الطاقة المتجددة والبصمة الكربونية الإجمالية لتصنيع منتجاتنا. المنافسة ، مثل معظم دول العالم ، تقوم ببناء منتجاتها في مسابك إما في تايوان أو في كوريا. بالطبع تايوان هي الأكبر ، لكن بصمتهم في الطاقة المتجددة صغيرة جدًا في الواقع. إنها جزيرة. يتم شحن كل شيء باستخدام وقود الديزل. عندما ننظر إلى مراكز البيانات التي نبنيها لأنفسنا من أجل fabs الخاصة بنا والبنية التحتية لتكنولوجيا المعلومات الخاصة بنا ، مرة أخرى هذا 90 بالمائة بالإضافة إلى الطاقة المتجددة. نحن أيضًا نشارك بشكل وثيق جدًا مع مصنعي المعدات الأصلية ومزودي الخدمات السحابية للمساعدة في تحسين الطاقة الخضراء والمتجددة.
مع الجيل الرابع من Xeon ، قدمنا وضعًا مُحسَّنًا للطاقة حيث يمكنك بالفعل استخدام طاقة أقل بنسبة 20 في المائة من خلال كونك ذكيًا في إيقاف تشغيل النوى أثناء أوقات الخمول وضبط المعالج. لقد تمكنا من القيام بذلك بتأثير ضئيل للغاية على الأداء ، أقل من 5 في المائة ، والعملاء من هذا القبيل لأنهم لا يحتاجون دائمًا إلى تشغيل المعالج بكامل طاقته ويمكنهم توفير الكثير من الطاقة.
الحالة الحالية والإمكانات المستقبلية للحوسبة العصبية والكمية في مراكز البيانات
ساندرا ريفيرا: تعد الحوسبة العصبية والكمية من التقنيات الرائدة. لقد كنا مستثمرًا في الكم لمدة عقد ونصف على الأقل. لقد كنا مستثمرين في فوتونات السيليكون. أصبحت الشبكات الضوئية والوصلات مثيرة للاهتمام بشكل متزايد ، لا سيما في منصات الحوسبة عالية الجودة والواسعة النطاق هذه. نحن نعلم أن تقنيات الذاكرة ستكون مهمة بالنسبة لنا في المضي قدمًا. لقد كنا مستثمرين في تقنيات الذاكرة مع الشركاء وحدنا. تكون الجدوى التجارية لهذه التقنيات في بعض الأحيان من 10 إلى 20 عامًا ، ولكن الابتكار هو شريان الحياة لأعمالنا. لدينا قدرات غير عادية مع مختبرات إنتل. لدينا العديد من الزملاء وكبار الزملاء ورجال الأعمال البارزين. تعد تقنية المعالجة من أكثر الهندسة تعقيدًا وروعة في العالم.
سنواصل القيادة من منظور الابتكار. تعتمد الجدوى التجارية على مدى سرعة تحول الأسواق. نعتقد أن الذكاء الاصطناعي معطّل ، ومن المحتمل أن تكون بعض هذه التقنيات كذلك [developed] بوتيرة متسارعة ، لا سيما الربط الشبكي والذاكرة. هناك الكثير من الابتكارات في مجال الطاقة والحرارة. هذه الرقائق والأنظمة تزداد حجمًا وأكثر سخونة. ليس من السهل دائمًا الإجابة عندما يحين التوقيت [right]. قد لا تحقق بعض هذه التقنيات نجاحًا تجاريًا ، لكنك تأخذ أجزاء منها وتوجهها إلى مناطق أخرى. أعتقد أن هذا هو عمل الابتكار ونحن فخورون جدًا بتاريخنا. أولئك [teams] يقومون بالكثير من الأشياء الممتعة وهم نشيطون للغاية.
تم اختصار بعض الردود وتحريرها قليلاً من أجل الوضوح.
إفصاح: قامت شركة إنتل برعاية رحلات المراسلين الخاصة بالحدث الذي أقيم في بنغالورو.