المبادئ الأولى للتفكير لعلماء البيانات

كتبوا إلى مؤسسة سميثسونيان يسألونهم عن كل ما لديهم أثناء الرحلة البشرية. لقد التهم هو وشقيقه أورفيل كل الأوراق والنظريات والحسابات من كبار الباحثين في مجال الطيران في عصرهم. لقد درسوا تصميمات الطائرات الشراعية لأوتو ليلينتال، والمبادئ الهندسية لأوكتاف تشانوت، وطاولات صامويل لانجلي بشأن الرفع والسحب.
ثم فعلوا شيئًا جذريًا: شككوا في كل ذلك.
عندما لم تعمل طائراتهم الشراعية كما تنبأت البيانات المنشورة، لم يفترض الأخوان رايت أنهم كانوا على خطأ. لقد بنوا نفق الرياح الخاص بهم واختبروا أكثر من 200 تصميم للأجنحة بأنفسهم. وما وجدوه بعد ذلك أذهلهم. كانت معاملات رفع ليلينتال – وهي الأرقام التي اعتمد عليها المجال بأكمله – خاطئة، وليس فقط بشكل طفيف. تماما، خطأ تماما.
لم يشكك الأخوان رايت في هذا من باب الغطرسة. كانوا يستخدمون المبادئ الأولى في التفكير. وهذا ما أحدث الفارق بين رحلتهم الأولى في عام 1903 ولانجلي – الذي كان لديه المزيد من التمويل والهيبة والموارد – حيث تحطمت طائرته في بوتوماك قبل تسعة أيام فقط.
يواجه علماء البيانات اليوم تحديًا مماثلاً. نحن محاطون بقواعد التشغيل والأطر وأفضل الممارسات – أدلة اختبار أ/ب، وتصنيفات المقاييس، وقوائم مراجعة اختيار النماذج. هذه الأدوات لا تقدر بثمن. ولكن تمامًا مثل جداول لانجلي، يمكن أن تؤدي بنا إلى الضلال عند تطبيقها بشكل أعمى.
إن علماء البيانات الأكثر استراتيجية الذين أعرفهم لا يختارون بين الأطر والمبادئ الأولى. يستخدمون كليهما. الأطر تعطي السرعة. المبادئ الأولى توفر الوضوح. ويعملون معًا على فصل منفذي المهام عن الشركاء الاستراتيجيين.
ما هو التفكير في المبادئ الأولى؟
إن التفكير بالمبادئ الأولى يعني تقسيم المشكلة إلى حقائقها الأساسية وإعادة البناء من الألف إلى الياء. وقد وصفها أرسطو بأنها إيجاد “الأساس الأول الذي يُعرف به الشيء”.
ومن الناحية العملية، يعني ذلك أن نسأل:
- ما الذي نعرف أنه صحيح تمامًا؟
- ماذا نفترض؟
- أي من هذه الافتراضات يمكننا تحديها؟
وهذا لا يعني رفض المعرفة الموجودة: فقد درس الأخوان رايت جميع الأبحاث المتاحة؛ إنهم لم يتعاملوا معه على أنه إنجيل.
وينطبق الشيء نفسه على علماء البيانات. الأطر عبارة عن خرائط، وهي اختصارات مثبتة عبر التضاريس المألوفة. المبادئ الأولى هي البوصلة، التي تبقينا متجهين عندما تصبح الخريطة ضبابية بعض الشيء.
لماذا يحتاج علماء البيانات إلى هذا الآن
الأطر موجودة في كل مكان في علم البيانات لسبب وجيه. فهي تساعدنا في إجراء التجارب وتحديد المقاييس وبناء النماذج بسرعة. لكن يمكنهم أيضًا خلق ثقة زائفة.
لقد رأيت فرقًا تجري اختبارات أ/ب لا تشوبها شائبة والتي أجابت على السؤال الخطأ. لقد رأيت مقاييس قياسية تنتج لوحات معلومات تبدو مثيرة للإعجاب ولكنها لا تقيس أي شيء ذي معنى. لم تحدث هذه الإخفاقات لأن الأطر كانت معيبة. لقد حدث ذلك لأنه لم يتوقف أحد لطرح أسئلة المبادئ الأولى: ما هو القرار الذي نحاول فعليًا الإبلاغ عنه؟ ما هي القيمة التي نحاول حقًا قياسها؟ هل نحن بحاجة إلى هذا المستوى من التعقيد؟
وهذا مهم أكثر من أي وقت مضى لأن الذكاء الاصطناعي يعمل على أتمتة تنفيذ جانب من علم البيانات. يستطيع Gen AI الاستعلام عن البيانات وإنشاء تصورات وتطبيق الأطر ببراعة. لكنها لا تستطيع أن تقرر ما إذا كنت تطرح السؤال الصحيح أم لا.
التفكير في المبادئ الأولى هو ما يميزك. إنها المهارة التي تحافظ على أطر العمل راسخة في الواقع، وقد أصبحت القدرة الأكثر قابلية للدفاع عن عالم البيانات الاستراتيجية.
حيث المبادئ الأولى تغير كل شيء
فيما يلي ثلاثة أمثلة حيث تم كتابة قواعد لعب علم البيانات بشكل جيد، ولكن اتباعها بشكل صارم دون وعي سيؤدي إلى نتائج سيئة.
ما وراء اختبارات A/B في الكتب المدرسية
يقول إطار العمل: حدد فرضيتك، وقم بتوزيع المستخدمين بشكل عشوائي، وقم بقياس مقياسك الأساسي، وتحقق من الأهمية. يعمل هذا بشكل مثالي، إذا كنت تطرح السؤال الصحيح.
لكن سؤال المبادئ الأول يأتي في وقت سابق: ما القرار الذي نحاول إبلاغه؟ ما هو عدم اليقين الذي نحاول حله؟
لقد نصحت ذات مرة فريقًا كان يختبر خوارزمية توصية جديدة. قال التفكير الإطاري: قم بتوزيع المستخدمين بشكل عشوائي، وقياس نسبة النقر إلى الظهور، وتشغيله لمدة أسبوعين. شحن الفائز.
لكن التوقف المؤقت عن المبادئ الأولى كشف عن شيء مختلف. لم نكن متأكدين بشأن النقرات، إذ أشارت الإشارات المبكرة إلى أنها سترتفع. لم نكن متأكدين مما إذا كانت هذه النقرات ستؤدي إلى تفاعل حقيقي أم مجرد ضجيج.
لذلك قمنا بتغيير ما قمنا بقياسه. بدلاً من النقرات، ركزنا على الزيارات المتكررة وعمق الجلسة والمشاركة طويلة المدى. النتيجة؟ أدت الخوارزمية الجديدة إلى زيادة النقرات بنسبة 12% ولكنها خفضت الزيارات المكررة بنسبة 8%. كان الإطار القياسي يقول “شحنها”. قال نهج المبادئ الأولى “ليس بعد”.
قررنا أن الخوارزمية الجديدة كانت “مثيرة للنقر” للغاية. أعطتنا الأطر المنهجية. المبادئ الأولى أعطتنا السؤال الصحيح.
ما الذي تقيسه مقاييسنا حقًا؟
تعتبر أطر المقاييس — North Star، وOKRs، وHEART — قوية لأنها توفر البنية. ولكن يمكنهم أيضًا خلق الوهم بأننا قمنا بقياس ما يهم.
يسأل التفكير في المبادئ الأولى: ما هو السلوك الأساسي أو القيمة التي نهتم بها؟ هل هذا المقياس يلتقطه بالفعل؟
فكر في المشاركة. تقترح العديد من أطر العمل DAU، أو طول الجلسة، أو الإجراءات لكل جلسة. وكلاء معقولون – لكن هل هم على حق؟
- بالنسبة لتطبيق التأمل، قد تبدو الجلسات الطويلة “أفضل”، ولكن الهدف الأساسي هو ممارسة مستدامة. قد يعني ذلك أقصر الجلسات مع مرور الوقت.
- بالنسبة لأداة التحليلات، قد يشير المزيد من الاستعلامات لكل مستخدم إلى استخدام أعمق، أو قد يعني أن المستخدمين يكافحون للعثور على إجابات. القيمة الحقيقية هي رؤى أسرع وأكثر استهدافًا.
لقد بدأت ذات مرة وظيفة جديدة ورثت لوحة تحكم تُعلن بكل فخر عن المستخدمين النشطين أسبوعيًا كمقياس النجاح الأساسي. ولكن عندما بحثت أكثر، أدركت أن معظم المستخدمين “النشطين” كانوا يسجلون الدخول وينظرون حولهم ويغادرون دون إكمال مهمة واحدة. ومن منظور المبادئ الأولى، قررت أن القيمة الحقيقية هي المهام المكتملة. وبمجرد أن قمت بتغيير المقياس، اكتشفنا (كما هو متوقع) أن الاستخدام كان أقل بكثير في ظل التعريف الجديد، ولكن الإطار الجديد قدم لنا الوضوح بشأن ما يجب التركيز عليه من أجل تحفيز التبني الهادف.
يمنحك الإطار قائمة بالمقاييس. يخبرك التفكير بالمبادئ الأولى ما إذا كان أي منها يعكس بالفعل قيمة منتجك. في بعض الأحيان يكون المقياس القياسي مثاليًا، لكنه في بعض الأحيان يكون مضللاً بشكل خطير.
عندما أنقذت المبادئ الأولى الإطلاق
أحد أوضح الأمثلة التي مررت بها جاء في وقت مبكر من مسيرتي المهنية عندما تم تكليف فريقي ببناء “نقاط جودة المستخدم” لمساعدة المبيعات في تحديد أولويات العملاء المحتملين.
كان نهج الإطار واضحًا: التعلم الخاضع للإشراف، والتنبؤ باحتمالية التحويل، والترتيب حسب النتيجة. كانت لدينا البيانات والميزات والمنهجية.
بعد مرور أسبوعين، وبينما كنا نكافح من أجل الحصول على درجات أداء أعلى بشكل تدريجي، سأل أحدهم: ما هو القرار الذي ستتخذه المبيعات بالفعل بهذه النتيجة؟
لقد طلبنا المبيعات. لم تكن الإجابة “أعطني احتمالات دقيقة”. كان: هل يجب أن أخصص الوقت والتخصيص للاتصال بهذا العميل المحتمل، أم مجرد إرسال بريد إلكتروني موحد سريع؟
هذا تحول كل شيء. لم نكن بحاجة إلى نموذج معقد يغطي نطاق الاحتمالات الكامل. لقد كنا بحاجة إلى مصنف بسيط وقابل للتفسير تم تحسينه حول عتبة واحدة.
من خلال إعادة الصياغة، انتقلنا من نموذج المجموعة إلى الانحدار اللوجستي، وأسقطنا نصف ميزاتنا، وشحننا أسرع بثلاثة أسابيع – وقدمنا شيئًا استخدمته المبيعات بالفعل.
وبالعودة إلى المبادئ الأولى، قمنا بتوضيح المشكلة الحقيقية ومن ثم عدنا إلى الأطر القياسية لبناء الحل.
البوصلة والخريطة
إليكم الدرس المستفاد: لا يختار علماء البيانات الاستراتيجية بين الأطر والمبادئ الأولى. إنهم يجمعونهم.
- الأطر هي رسم خريطة— فهي تتيح لك التحرك بسرعة والاستفادة من المعرفة المتراكمة.
- المبادئ الأولى هي بوصلة—إنها تبقيك محاذيًا عندما لا تظهر الخريطة مسارك بوضوح.
لم يرفض الأخوان رايت الأبحاث في عصرهما. لقد بنوا عليها، لكنهم عرفوا أيضًا متى يجب عليهم العودة إلى الأساسيات.
هذا هو التحول في العقلية الذي يفصل بين علماء البيانات الاستراتيجية وعلماء البيانات التكتيكية. لا يتعلق الأمر بمعرفة المزيد من الأساليب أو العمل بجدية أكبر. يتعلق الأمر بمعرفة متى تتبع الخريطة ومتى تتحقق من البوصلة.
وبتوجيه من الذكاء الاصطناعي، سيصبح تطبيق أطر العمل أسهل. لكن البوصلة هي ما عليك أن تبنيه. وهذا ما سيبقيك ملائمًا واستراتيجيًا ولا غنى عنه في السنوات المقبلة.
وهذا أحد المواضيع الأساسية التي أستكشفها في كتابي الجديد، عالم البيانات الاستراتيجية: المستوى الأعلى والازدهار في عصر الذكاء الاصطناعي (رابط الأمازون التابع). يتعلق الأمر بإقران التفكير التأسيسي مع أطر العمل التي أثبتت جدواها لإحداث التأثير، والتأثير على خرائط الطريق، ووضع نفسك كشريك استراتيجي – وليس مجرد منفذ تقني.
إذا كنت تتساءل كيف ستتغير وظيفتك عندما يصبح الذكاء الاصطناعي أكثر قدرة، أو ببساطة أتطلع إلى الحصول على تأثير أكبر كعالم بيانات وإحراز تقدم نحو الترقية, من فضلك قم بمراجعة الكتاب على أمازون!