بيانات التدريب قيد التجربة: أول اختبار للاستخدام العادل للذكاء الاصطناعي – IPWatchdog.com


“تقوم المحاكم بتكييف مبدأ الاستخدام العادل المرن مع التكنولوجيا الحديثة دون إعادة كتابة النظام الأساسي.”

في عام 2025، واجهت ثلاث محاكم فيدرالية أخيرًا سؤالًا ظل يحوم حول الذكاء الاصطناعي لسنوات: هل يمكن للآلات أن تتعلم بشكل قانوني من الأعمال المحمية بحقوق الطبع والنشر؟ كل رأي —طومسون رويترز ضد روس إنتليجنس, بارتز ضد الأنثروبي، و قادري ضد منصات ميتا– تطبيق اختبار الاستخدام العادل المكون من أربعة عوامل بموجب 17 USC §107 على التدريب النموذجي واسع النطاق. وهي تشكل معًا أول إطار حقيقي لتقييم كيفية تفاعل حقوق الطبع والنشر مع التعلم الآلي.

تشير النتائج إلى مبدأ واحد: عندما يعيد تدريب الذكاء الاصطناعي إنتاج وظيفة السوق لعمل محمي بحقوق الطبع والنشر، فإنه يفشل في الاستخدام العادل. عندما يكون التدريب تحليليًا، أي باستخدام الأعمال كبيانات بدلاً من التعبير، فإنه ينجح. تشير الحالات التالية إلى المكان الذي ترسم فيه المحاكم الآن هذا الخط.

1. روس المخابرات: النسخ للمنافسة

في طومسون رويترز ضد روس إنتليجنس (D. Del. 2025)، اتهم ويستلو روس باستخدام نظام العناوين الرئيسية والأرقام الرئيسية لتدريب الذكاء الاصطناعي البحثي القانوني المتنافس. أنشأ مقاول روس، LegalEase، أكثر من 25000 “مذكرات مجمعة” مبنية على محتوى Westlaw. أصبحت هذه المذكرات بمثابة مجموعة تدريبات روس، مما سمح للذكاء الاصطناعي بإرجاع النتائج التي تحاكي ملخصات ويستلو والتسلسل الهرمي للموضوعات.

وجد القاضي ستيفانوس بيباس أن سلوك روس تجاوز التعلم. قامت الشركة “ببناء منتجها المنافس باستخدام المذكرات المجمعة، والتي تم بناؤها بدورها من ملاحظات Westlaw الرئيسية.” وكان هذا التداخل الوظيفي حاسما.

تحليل الاستخدام العادل لأربعة عوامل من Bibas

  1. الغرض والشخصية. ورأت المحكمة أن نسخ روس كان تجاريًا وليس تحويليًا. خدم نظامها نفس غرض Westlaw، وهو البحث القانوني، واستهدف نفس العملاء. حالات النسخ المتوسطة مثل جوجل ضد أوراكل أو سوني ضد كونيكتيكس لم يتم تطبيقه لأن استخدام روس كان تنافسيًا وليس قائمًا على التوافق.
  2. طبيعة العمل. كانت عناوين ويستلو عبارة عن ملخصات تحريرية إبداعية، وليست حقائق أولية. هذا العامل يزن ضد الاستخدام العادل.
  3. المبلغ والجوهر. وعلى الرغم من أن روس نسخ آلاف العناوين الرئيسية، إلا أن المحكمة ركزت على ما تلقاه الجمهور في نهاية المطاف. نظرًا لأن الذكاء الاصطناعي لم يعرض العناوين الرئيسية مباشرةً، فقد فضل هذا العامل روس قليلًا.
  4. تأثير السوق. ووصف القاضي بيباس هذا العامل بأنه “العامل الأكثر أهمية”. تنافس نموذج روس بشكل مباشر مع سوق الاشتراكات في Westlaw، متغلبًا على أي مطالبة بالاستخدام العادل.

حصيلة

ثلاثة من أربعة عوامل – الغرض، والطبيعة، وتأثير السوق – كانت ضد روس. أما العامل الثالث فقط فهو الذي قدم الدعم الجزئي. وكانت النتيجة واضحة ومباشرة: استخدام قاعدة بيانات خاصة بمنافس لبناء منتج بديل يعد انتهاكا، وليس ابتكارا. روس يرسي الآن الحد المسموح به للتدريب على الذكاء الاصطناعي.

2. بارتز ضد الأنثروبي: عندما يكون التعلم تحويليا

وبعد بضعة أشهر فقط، توصل القاضي ويليام أوريك إلى نتيجة معاكسة بارتز ضد لجنة البرنامج والميزانية الأنثروبي (ND كال. 2025). زعم المؤلفون أن نماذج كلود من شركة Anthropic قامت بنسخ كتبهم من “مكتبات الظل” أثناء التدريب. أجاب أنثروبيك أن عملية التدريب استخرجت أنماطًا إحصائية حول اللغة والأسلوب. ولم تقم بتخزين أو إخراج المحتوى التعبيري للكتب.

تحليل الاستخدام العادل للعوامل الأربعة لأوريك

  1. الغرض والشخصية. أطلق أوريك على العامل الأول اسم “مركز الثقل” في الحالات التكنولوجية. كان استخدام كلود بمثابة “تحويل جوهري” لأن النظام قام بتحويل النص التعبيري إلى أوزان رقمية. ومثل الكاتب الذي يدرس العديد من الكتب قبل إنشاء كتب جديدة، تعلم النموذج البنية اللغوية بدلاً من إعادة إنتاج التعبير. على الرغم من أن عمل أنثروبيك كان تجاريًا، إلا أن الغرض التحويلي يفوق هذا الاهتمام.
  2. طبيعة العمل. كانت روايات المدعين إبداعية، وهو ما يعارض عادة الاستخدام العادل، لكن المحكمة أعطت هذا العامل وزنًا قليلًا لأن الاستخدام كان تحليليًا وليس تعبيريًا.
  3. المبلغ والجوهر. قامت أنثروبيك بنسخ الأعمال بالكامل، لكن المحكمة وجدت أن ذلك ضروري لتحقيق الهدف التحويلي. كان من الممكن أن يؤدي النسخ الجزئي إلى شل قدرة النموذج على تعلم بناء الجملة والدلالات. نظرًا لأن النظام لم يعرض الأعمال للمستخدمين، فقد فضل العامل الثالث الأنثروبي.
  4. تأثير السوق. ولم يقدم المدعون أي دليل تجريبي على أن كلود أزاح مبيعات كتبهم أو أضر بأي سوق ترخيص حالية. ورفض أوريك أسواق “ترخيص بيانات التدريب” الافتراضية باعتبارها أسواقا تخمينية أكثر من اللازم. ومع عدم وجود دليل على الاستبدال، فإن هذا العامل “يرجح بشدة لصالح الأنثروبي”.

حصيلة

ثلاثة من أربعة عوامل – الغرض، والكمية، وتأثير السوق – فضلت الأنثروبولوجي. العامل الثاني لم يكن له أهمية كبيرة. أصدر القاضي أوريك حكمًا مستعجلًا للشركة، معتبرًا أن استخدام الأعمال المحمية بحقوق الطبع والنشر كمدخل للتعلم التحليلي يعتبر استخدامًا عادلاً. بارتز وهكذا أنشأ أول اعتراف فيدرالي بالتدريب النموذجي واسع النطاق باعتباره استخدامًا تحويليًا.

3. قدري ضد ميتا: تم تأكيد الوظيفة التحويلية

بعد يومين بارتزأصدر القاضي فينس تشابريا رأيًا مصاحبًا في قادري ضد شركة Meta Platforms Inc. (ND كال. 2025). زعم المؤلفون، بما في ذلك ريتشارد كادري وسارة سيلفرمان، أن شركة Meta قامت بتدريب نماذج LLaMA 2 و3 على نسخ مقرصنة من رواياتهم. اعترف ميتا بأنه تم استيعاب الأعمال الكاملة، لكنه جادل بأن التدريب كان تحليليًا بحتًا: حيث استخرجت النماذج أنماطًا لغوية وأنتجت نصًا جديدًا، وليس نسخًا.

الاستخدام العادل لتشهابريا، تحليل العوامل الأربعة

  1. الغرض والشخصية. ووجد القاضي تشابريا أن غرض ميتا “جديد ومختلف تمامًا”. إن تدريب LLaMA على الكتب علمه العلاقات بين الكلمات وبناء الجملة – وهو نفس المنطق المعتمد في بارتز. وقارن العملية بـ كتب جوجل، حيث كان مسح الأعمال بأكملها لتمكين البحث بمثابة تحويل. وعلى الرغم من أن ميتا استفادت من النماذج الناتجة، إلا أن التدريب نفسه خدم غرضًا تعليميًا غير تعبيري. العامل الأول فضل ميتا.
  2. طبيعة العمل. كانت روايات المدعين إبداعية، لكن المحكمة وجدت أن الإبداع “تضاءل من أهميته” لأن النسخ استهدف الهياكل اللغوية، وليس التعبير. كان لهذا العامل تأثير طفيف على ميتا ولكنه كان يحمل وزنًا قليلًا.
  3. المبلغ والجوهر. كان النسخ الكامل «ضروريًا من الناحية التكنولوجية». تحتاج النماذج إلى سياق كامل لتعلم الأنماط. نظرًا لأن المستخدمين لم يتلقوا أبدًا نصًا معبرًا، فقد فضل الجزء الثالث Meta.
  4. تأثير السوق. فشل المدعون في إظهار المبيعات المفقودة أو الاستبدال القابل للقياس. وكانت نظريتهم القائلة بأن الخيال الناتج عن الذكاء الاصطناعي يخفف الطلب هي “تكهنات غير مدعومة”. كما رفضت المحكمة الاعتراف بسوق افتراضية لبيانات التدريب. العامل الرابع يفضل ميتا.

حصيلة

هناك ثلاثة عوامل تدعم الاستخدام العادل، أحدهما كان محايدًا. قادري عززت بارتز: يعد الاستيعاب التحليلي للأعمال المحمية بحقوق الطبع والنشر للتعلم الآلي بمثابة تحويل ومسموح به عندما لا يكون هناك ضرر في السوق. ومع صدور حكمين متسقين من المنطقة الشمالية في كاليفورنيا، أشارت المحاكم إلى إجماع متزايد حول شرعية التدريب المبني على البيانات.

الأنماط العقائدية عبر الثلاثية

ورغم أن كل محكمة طبقت نفس العوامل القانونية الأربعة، إلا أن النتائج تباينت حول محور بسيط: روس استبدال المعنية؛ بارتز و قادري التعلم المتضمن. ومن خلال هذه القرارات، تشكل العديد من المبادئ التوجيهية الآن مشهد الاستخدام العادل للذكاء الاصطناعي.

التحول يعتمد على الوظيفة

تركز المحاكم الآن على ما النسخ يفعل، وليس كيف ذلك يبدو. عندما يستوعب النظام أعمالًا تعبيرية لحساب العلاقات الإحصائية بدلاً من إعادة إنتاج النص، يكون الغرض تحويليًا. روس فشلت في هذا الاختبار لأن الذكاء الاصطناعي الخاص بها أدى نفس وظيفة البحث التي قام بها Westlaw. بارتز و قادري تم تمريرها لأن نماذجهم استخدمت الكتب كبيانات لغوية، وليس كبدائل في السوق.

النسخ الوسيط يمكن أن يكون قانونيًا

التالي جوجل ضد أوراكل و سوني ضد كونيكتيكستقبل المحاكم النسخ الكامل عندما يكون ذلك ضروريًا من الناحية التكنولوجية وغير معبر. يجب ألا يتلقى المستخدم النهائي مطلقًا المحتوى المحمي. بعد الدعوى، على حد سواء بارتز ضد الأنثروبي و قدري ضد ميتا تعامل مع العرض بالجملة على أنه نسخ وسيط مقبول. “يتطلب ضرر السوق أدلة

وكرر كل قرار أن العامل الرابع هو المهيمن. وأسواق الترخيص المضاربة أو المخاوف العامة من التخفيف غير كافية. بدون دليل تجريبي على الاستبدال، يسود الاستخدام العادل. روس عرضت منافسة ملموسة؛ بارتز و قادري لم يفعل ذلك.

لا يزال الإبداع مهمًا، ولكن بدرجة أقل

تظل الطبيعة الإبداعية للروايات أو الملخصات التحريرية ذات صلة ولكنها لم تعد حاسمة. وفي السياقات التحليلية أو الوظيفية، تتعامل المحاكم مع الإبداع باعتباره عاملاً ضعيفًا يؤدي إلى التحول وتحليل السوق.

حدود جديدة للاستخدام العادل

ترسم الثلاثية بشكل جماعي حدودًا عملية. إن تدريب الذكاء الاصطناعي الذي يتنافس مع منتج محمي بحقوق الطبع والنشر سيفشل في الاستخدام العادل. من المرجح أن ينجح التدريب الذي يتعلم من العمل على توليد مخرجات جديدة غير بديلة.

يتوافق هذا التمييز مع وارهول و جوجل ضد أوراكل: التحول يتحول على الغرض، وليس على الوسيط. التغيير من النص إلى الخوارزمية لا يهم إلا إذا أدى إلى تغيير وظيفة. عند نسخ التعبير مرة أخرى إلى بيانات للحساب، تتباعد هذه الوظيفة بما يكفي لتبرير الاستخدام العادل.

بالنسبة للمطورين، تسلط هذه الحالات الضوء على الحاجة إلى توثيق كيفية الحصول على بيانات التدريب واستخدامها. إن الاحتفاظ بسجلات واضحة تفصل بين الاستخدام التحليلي والاستنساخ التعبيري سيعزز الدفاعات المستقبلية. بالنسبة لأصحاب الحقوق، تتمثل الرسالة في التركيز على الضرر الذي يمكن إثباته في السوق بدلاً من نظريات الترخيص المضاربة.

ماذا يأتي بعد ذلك

قرارات 2025 هي الفصل الأول وليست الكلمة الأخيرة. هناك ثلاثة تطورات سوف تشكل ما يلي.

  1. تحليل السوق المبني على الأدلة. سيحتاج المدعون إلى دليل ملموس على الاستبدال أو الخسارة القابلة للقياس لتحدي تدريب الذكاء الاصطناعي. وقد أوضحت المحاكم أن التخمين بشأن الضرر المستقبلي لن يكون كافيا.
  2. متطلبات الشفافية. القضاة في بارتز و قادري وأشار كلاهما إلى قيمة الوثائق الفنية. توقع معارك اكتشاف مستقبلية حول مصدر مجموعة البيانات، والتصفية، واختبار المخرجات لإثبات ما إذا كان النسخ غير معبر حقًا.
  3. التدوين التشريعي المحتمل. لقد فتح مكتب حقوق الطبع والنشر قواعد وضع القواعد بشأن الذكاء الاصطناعي وبيانات التدريب. وقد يميز الكونجرس في النهاية بين النسخ “التحليلي” والنسخ “التعبيري”، وهو ما يعكس منطق المحاكم.

وحتى ذلك الحين، توفر هذه الحالات قاعدة العمل الأساسية لعام 2026 وما بعده:

الأفكار النهائية

والخلاصة هنا هي أن التحول يحمي التعلم؛ الاستبدال يدعو إلى المسؤولية. تعمل المحاكم على تكييف مبدأ الاستخدام العادل المرن مع التكنولوجيا الحديثة دون إعادة كتابة النظام الأساسي. ومع تحول الذكاء الاصطناعي إلى جزء لا يتجزأ من العمل الإبداعي والتحليلي، فإن المبدأ الناشئ يكافئ الشفافية والإثبات على حساب المضاربة. لقد بدأ القانون في تحقيق التوازن بين الابتكار والتأليف، وذلك من خلال السؤال عن ماهية الآلة يفعل مع الأعمال التي يقرأها.

مصدر الصورة: إيداع الصور
معرف الصورة: 799061332
المؤلف بيانكو بلو

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

زر الذهاب إلى الأعلى