شرکت OpenAI دیگر چت‌های حذف‌شده کاربران را ذخیره نمی‌کند

شرکت OpenAI که سازنده مدل‌های زبانی بزرگ و خدمات مبتنی بر هوش مصنوعی است، پس از یک منازعه حقوقی طولانی با روزنامه نیویورک‌تایمز، دیگر مجبور به «ذخیرهٔ مادام‌العمر» چت‌های حذف‌شده کاربران نیست. این الزام قضایی در پی شکایتی که در دسامبر ۲۰۲۳ مطرح شد، ابتدا شرکت را ملزم کرد تمام لاگ‌های چت از جمله پیام‌های حذف‌شده را برای بررسی‌های حقوقی نگه دارد. رسانه‌ها از جمله Ars Technica آن تصمیم را گسترده و اثرگذار بر حریم خصوصی «صدها میلیون کاربر» توصیف کردند.

در ماه ژوئن، برد لایت‌کپ (Brad Lightcap)، مدیر عملیات OpenAI، این دستور را حمله به حریم خصوصی کاربران خواند و آن را «درخواست وسیع و غیرضروری» توصیف کرد. اما جدیدترین گزارش‌ها حاکی است که قاضی ایالات متحده، اوینا وانگ (Ona Wang)، روز پنج‌شنبه با توافق مشترک میان OpenAI و نیویورک‌تایمز موافقت کرده و دستور حفظ دائمی داده‌ها را لغو کرده است؛ بدین‌معنا که شرکت اکنون می‌تواند چت‌هایی که کاربران قبلاً حذف کرده‌اند را پاک کند.

با این حال، پرونده هنوز تمام نشده است: لاگ‌های قبلاً حفظ‌شده همچنان در اختیار خبرگزاری‌ها و شاکیان پرونده برای بررسی‌های مربوط به احتمال تخلف از حق نشر قرار دارد. هدف بررسی‌ها یافتن نمونه‌هایی از خروجی‌های چت‌بات است که ممکن است به آثار دارای حق نشر مربوط شوند یا به اشتباه به منابع خبری نسبت داده شوند.

پیش‌زمینه علمی و پیامدها برای هوش مصنوعی

هوش مصنوعی مولد و یادگیری ماشین معمولاً از «داده‌های آموزشی» بزرگ شامل متن‌های عمومی و خصوصی برای آموزش مدل‌ها استفاده می‌کنند. اختلافات حقوقی اخیر حول این محور است که آیا استفاده از مقالات خبری و محتوای دارای حق نشر برای آموزش مدل‌ها مصداق نقض حق نشر است یا خیر. این موضوع برای فناوری‌های مرتبط با پردازش زبان طبیعی (NLP) و مدل‌های زبانی بزرگ اهمیت کلیدی دارد، زیرا تعیین حدود قانونی می‌تواند نحوه گردآوری و نگهداری داده‌ها را تغییر دهد.

داده‌های آموزشی و حقوق نشر

مسئله حقوق نشر در یادگیری ماشین ترکیبی از قوانین فنی و حقوقی است: از یک سو، توسعه‌دهندگان برای بهبود عملکرد مدل‌ها نیازمند مجموعه‌های دادهٔ عظیم‌اند؛ از سوی دیگر، دارندگان آثار (مانند روزنامه‌ها) نگرانند که خروجی مدل‌ها حقوق آن‌ها را نقض کند یا اطلاعات نادرست به نام آن‌ها منتشر شود. این پرونده‌ها عملاً در حال شکل‌دهی سکه‌ای جدید از «قوانین آموزش داده» در عصر هوش مصنوعی هستند.

پیامدها و چشم‌انداز

لغو دستور حفظ دائمی داده‌ها برای حریم خصوصی کاربران خبر خوبی است، اما نزاع حقوقی بر سر حق نشر همچنان ادامه دارد و می‌تواند قواعد جدیدی برای دسترسی به داده‌ها، شفافیت در نمایه‌سازی (indexing)، و حفظ لاگ‌ها وضع کند. در کوتاه‌مدت، شرکت‌های فعال در حوزه هوش مصنوعی باید هر دو جنبهٔ فنی و حقوقی را مدنظر قرار دهند: مدیریت داده‌ها، مستندسازی منابع آموزشی و پیاده‌سازی راهکارهایی برای کاهش خطر خروجی‌های مغایر با حقوق نشر یا اطلاعات نادرست.

اگرچه OpenAI دیگر ملزم به نگهداری مادام‌العمر چت‌های حذف‌شده نیست، پرونده‌های قضایی پیرامون حق نشر و آموزش مدل‌های هوش مصنوعی همچنان ادامه دارد و آیندهٔ قوانین مرتبط با داده‌های آموزشی و حریم خصوصی در عمل مشخص خواهد شد. این روند حقوقی می‌تواند تاثیر چشمگیری بر نحوهٔ توسعه و بهره‌برداری از فناوری‌های هوش مصنوعی و یادگیری ماشین داشته باشد.

پیش‌زمینه علمی و پیامدها برای هوش مصنوعی

داده‌های آموزشی و حقوق نشر

پیامدها و چشم‌انداز

نوشته‌های مرتبط

دیدگاه‌ خود را بنویسید لغو پاسخ