منتقدان نگرانیهایی را در مورد استفاده شرکتها از اطلاعات ارسال شده به صورت آنلاین برای آموزش مدلهای زبان بزرگ خود برای استفاده از هوش مصنوعی ایجاد کردهاند. اخیراً، یک طرح دعوای گروهی پیشنهادی علیه OpenAI تنظیم شد که آن را متهم به حذف “مقدار عظیم داده های شخصی از اینترنت”، از جمله “اطلاعات خصوصی دزدیده شده” برای آموزش مدل های GPT بدون رضایت قبلی می کند. مانند مجله موتور جستجو توجه داشته باشید، احتمالاً در آینده شاهد شکایت های مشابه زیادی خواهیم بود زیرا شرکت های بیشتری محصولات هوش مصنوعی تولیدی خود را توسعه می دهند.
صاحبان وبسایتهایی که میتوان آنها را میدانهای عمومی در عصر دیجیتال در نظر گرفت نیز اقداماتی را برای جلوگیری یا سود بردن از رونق هوش مصنوعی انجام دادهاند. Reddit شروع به دریافت هزینه برای دسترسی به API خود کرده است و باعث میشود تا مشتریان شخص ثالث در آخر هفته تعطیل شوند. در همین حال، توییتر محدودیتی برای تعداد توییتهایی که کاربر در روز میبیند برای «مقابله با سطوح شدید خراش دادهها» تعیین کرده است. [and] دستکاری سیستم.”
گوگل
گوگل سیاست حفظ حریم خصوصی خود را به روز کرده است تا اعلام کند که می تواند از داده های در دسترس عموم برای کمک به آموزش مدل های هوش مصنوعی خود استفاده کند. این غول فناوری در آخر هفته متن سیاست خود را تغییر داده و «مدلهای هوش مصنوعی» را به «مدلهای زبانی» تغییر داده است. همچنین اعلام کرد که میتواند از اطلاعات در دسترس عموم برای ساختن ویژگیها، بلکه محصولات کاملی مانند «قابلیتهای Google Translate، Bard و Cloud AI» استفاده کند. با بهروزرسانی خطمشیهای خود، به مردم اطلاع میدهد و به وضوح نشان میدهد که هر چیزی که به صورت عمومی به صورت آنلاین پست میکنند، میتواند برای آموزش بارد، نسخههای آینده آن و هر محصول مولد هوش مصنوعی دیگری که Google توسعه میدهد استفاده شود.
این غول فناوری تغییرات سیاست حفظ حریم خصوصی خود را در آرشیو خود برجسته کرده است، اما در اینجا یک کپی از بخش مربوطه آمده است: