ताजा रिपोर्ट्स के अनुसार, इन कंपनियों ने अपने नवीनतम AI सिस्टम को प्रशिक्षित करने के लिए ऑनलाइन जानकारी जुटाने के दौरान कई असंवैधानिक तरीके अपनाए।
इन रिपोर्ट्स में बताया गया है कि कंपनियों ने कॉर्पोरेट नीतियों को दरकिनार कर दिया, अपने स्वयं के नियमों को तोड़-मरोड़कर लागू किया और यहां तक कि कॉपीराइट कानून को ताक पर रखने पर भी चर्चा की। उदाहरण के लिए, एक मामले में OpenAI ने यूट्यूब वीडियो के ऑडियो को टेक्स्ट में बदलने के लिए एक टूल बनाया, जिससे उन्हें भारी मात्रा में वार्तालाप संबंधी डेटा मिल गया। यह यूट्यूब की नीतियों के उल्लंघन का संभावित मामला है, क्योंकि वीडियो क्रिएटर्स को उनकी सामग्री के इस्तेमाल पर कॉपीराइट होता है।
इन तरीकों को अपनाने के पीछे मुख्य वजह यह है कि टेक्नॉलॉजी कंपनियां बड़ी मात्रा में उच्च-गुणवत्ता वाले डेटा की लगातार भूखी रहती हैं। मौजूदा रुझानों को देखते हुए, अनुमान लगाया जा रहा है कि 2026 तक कंपनियां जितना डेटा जेनरेट करेंगी, उससे कहीं ज्यादा तेजी से उसका इस्तेमाल कर रही हैं।
यह खुलासा एआई के विकास के लिए उठाए जाने वाले नैतिक सवालों को भी सामने लाता है। डेटा संग्रह के ऐसे तरीके न केवल कॉपीराइट कानूनों का उल्लंघन करते हैं, बल्कि उपयोगकर्ताओं की निजता के अधिकार पर भी सवाल खड़े करते हैं।