Yapay zeka teknolojisinin günümüzdeki hızlı gelişimi, şaşırtıcı bir şekilde, milyonlarca görünmez ve düşük ücretli işçilerin yoğun emeklerine dayanmaktadır. ChatGPT gibi gelişmiş dil modelleri veya Google’ın ileri düzey görüntü tanıma algoritmaları, ilk etapta gerçek insanlar tarafından eğitilmektedir. Bu eğitimin temelinde, dünyanın farklı ülkelerinden, özellikle Kenya, Filipinler, Hindistan ve Venezuela gibi yerlerden toplanan, binlerce hatta milyonlarca çalışanın yaptığı manuel veri etiketleme işlemleri yatmaktadır.
Yapay zeka sistemleri, kendi başına karmaşık kavramları anlamakta veya nüansları ayırt etmekte yetersiz kalmaktadır. Nefret söylemini ironiden ayırmak veya bir kediyi bir köpekte tanımlamak gibi görevler için, sistemlerin önüne milyonlarca önceden tanımlanmış veri seti konulması gerekmektedir. Bu veri setlerinin oluşturulması sürecinde, ekran karşısında günde on hatta ondan fazla saat çalışan işçiler, dev operasyon merkezlerinde yoğun bir şekilde çalışmaktadır.
Bu işçiler, görsellerdeki nesneleri tek tek işaretlemekten, metinlerin duygusal tonunu belirlemekten veya internetten toplanan ham verilerdeki hataları ayıklamaktan sorumlu tutulmaktadır. Teknoloji şirketleri bu sürece “veri etiketleme” adını vererek, bu işlemin yapay zeka modellerinin işlevsel hale gelmesi için olmazsa olmaz olduğunu savunmaktadır.
OpenAI, Google ve Meta gibi büyük şirketler, bu devasa iş gücünü doğrudan istihdam etmek yerine genellikle taşeron firmalar aracılığıyla bu operasyonları yürütmektedir. Kenya merkezli Sama veya küresel ölçekte faaliyet gösteren Appen gibi şirketler, Silikon Vadisi’ndeki teknoloji devlerine bu hizmeti sunmaktadır. Bu kamplarda çalışan işçiler, genellikle saatlik 1,5 ila 2 dolar gibi oldukça düşük ücretlerle çalışmakta ve bazen yerel asgari ücretin bile altında kalan rakamlarla geçinmektedir.
ChatGPT’nin güvenli bir şekilde piyasaya sürülmesinden önce, Kenya’daki işçiler on binlerce sayfalık çocuk istismarı, cinayet ve cinsel şiddet içeren metinleri tek tek okuyup etiketlemekle görevlendirilmişlerdir. Bu sayede yapay zeka, hangi içeriklerin toksik olduğunu öğrenmiş ve son kullanıcıya bu tür yanıtlar vermemeyi alışkanlık haline getirmiştir.
Yapay zeka sektörünün milyarlarca dolarlık bir endüstriye dönüşmesiyle birlikte, bu sistemlerin temelini oluşturan veriyi temizleyen ve anlamlandıran kişilerin teknoloji dünyasının en alt basamağında yer aldığı görülmektedir. İnsan emeği olmadan, yapay zekanın “zeki” olduğu iddia edilen yetenekleri anlamsız bir kod yığınına dönüşecektir. Yapay zekanın sözde zekası, aslında dünyanın yoksul bölgelerindeki milyonlarca insanın sabır ve emeğinin bir sonucudur. Büyük dil modelleri geliştikçe, ihtiyaç duyulan veri miktarı ve bu verinin kalitesi de artmaya devam edecektir. Bu durum, etiketleme kamplarındaki iş yükünü her geçen gün daha da artırmaktadır. Yapay zeka, her ne kadar daha akıllı gibi görünse de, aslında arkasındaki devasa insan ordusu, dünyayı daha detaylı ve hatasız bir şekilde tarif etmeye devam etmektedir.
