Новий сірий сектор: Тисячі людей у всьому світі продають своє навчання ШІ, але якою є ціна?

CryptoCity

Глобально тисячі людей продають свій голос, обличчя та записи дзвінків, годують AI в обмін на прибуток, але беруть на себе ризики глибоких підробок та незворотних ліцензій.

Глибокий огляд: розслідування британської газети «Гардіан» виявило швидко зростаючу сіру індустрію: тисячі людей у всьому світі заробляють на навчанні AI, продаючи свій голос, обличчя, записи дзвінків та повсякденні відео. Це не просто загальна дискусія про конфіденційність, а розслідування з реальними людьми, реальними сумами та реальними наслідками — актор, який продав своє обличчя, пізніше побачив «себе» на Instagram, що рекламує невідомий медичний продукт, а в коментарях хтось оцінює його «зовнішність». Коли спрага даних AI-компаній поєднується з глобальною економічною нерівністю, це створює неравноправну угоду.

Текст повністю:

Минулого року одного ранку Джейкобус Лоу, що живе в Кейптауні, звично вийшов на прогулянку, під час якої годував чайок. Але цього разу він записав кілька відео — знімаючи свої кроки та огляд під час прогулянки. Це відео принесло йому 14 доларів, що приблизно в 10 разів перевищує мінімальну зарплату в країні, і дорівнює витратам на їжу цього 27-річного молодика за півтижня.

Це була «міська навігація» завдання, виконане на Kled AI. Kled AI — це додаток, який платить користувачам за завантаження фотографій, відео та інших даних для навчання AI-моделей. За всього кілька тижнів, завантажуючи фотографії та відео з повсякденного життя, Лоу заробив 50 доларів.

За тисячі миль відстані, в Індії, в місті Ранчи, 22-річний студент Сахіл Тігга регулярно заробляє на Silencio — додатку, що використовує краудсорсинг аудіоданих для навчання AI, який отримує доступ до мікрофона його телефону, збираючи фонові шуми з ресторанів або завантажених перехресть. Він також завантажує записи свого голосу. Сахіл спеціально відвідує унікальні місця, наприклад, лобі готелів, які ще не зафіксовані на карті Silencio. Він заробляє більше 100 доларів на місяць, що достатньо для покриття всіх витрат на харчування.

У Чикаго 18-річний учень зварювальника Рамеліо Хілл продав приватні записи дзвінків зі своїми друзями та родиною компанії Neon Mobile — платформі для навчання розмовного AI, яка платить 0,50 долара за хвилину — заробивши кілька сотень доларів. Для Хілла все просто: він вважає, що технологічні компанії вже мають велику кількість його особистих даних, і чому б йому не отримати частину цього.

Ці «фрілансери навчання AI» — завантажуючи навколишні сцени, свої фотографії, відео та аудіо — перебувають на передовій глобального нового «золотої лихоманки» даних. Оскільки Кремнієва долина прагне до високоякісних людських даних понад те, що можна зібрати з відкритої мережі, виникає процвітаюча індустрія ринку даних, що заповнює цю прогалину. Від Кейптауна до Чикаго тисячі людей надають свої біометричні дані та особисту інформацію новому поколінню AI.

Але ця нова економіка фрілансерів має свою ціну. За кілька доларів ці тренери фактично постачають паливо для індустрії, яка, можливо, зрештою зробить їхні навички застарілими, одночасно піддаючи себе ризикам глибоких підробок, крадіжки особистості та цифрової експлуатації — про які вони тільки починають усвідомлювати.

Дайте AI механізмам продовжувати працювати

Моделі AI, такі як ChatGPT і Gemini, потребують величезних навчальних матеріалів для постійного покращення, але вони стикаються з браком даних. Найбільш популярні джерела навчальних даних — C4, RefinedWeb і Dolma — займають чверть найвищих якісних наборів даних в Інтернеті, і тепер обмежують генеративні AI-компанії у використанні своїх даних для навчання моделей. Дослідники оцінюють, що AI-компанії найшвидше в 2026 році вичерпають доступні свіжі високоякісні тексти. Хоча деякі лабораторії вже почали використовувати синтетичні дані, згенеровані самим AI, для зворотного навчання, цей рекурсивний процес призводить до того, що моделі виробляють багато помилкових «сміття», що призводить до краху.

Джерело: The Guardian

Такі додатки, як Kled AI та Silencio, з’являються саме тут. У цих ринках даних мільйони людей годують та навчають AI, продаючи свої дані особи. Окрім Kled AI, Silencio та Neon Mobile, у тренерів AI є багато інших варіантів: Luel AI, що підтримується відомим інкубатором Y-Combinator, отримує багатомовні розмовні матеріали приблизно за 0,15 долара за хвилину; ElevenLabs дозволяє вам цифрово клонувати свій голос і надавати іншим за базовою ставкою 0,02 долара за хвилину.

Професор економіки Кінгс-коледжу в Лондоні Боуке Кляйн Тіселінк зазначає, що фрілансери навчання AI — це нова категорія роботи, яка значно зросте.

AI-компанії знають, що виплата людям за ліцензію на дані допомагає уникнути потенційних авторських суперечок, пов’язаних з повною залежністю від контенту, зібраного з Інтернету, каже Тіселінк. Дослідник AI Венямін Веселовський зазначає, що ці компанії також потребують високоякісних даних, щоб моделювати нову, вдосконалену поведінку системи. «На даний момент людські дані є золотим стандартом для вибірки з розподілу моделі», — додає Веселовський.

Люди, що керують цими машинами — особливо в країнах, що розвиваються — часто потребують цих грошей і майже не мають іншого вибору. Для багатьох фрілансерів навчання AI виконання цієї роботи є практичною відповіддю на економічну нерівність. У країнах з високим рівнем безробіття та знецінення національної валюти заробіток у доларах часто більш стабільний і вигідний, ніж місцева робота. Деяким важко знайти початкову роботу, тому вони змушені займатися навчанням AI для виживання. Навіть у більш заможних країнах зростання вартості життя робить продаж себе логічним фінансовим вибором.

AI-тренер Лоу в Кейптауні добре усвідомлює ціну конфіденційності. Хоча його дохід нестабільний і не покриває всіх його місячних витрат, він готовий прийняти ці умови заради заробітку. Він багато років страждає від неврологічного захворювання, не може знайти роботу, але гроші, зароблені на ринку даних AI (включаючи Kled AI), дозволили йому накопичити 500 доларів і записатися на курс з масажу.

«Як південноафриканець, отримувати долари коштує більше, ніж багато хто може собі уявити», — говорить Лоу.

Професор географії Інтернету Оксфордського університету та автор книги «Годування машин» Марк Грем визнає, що для людей з країн, що розвиваються, ці гроші можуть мати практичне значення в короткостроковій перспективі, але застерігає: «Структурно ця робота є нестабільною, не має можливостей для зростання і фактично є безвихіддю».

Грем додає, що ринок даних AI залежить від «конкуренції за зниження заробітної плати» та «тимчасового попиту на людські дані». Як тільки цей попит зникне, «робітники не матимуть жодних гарантій, жодних перенесених навичок і жодної соціальної мережі».

Грем зазначає, що єдині переможці — це «платформи північної півкулі, які отримують всю тривалу вартість».

Джерело: The Guardian

Повна ліцензія

Фрілансер з навчання AI Хілл з Чикаго має складні почуття щодо продажу своїх приватних дзвінків компанії Neon Mobile. Приблизно 11 годин контенту дзвінків принесли йому 200 доларів, але він каже, що цей додаток часто виходить з ладу і затримує платежі. «Neon завжди був для мене підозрілим, але я все ще користуюсь ним просто для того, щоб заробити трохи кишенькових грошей для оплати рахунків», — говорить Хілл.

Тепер він починає переосмислювати, чи дійсно ці гроші так легко заробити. У вересні минулого року, через кілька тижнів після запуску Neon Mobile, він вийшов з ладу, коли TechCrunch виявив проблему безпеки, через яку будь-хто міг отримати доступ до номерів телефонів користувачів, записів дзвінків та текстових повідомлень. Хілл каже, що Neon Mobile ніколи не повідомляв йому про це, і тепер він дуже стурбований, що його голос може бути зловжитий в Інтернеті.

Дослідниця з питань конфіденційності даних в Інституті штучного інтелекту Стенфордського університету Дженніфер Кінг стурбована тим, що ринок даних AI неясно визначає, як і де будуть використані дані користувачів. Вона додає, що, не розуміючи своїх прав і не маючи можливості про це домовитися, «споживачі стикаються з ризиком, що їхні дані будуть повторно використані у спосіб, який їм не подобається, який вони не розуміють або не передбачали, і в той час практично не буде жодних шляхів для виправлення».

Коли фрілансери навчання AI ділять дані на Neon Mobile та Kled AI, вони надають повну ліцензію (глобальну, виняткову, незворотну, передавану та без роялті), що дозволяє платформі продавати, використовувати, публічно демонструвати та зберігати їхні зображення, навіть створювати похідні роботи на їх основі.

Засновник Kled AI Аві Патель зазначає, що угода щодо даних його компанії обмежує використання лише для навчання AI та дослідницьких цілей. «Вся бізнес-модель залежить від довіри користувачів. Якщо учасники вважають, що їхні дані можуть бути зловживані, платформа не зможе працювати». Він зазначає, що компанія перевіряє покупців перед продажем наборів даних, щоб уникнути співпраці з «підозрілими намірами», такими як порноіндустрія, а також з урядовими установами, які, на його думку, можуть використовувати дані в спосіб, що суперечить цій довірі.

Neon Mobile не відповів на запит про коментар.

Професор права університету Сент-Джордж у Лондоні Енріко Бонадіо зазначає, що ці угоди дозволяють платформам і їхнім клієнтам «фактично робити з цим матеріалом все, що завгодно, на постійній основі, без необхідності додаткових виплат, а учасники не мають реального способу відкликати згоду або перепогодити».

Ще більш тривожні ризики включають: використання даних тренерів для створення глибоких підробок та імітацій особистості. Незважаючи на те, що ринок даних стверджує, що перед продажем видаляє ідентифікаційні дані (такі як ім’я та місцезнаходження), біометричні дані за своєю суттю важко піддаються суттєвій анонімізації, додає Бонадіо.

Жалість продавців

Навіть якщо фрілансери навчання AI зможуть домовитися про більш детальні умови захисту щодо використання даних, вони все ще можуть пошкодувати про своє рішення. У 2024 році актор Адам Кой з Нью-Йорка продав своє обличчя за 1000 доларів компанії Captions — програми для редагування AI-відео, яка зараз змінила назву на Mirage. У його угоді зазначено, що його особистість не буде використовуватися для жодних політичних цілей, не буде використовуватися для реклами алкоголю, тютюну або порнографічного контенту, а термін дії ліцензії становить один рік.

Captions не відповів на запит про коментар.

Невдовзі після цього друзі Адама почали пересилати йому відео, в яких використовуються його обличчя та голос, які набрали мільйони переглядів. В одному з відео в Instagram AI-копія Адама називає себе «лікарем піхви», рекламує неперевірені медичні добавки для жінок під час вагітності та після пологів.

«Пояснювати це іншим мені незручно», — говорить Кой.

«Коментарі були дивними, бо вони оцінювали мою зовнішність, але це зовсім не я», — додає Кой. «Коли я приймав рішення (продати обличчя), я думав, що більшість моделей все одно будуть збирати дані та зображення з Інтернету, чому б не отримати за це гроші».

Кой говорить, що після цього він більше не брав жодних фрілансерських завдань з даними AI. Він каже, що тільки якщо якась компанія запропонує значну компенсацію, він розгляне можливість знову зайнятися цим.

  • Ця стаття опублікована з дозволу: «Глибокий потік TechFlow»
  • Оригінальна назва: «Тисячі людей продають свої ідентичності для навчання AI — але з якою ціною?»
  • Автор оригіналу: Шубхам Агарвал, The Guardian
  • Переклад: Глибокий потік TechFlow
Застереження: Інформація на цій сторінці може походити від третіх осіб і не відображає погляди або думки Gate. Вміст, що відображається на цій сторінці, є лише довідковим і не є фінансовою, інвестиційною або юридичною порадою. Gate не гарантує точність або повноту інформації і не несе відповідальності за будь-які збитки, що виникли в результаті використання цієї інформації. Інвестиції у віртуальні активи пов'язані з високим ризиком і піддаються значній ціновій волатильності. Ви можете втратити весь вкладений капітал. Будь ласка, повністю усвідомлюйте відповідні ризики та приймайте обережні рішення, виходячи з вашого фінансового становища та толерантності до ризику. Для отримання детальної інформації, будь ласка, зверніться до Застереження.
Прокоментувати
0/400
Немає коментарів