最近、人工知能技術の発展に伴い、各方面で高品質な学習用データへの需要が顕著に増加しています。David AI Labs傘下のBabel Audioは、音声データ収集に注力するプロジェクトプラットフォームで、開発者に多モーダル・データセットを提供しています。同プラットフォームは、グローバルな遠隔ワーカーを募集して音声収録に参加してもらい、それによって音声生成および認識モデルの最適化を促進します。この種の新興の「AIで出稼ぎ(ギグ)労働」モデルは、労働市場に柔軟な収入機会をもたらします。時給17ドルからスタートという条件は非常に魅力的に聞こえますが、一方で、データのプライバシー譲渡や労働保障の不足といった潜在的リスクも同時に伴います。
Babel Audioと中核となる業務メカニズム
設立からわずか2年のDavid AI Labsは、モデル開発者に多モーダル・データセットを提供することに専念しています。傘下のBabel Audioプロジェクトは主に、クラウドソーシングによって自然な音声データを収集します。それは匿名の見知らぬ人同士を組み合わせて録音対話を行い、これらの録音を学習データとしてまとめ、人工知能企業が利用できるようにしています。参加者は高度な技術的背景を持つ必要はなく、遠隔で接続し、指示に従って対話の録音またはシステム評価を行うだけです。ブルームバーグの報道によれば、ユーザーは短い音声フラグメントを提出した後、初期の篩い分けを経てプロジェクトへの登録を開始でき、時給の起点は17ドルです。録音品質は、音声品質およびその他一連の要因に基づいて評価されます。評価が高いほど、利用者が得られる報酬が多くなり、さらに高い報酬のプロジェクトを申請することも可能です。その中核的な目標は、実在の人間同士のやり取りによって、AIがイントネーションや文脈を理解する際の技術的ギャップを埋めることにあります。
AIのギグエコノミーのマクロな牽引力
人と対話することで機械を訓練するのは、人工知能の時代に生まれたもう一つの特殊な仕事で、しかも需要が非常に大きいです。マクロ経済の観点から見ると、Babel Audioの台頭は、データ注釈(Data Annotation)市場の構造的な拡大を反映しています。現在、大規模言語モデルや音声生成技術は「人間によるフィードバックに基づく強化学習(RLHF)」に高度に依存しており、それによって出力が人間の論理や規範に沿うようにしています。巨額の研究開発コストを抑えるため、テクノロジー企業は注釈業務を、世界中のギグエコノミーの仕組みに分散しています。このようなモデルによって、企業はより低コストで大量のデータを入手でき、さらにデータに地域をまたいだ多様性があることも確保できます。
AIのギグ労働は、労働市場と参加者にどのような影響を与えるのか
AIの音声訓練におけるギグ作業は、大衆に対して高い柔軟性のある副業の選択肢を提供し、遠隔で働きたい人たちに適しています。しかし、この種の業務関係は請負(請負型)に属するため、参加者は従来の労働者向けの法規に基づく医療保険や解雇手当などの福利厚生の保障を享受できません。さらに、プラットフォームは、仕事の品質評価とタスクの割り当てを行う際に、不透明なアルゴリズムに高度に依存しています。参加者は、システム判断の変動によって予告なく案件への資格を失うリスクに直面しており、ギグエコノミーにおける収入の安定性という点での内在的な欠陥が示されています。
プライバシー権と生体特徴の権利に関する考慮
人工知能の音声トレーナーもまた、個人のプライバシーに関わる生存上の問題に直面することが少なくありません。彼らは、この技術が多くの他の生計を置き換える可能性があるために、自分自身——彼らの声や人生の物語——をあまりにも多く手放してしまうのかどうかです。
Babel Audioなどの音声データ・プロジェクトに参加する際、プライバシー権の譲渡が重要な論点になります。この種のプラットフォームの通常の契約に基づくと、ワーカーは一般的に、声紋(Voiceprint)などの生体特徴データについて、プラットフォームに対して永久かつ世界規模の利用権を付与することに同意する必要があります。これは、企業がデータを商業的な訓練に用いたり、音声モデルを構築したりでき、その後のロイヤルティを支払う必要がないことを意味します。データ保護の法規制がますます厳格になる流れの中で、参加者は短期の報酬を得る際に、個人の生体特徴が広範に利用されることによる潜在的なリスクを慎重に評価する必要があります。
この記事 Babel Audioは「AIの波」でギグ労働をこなし、チャットするだけで時給17ドルが稼げるって? もっとも早く出現したのは 鏈新聞 ABMediaです。