「SNSを使うとAIに学習される時代」に注視すべき“規制の潮流” 変化する個人情報とユーザーの関係性
昨年、X(旧・Twitter)のプライバシーポリシーが変更され、ユーザーの投稿内容がAIの学習に利用されるという文言が追加された。近ごろはこのようにWEBサービスが持つデータをAIの学習に転用する事例が増えている。
Xの規約(※1)には「収集した情報や一般公開された情報を、機械学習または人工知能モデルのトレーニングに使用することがある」と記載されている。要するにユーザーのポストがAIの学習に転用されているということで、Xのユーザーはユーザーである以上、この規約に同意していることになる。
こうした規約の変更は時たまニュースになるものの、一般のユーザーにわかりやすく周知されているとは言いがたく、「知らない間に自分の投稿がAIの学習ソースとして使われている」という状況に拒否感を感じるユーザーもいるだろう。
ユーザーの投稿をAI学習に転用する事例は他にもあり、2月にはTumblrやWordPressを保有するAutomatticが、MidjourneyとOpenAIにユーザーデータを提供しようとしていたことが404Mediaによって報じられている。
404メディアによればAutomatticはOpenAIとMidjourneyのためにTumblerにおける2014年から2023年の“膨大な”ユーザー投稿をコンパイルしてデータを準備したということで、このデータがすでに送信されているのかは明らかではないという。
また、同時期にはユーザー投稿型のソーシャルニュースサイトRedditがGoogleとのパートナーシップ強化を発表した(※3)。今後GoogleはRedditのコンテンツにAPIを介してアクセスし、投稿をAIのトレーニングに活用できるという。
繰り返すようだが、いずれの事例もテクノロジーに明るいユーザー以外には知られておらず、おそらく多くのユーザーにとっては、自身のデータが知らない間にAIに利用されてしまうことになる(というよりおそらく、すでに利用されている)。
AIの利活用はあらゆる領域において今後数十年にわたって検討・実行されていくだろうから、この領域で起きていることを“テックトレンド”と呼ぶにはあまりに巨大で、パラダイムシフトの最初期にあると言ってよい。筆者自身、記者として日頃取材に赴くなかでも企業の資料に“AI”という文言が書かれていないことの方が珍しく、まさに今は「AI時代」に向かっているのだと感じている。
「AI時代」という言葉はちょっと古めかしいが、個人情報とユーザーの関係においてまったく新しい時代が到来しつつあるのは確実だ。自身のデータをAIに勝手に使われないためにどんな自衛ができるのか考えてみたが、これはすごく難しいことだと感じる。
一昔前に「ネチケット」として周知されたようなインターネットでの自衛手段(たとえば「インターネットに安易に本名を書かない」など)のような方法では、こうした状況に抗うのは難しいだろう。極端な例だが、大昔に登録したSNSが知らない企業に買収されてしまったら、そのデータがどう使われるのかもわからない。
一方で「ユーザー情報の収集」に対しては新たなくびきが打たれる動きもある。現在EUに適用されている個人データやプライバシーの保護に関する規定「GDPR(一般データ保護規則)」ではWEBサイトがクッキーを取得するさいに同意を必須としており、「勝手にユーザーのデータを収集しない」というのは近年の“WEBの作法”となっている。
ユーザーが訪れたWEBサイトをドメインを横断して追跡する「サードパーティクッキー」についても世界的に廃止の方向に向かっており、昨今の潮流としては闇雲にデータを収集したり、ユーザーを追跡したりといった行動は規制される方向に向かっている。
こうした潮流が今後整備されていくであろうAIの規制や規範の策定にどのように作用するのかは、引き続き注視したいところだ。
※1:Xプライバシーポリシー
※2:404Media「Tumblr and WordPress to Sell Users’ Data to Train AI Tools」
※3:Google「An expanded partnership with Reddit」
〈サムネイル:Photo by Pixabay〉
世界最大級のSNSは赤字続き 米巨大掲示板・Redditの株式上場から見える“世知辛い事情”
ソーシャルネットワークサービス(SNS)のRedditは米国時間3月21日、ニューヨーク証券取引所(NYSE)に上場した。 …