2013年9月6日金曜日

不愉快なツイートの日時と内容のほか、投稿した人の所在地とユーザー名を収集するプログラムがあるらしい。

アメリカはテロ関係の情報を集めていますが、ヘイトスピーチを集めるプログラムが稼動しているそうです。


記事によると
  • 不愉快なツイートの日時と内容のほか、投稿した人の所在地とユーザー名を収集するプログラム
    • プログラムについて
      • プログラム名は「HateBrain」
      • 開発者であるティモシー・クイン氏
      • 2013年夏に完成
      • 現時点では、ツイートの37%をHateBrainによって自動的に分類
        • 自動化は年300,000件弱ペース
        • しかし、1日6,000件近くは人の仲介が必要
      • 「The Sentinel Project for Genocide Prevention」(集団虐殺を防止するための監視プロジェクト)が後援
      • 希望すれば誰でも公開APIを使って自由にアクセスできる
      • ユーザー名と、ツイートの内容は現時点では公開されていない
    • 目的
      • ヘイトスピーチのデータベースをつくり、集団虐殺への道を示すような、人を排除し、人間的に扱わない言葉の広がり方を研究者が発見しやすくする
    • 対象
      • Twitter
      • 以下のヘイトスピーチを収集
        • 性別
        • 性的指向
        • 障害
        • 民族性
        • 国籍
        • 宗教
        • 階級
    • 収集データ
      • 日時
      • ユーザー名
      • 投稿したユーザーの所在地
        • 特定の街や地域の人々が特定の言葉を受容しやすいかどうか調査する為、収集
        • ジオタグ参照
        • ジオタグが無いTweetはユーザーのプロファイルに含まれている文脈情報を使って、ツイートの発信地のプロファイルを作成
          • 「HateBot」プログラムで行われる
          • このプログラムでTweetの42%にジオタグ付加
      • 内容
という事らしい。

このプロジェクトはあくまで、どの地域でどのような差別的な言葉が使われているか調べたり、差別的な言葉がどのように広がっていくか調べる為に、運用されるようです。

けっして、Tweetを見張る為に運用されるわけではないようです。

しかし、この成果に目をつける会社は必ずいるはず。

たとえば、ヘッドハンティング会社・人物評価会社などがこのシステムを模倣して、情報を集めだすと、過去につぶやいた内容が原因でその人の評価が下がるおそれがあります。

ある意味恐ろしいものになりそう。

かつて、科学者はPCへのウィルスの感染をスピードなどを調査する為にウィルスをばら撒いたこともあったが、同じようなことにならなければ良いと思う。


記事
不愉快なツイートを収集するプログラム「HateBrain」 WIRED

参照ページ
Meet HateBrain, the automated social media monitoring engine at the heart of Hatebase The Sentinel Project for Genocide Prevention

0 件のコメント:

コメントを投稿