さもありなん: 不愉快なツイートの日時と内容のほか、投稿した人の所在地とユーザー名を収集するプログラムがあるらしい。

2013年9月6日金曜日

不愉快なツイートの日時と内容のほか、投稿した人の所在地とユーザー名を収集するプログラムがあるらしい。

アメリカはテロ関係の情報を集めていますが、ヘイトスピーチを集めるプログラムが稼動しているそうです。

記事によると

不愉快なツイートの日時と内容のほか、投稿した人の所在地とユーザー名を収集するプログラム

プログラムについて

プログラム名は「HateBrain」
開発者であるティモシー・クイン氏
2013年夏に完成
現時点では、ツイートの37％をHateBrainによって自動的に分類

自動化は年300,000件弱ペース
しかし、1日6,000件近くは人の仲介が必要

「The Sentinel Project for Genocide Prevention」（集団虐殺を防止するための監視プロジェクト）が後援
希望すれば誰でも公開APIを使って自由にアクセスできる
ユーザー名と、ツイートの内容は現時点では公開されていない

目的

ヘイトスピーチのデータベースをつくり、集団虐殺への道を示すような、人を排除し、人間的に扱わない言葉の広がり方を研究者が発見しやすくする

対象

Twitter
以下のヘイトスピーチを収集

性別
性的指向
障害
民族性
国籍
宗教
階級

収集データ

日時
ユーザー名
投稿したユーザーの所在地

特定の街や地域の人々が特定の言葉を受容しやすいかどうか調査する為、収集
ジオタグ参照
ジオタグが無いTweetはユーザーのプロファイルに含まれている文脈情報を使って、ツイートの発信地のプロファイルを作成

「HateBot」プログラムで行われる
このプログラムでTweetの42％にジオタグ付加

内容

という事らしい。

このプロジェクトはあくまで、どの地域でどのような差別的な言葉が使われているか調べたり、差別的な言葉がどのように広がっていくか調べる為に、運用されるようです。

けっして、Tweetを見張る為に運用されるわけではないようです。

しかし、この成果に目をつける会社は必ずいるはず。

たとえば、ヘッドハンティング会社・人物評価会社などがこのシステムを模倣して、情報を集めだすと、過去につぶやいた内容が原因でその人の評価が下がるおそれがあります。

ある意味恐ろしいものになりそう。

かつて、科学者はPCへのウィルスの感染をスピードなどを調査する為にウィルスをばら撒いたこともあったが、同じようなことにならなければ良いと思う。

記事
不愉快なツイートを収集するプログラム「HateBrain」 WIRED

参照ページ
Meet HateBrain, the automated social media monitoring engine at the heart of Hatebase The Sentinel Project for Genocide Prevention

さもありなん

2013年9月6日金曜日

不愉快なツイートの日時と内容のほか、投稿した人の所在地とユーザー名を収集するプログラムがあるらしい。

0 件のコメント:

コメントを投稿