2012年3月13日火曜日

苦痛なルーティンな記事を機械が代行してくれるようになった。

ルーティンワークは苦痛なことが多い。
それをコンピュータが肩代わりしてくれるなら歓迎すべきこと。
それが記事についても始まったという話。

記事によると
  • 与えられたデータを使って記事を自動的に生成するソフトウエアが実用化
    • 開発した企業はナラティブ・サイエンス
    • 仕組み
      • 与えられたデータを分析
      • その都度、人間のように原稿の切り口を決めてから文章を書く
      • ジャーナリズムの経験者を雇って、ソフトの設定を担当
      • 設定が完了すれば、ソフトは“独り立ち”し、どんどん記事を生成できる
      • 非定型データについて
        • ツイッターでそれぞれの候補者についてのつぶやきを全部かき集めて分析し、候補者に関する世論や世間のムードを記事にする
      • 辞書を使えばそれぞれの言語で記事を生成できるようになる
    • 穴埋めして行く従来の技術とは違う
    • 言われなければ人間が書いたものと区別が付かない
    • CEO スチュアート・フランケル氏曰く
      • 「新聞のコンテンツの20%は当社のソフトで自動的に生成できる」
      • 「ソフトは最初から言語に依存しないように設計されているので、どんな言語でも対応可能」
      • 「技術的な制約はなく、今後2年以内には複数の言語でコンテンツを生成できるようになるだろう」
      • 記者がいらなくなるかについて「心配しなくて大丈夫。(ソフトには)こんなインタビューはできないし、将来もできないから。」
    • 使用例
      • フォーブスが企業業績と株価に関連した記事で使用
        • 様々なデータを総合的にとらえたうえで、利益の増減率や年初来最高値など、最もニュース性の高い情報にフォーカスしながら、記事を書き上げる 
        • 人間の記者と比べて休み無く監視できる
        • 高値更新といった現象が起きたならば、瞬時に記事を生成し、送り出すことができる
        • 人間のように計算ミスをすることがない
      • 全米の何千というアマチュア野球チームに得点記録アプリケーションを提供している会社
        • それぞれの試合終了直後に、会員に対してニュースを自動配信
      • 米国の大手ピザ・チェーン
        • 全店舗の販売情報を毎週、ソフトに分析させて記事化し、各店舗に売り上げの現状や改善点などを知らせている
    • 顧客は現在約30社
      • メディア系
        • 記事の値段は1本10ドルから
        • 買った記事はメディア会社の所有物
      • 通常の事業会社
        • ピザ・チェーン、 不動産会社や広告会社など
      • 毎年100万本に上る記事を提供している大手は定額制の料金体系を採用
という事らしい。


どうやらパターンを組み合わせて記事を作る仕組みのようです。
特定条件が満たされるとこのパターンを使用するとかまた、おそらくはパターン同士の組み合わせでも不自然にならないような仕組みもあると思われます。

単純作業はどんどんコンピュータに任せるべき。
でも、人のやることがへっていくなぁ。

記事

【日本版コラム】新聞記者の仕事もロボットに置き換わるか? WSJ


参照ページ
Narrative Science

0 件のコメント:

コメントを投稿