あのCPUを作っているIntelが新しくマッシュアップツールを発表するらしいというのを Mashups: Mashup Maker Smackdown で知ったのでそのことを書くつもりで書き始めたら長くなったのでまた次回書きます。さいきん顔認識ができることで有名になったOpenCV もIntelが作っているし、Intelファンな自分としてはうれしいです。
Mashable!はいろんなサービスを全部ひとくくりに"マッシュアップツール"と呼んでいますが、マッシュアップツールには大きく分けて3つあって、はっきり区別しておくのは重要だと思うのでそこを整理したいと思います。
そのときはキカイがHTMLから意味のあるデータを取り出すのをニンゲンが手伝ってあげる必要があります。古くからある手法としては正規表現、最近はXPathなんかを使ってキカイとデータに意味を与えるわけですが、これがアタマを使わない作業のわりに煩雑なのでそれを助けてくれるものです。
cat, sort, uniq, grep, sed にあたるシンプルなツールから、住所から緯度経度を得るとか、与えられたテキストでflickrから写真を探してきてそのURLをいれるとか、そういう処理をします。

でも、データの加工ツールとしては、最小限+へんな機能しか提供していないYahoo! Pipesに比べると、豊富な機能があります。データを入れるとそれに応じてほかのデータが出てくるblockというものあり、Flickrから特定のタグがついた写真を持ってきたり、特定のURLのdigg数を持ってきたり、last.fmのアーティスト情報を持ってきたりすることができます。これがあらかじめかなりの数が用意されているうえに、自分でblockを作れるので、まとまった処理をひとつのblockとしてまとめておげはそれを繋げて複雑な処理をすることができます。
Popflyは、加工したデータを視覚化してそのURLにアクセスして楽しむことを前提にしているようです(よく調べてないのでXMLのまま取り出すことも可能かもしれません)。データに含まれている写真をSilverlightお得意の3Dで表示してくれるblockや、位置情報を含んでいるデータをLive Earthの地図上にマッピングしてくれるblockなんかがあります。
limited test and access is restricted to a small number of developersですが、まえのふたつが視覚的に操作するものなのに対して、これはガリガリ手でHTMLとjavascriptを書いてマッシュアップするものです。手でコードを書くだけあって、データをこういうふうに加工したいと思えばどんなかたちにでも加工することができますが、使っている間にだんだんとマッシュアップエディタというよりは、使いにくいブラウザ上のエディタでRSSを加工するためのライブラリとテンプレートエンジンライブラリを使って、ふつうにコードを書いている気分になってきます。
これも視覚化することを前提にしていて、加工したデータをGoogle Mapsにマッピングしたり、Google Calendarに入れ込んだりすることができます。
手元で動かす必要がない、というのに魅力を感じなければPlaggerのほうが洗練されていますし、さまざまなブラグインが開発されているので機能的にも圧倒的に優れています。
コードを書いて動かすものなので Google Mashup Editor Tour と Developer Knowledge Base を眺めたらどんなものかは把握
できるでしょう。
alphaWorks Services | QEDWiki | Overview の文章からすると、外からデータを持ってきて最終的にwikiのページとしてpublishするもののようです。
Dapperは スクレイピングはもっと簡単にならなければいけない - bits and bytes でも書いたとおり、ちょこっとクリックしていくだけでほしいデータをXMLで取り出せるツールです。古代の正規表現やXPathと比べるとほんとに魔法のように見えるのでぜひデモ Dapper: The Data Mapper をみてみてください。
デモだと魔法のようにデータが取り出せるように見えますが、実際にはわりとうまく取り出せないときもあります。取り出す仕組みが全部Dapperのサーバの裏に隠されていて、表側で調整できる項目がほんのわずかなので微調整のしようがないところが欠点です。
UIはわりとDapperと似ていて、ブラウザ上でほしい部分をクリックしていくかんじですが、ベースにある設計思想は全く違います。Dapperは適当にクリックしてボタンを押せばあとはキカイがぜんぶやってくれて90%くらいで期待した結果が得られればいいかな、というつくりなのに対して、OpenKapowはニンゲンがほしい部分をまじめにクリックしてそれぞれをきちんと定義すれば100%期待通りの結果が得られる、間違ってたら何も出てこない、みたいな作りになっています。ブラウザもアプリケーションにIE互換のブラウザが組み込まれていてそれを使います。
このOpenKapowで作られたスクレイピングのための設定は、OpenKapowのサーバに保存してほかのユーザと共有することも可能になっていて、昔ながらのヘビーなネイティブのアプリケーションが、いまふうなWebでのデータ共有をするという点でおもしろいです。
トラックバック元エントリにこのエントリへのリンクがない場合はトラックバックを受け付けません。
http://labs.gmo.jp/mt/mt-tb.cgi/143
comments