wedata対応バージョンのSITEINFO作成用Firefox拡張機能 AutoPagerize Iteration Detector

HTMLのドキュメントから繰り返し部分をみつけてSITEINFOをつくるAutoPagerize Iteration Detectorをwedataに対応させました。AutoPagerize Iteration Detectorで作ったSITEINFOを直接wedataに反映させられるようになっています。

インストール

iterd.xpi(supports Firefox 2.0-3.0.0.*)

つかいかた

使い方はwedataに接続する部分以外以前のバージョンとかわっていませんが、ざっと紹介します。

次のページへのリンクを右クリックする

SITEINFOを作りたいページを開いて、ページの中にある次のページへのリンクを右クリックします。メニューの中にDetect iterationsという項目ができているはずなので、それを選んでください。
launch iteration detector

pageElementを候補から選ぶ

メニューを選ぶと、新しくIteration Detectorという名前のウインドウが開きます。HTMLが複雑なページだとここで少し固まってしまうのですが、数秒待つとHTMLを解析してSITEINFOの候補が表示されます。


一番左のページのpageElement Xpathは、本文の部分を意味するpageElementのXPathです。その右にあるthisPageとnextPageはそのXPathで今開いているページと次のページでそれぞれいくつの要素がマッチするかを示しています。この候補リストは適切だと思われる順で表示されています。上にあるものほどpageElementのXPathとしてたぶん正しくて下にいくほど怪しくなっていきます。

AutoPagerize Iteration Detectorではページの中にある繰り返しの単位にマッチするXPathを自動で作っています。たいていのページでは繰り返しの件数はページに表示されている情報の件数と同じです。そのため、うまく生成できているものはthisPageとnextPageの値が1ページに含まれている件数と同じになります。

iteration detector IDE screen
pageElementを選ぶとそのpageElementのXPathにマッチする部分が水色で囲まれて視覚的にもチェックできるようになっています。

マッチしている件数や、水色で囲まれている部分をチェックしながら適切なものを選んだらsiteinfonameとURLを入力してください。siteinfonameはいま作っているSITEINFOにつける名前です。動作には直接関係ありませんがwedataで表示される名前になります。URLには作ったSITEINFOを適用するURLを正規表現で書きます。

うまく書けたらTry this ruleを押してください。このボタンを押すとSITEINFOが自分のFirefoxの中に保存されて、いま作ったSITEINFOを一時的に使えるようになります。

動作の確認

Try this ruleを押してSITEINFOを一時的に保存したら、ページをリロードして作ったSITEINFOが期待通り動くかどうか何ページか先まで進めて確認しましょう。

問題があったときは、FirefoxのメニューのTool/Iteration Detectorを開いて修正できます(Firefox3だと可能です)。削除は右クリックして出てきたメニューから可能です。

configure API key

wedata API key の設定

思い通りに動くSITEINFOができあがったらwedataに保存しましょう。まずはじめにwedataのAPI keyを設定しておく必要があります。API keyはwedataにログインしたあとの画面から自分のアカウントのページhttp://wedata.net/users/(設定した名前)で表示されます。
Picture 9-3


このAPI keyをFirefoxのメニューのTool/Iteration Detectorを開いて出てくるダイアログのConfigure your API keyボタンを押して入力します。

API key textbox
ボタンを押すとこういうウインドウが出てきて、入力したあとどうやったら閉じられるのか迷うのですがESCを押すと閉じられます。ESCだとキャンセルになっちゃう感じがしますがちゃんと反映されるのでご安心ください。

API keyを入れると、ボタンの表示がSave rules to wedataにかわります。これでボタンを押すと、表示されているすべてのSITEINFOがwedataに新しく追加されます。

save rules to wedata

以前に同じ名前でSITEINFOを保存していたときでも、上書きされずに新しくSITEINFOが作られるのでご注意ください。

done AutoPagerizing

Seee also

wedataに関する部分以外はHTMLのドキュメントから繰り返し部分をみつけてSITEINFOをつくるAutoPagerize Iteration Detectorのほうが少しだけ詳しく書かれているので、ご興味を持っていただけたらあちらもご参照ください。

tags

  • Firefox
  • extension
  • 「wedata対応バージョンのSITEINFO作成用Firefox拡張機能 AutoPagerize Iteration Detector」のはてなブックマーク数
  • 「wedata対応バージョンのSITEINFO作成用Firefox拡張機能 AutoPagerize Iteration Detector」deliciousブックマーク数
  • 「wedata対応バージョンのSITEINFO作成用Firefox拡張機能 AutoPagerize Iteration Detector」をはてなブックマークに追加
  • save "wedata対応バージョンのSITEINFO作成用Firefox拡張機能 AutoPagerize Iteration Detector" to del.icio.us
  • 「wedata対応バージョンのSITEINFO作成用Firefox拡張機能 AutoPagerize Iteration Detector」をリアルタイムブログ検索
  • permalink
  • 新しくなったAutoPagerizeのSITEINFOバックエンドwedata
  • Firebug1.2alpha向け $xでコンテキストを指定できるようにするためのuserchrome.jsスクリプト

comments

TypeKey Enabled
スタイル用のHTMLタグが使えます。
*required
2008.04.25 07:06

siteinfonameはあとから修正できないのですか?

trackbacks

トラックバック元エントリにこのエントリへのリンクがない場合はトラックバックを受け付けません。

http://labs.gmo.jp/mt/mt-tb.cgi/215
©2010 Kentaro Kumagai, GMO Internet Labs., GMO Internet, inc.
bits and bytes
2008 .04. 24 20:12

tagcloud

  • API1
  • C/C++2
  • E4X1
  • FUSE2
  • Firefox26
  • HTML4
  • IE1
  • MySQL1
  • OSX4
  • Opera2
  • PHP4
  • UI2
  • XML1
  • XPCOM4
  • XPath4
  • apache2
  • binary2
  • book1
  • data13
  • debug5
  • design1
  • experiments4
  • extension14
  • geo1
  • google gears2
  • google maps API1
  • greasemonkey4
  • httpd5
  • javascript20
  • linux1
  • logging2
  • mobile4
  • perl4
  • tips6
  • tool11
  • vim2
  • visualization3
  • widget1
  • wii3
  • windows7
  • サービス7
  • 和訳1

Archives

  • 2008.05 (4)
  • 2008.04 (4)
  • 2008.03 (4)
  • 2008.02 (6)
  • 2008.01 (3)
  • 2007.12 (4)
  • 2007.11 (5)
  • 2007.10 (4)
  • 2007.09 (4)
  • 2007.08 (4)
  • 2007.07 (8)
  • 2007.06 (7)
  • 2007.05 (4)
  • 2007.04 (5)
  • 2007.03 (6)
  • 2007.02 (4)
  • 2007.01 (6)

about

  • bits and bytesのXML
  • 「bits and bytes」のCreative Commons
  • Powered by Movable Type
  • イベントと地図 - モグ
  • Use ecto to blog!
  • bits and bytesのはてなブックマーク数
  • bits and bytesをMy Yahoo!に追加
  • Subscribe with Bloglines