HTMLのドキュメントから繰り返し部分をみつけてSITEINFOをつくるAutoPagerize Iteration Detectorをwedataに対応させました。AutoPagerize Iteration Detectorで作ったSITEINFOを直接wedataに反映させられるようになっています。

一番左のページのpageElement Xpathは、本文の部分を意味するpageElementのXPathです。その右にあるthisPageとnextPageはそのXPathで今開いているページと次のページでそれぞれいくつの要素がマッチするかを示しています。この候補リストは適切だと思われる順で表示されています。上にあるものほどpageElementのXPathとしてたぶん正しくて下にいくほど怪しくなっていきます。
AutoPagerize Iteration Detectorではページの中にある繰り返しの単位にマッチするXPathを自動で作っています。たいていのページでは繰り返しの件数はページに表示されている情報の件数と同じです。そのため、うまく生成できているものはthisPageとnextPageの値が1ページに含まれている件数と同じになります。

pageElementを選ぶとそのpageElementのXPathにマッチする部分が水色で囲まれて視覚的にもチェックできるようになっています。
マッチしている件数や、水色で囲まれている部分をチェックしながら適切なものを選んだらsiteinfonameとURLを入力してください。siteinfonameはいま作っているSITEINFOにつける名前です。動作には直接関係ありませんがwedataで表示される名前になります。URLには作ったSITEINFOを適用するURLを正規表現で書きます。
うまく書けたらTry this ruleを押してください。このボタンを押すとSITEINFOが自分のFirefoxの中に保存されて、いま作ったSITEINFOを一時的に使えるようになります。
問題があったときは、FirefoxのメニューのTool/Iteration Detectorを開いて修正できます(Firefox3だと可能です)。削除は右クリックして出てきたメニューから可能です。

http://wedata.net/users/(設定した名前)で表示されます。
このAPI keyをFirefoxのメニューのTool/Iteration Detectorを開いて出てくるダイアログのConfigure your API keyボタンを押して入力します。

API keyを入れると、ボタンの表示がSave rules to wedataにかわります。これでボタンを押すと、表示されているすべてのSITEINFOがwedataに新しく追加されます。
以前に同じ名前でSITEINFOを保存していたときでも、上書きされずに新しくSITEINFOが作られるのでご注意ください。

トラックバック元エントリにこのエントリへのリンクがない場合はトラックバックを受け付けません。
http://labs.gmo.jp/mt/mt-tb.cgi/215
comments
siteinfonameはあとから修正できないのですか?