2007/05/25
最近Twitterで気になるキーワードを発言した人のうち、まだ自分がAddしてない人をRSSで抽出するアプリをYahoo! Pipesで作った
(管理人日記)
なんだかよくわかんないモノができた。
ClustterPipe
自分のTwitterのIDと、気になるキーワードを指定してください。Twitterでそのキーワードを含む発言をした人のうち、自分がまだAddしていない人(とその発言)を抽出します。
これのRSSを購読しておけば、自分と趣味があう人をTwitter内から探すことができます。
同じ趣味・興味を持つ人が集まるのをクラスタ化なんて言ったりします。ClustterPipeという名前もそこから付いています。
仕組み
またYahoo! Pipesです。内部でTwitter 検索を利用させてもらいました。感謝です。
ソースは以下。
案外複雑になっちゃった。
左側の構成。
- 気になるキーワードを入れてね (Text Input)
- Twitter検索のURLを作る (URL Builder)
- RSSで取得 (Fetch Feed)
- Twitter検索は名前や自己紹介なども検索対象になってるので、本文にキーワードを含むものだけを抽出 (Filter)
- 同じ人が複数見つかる場合があるので、title(ユーザの名前)が重複したデータをひとつにまとめる (Unique)
- titleをauthorっていう名前でコピー (Rename)
- Uniqueした場合、重複した件数がy:repeatcountにセットされるが、あとで使うのでy:twitcountにリネーム (Rename)
- authorをIDだけにする (Regex)
右側の構成。
- TwitterのUsernameを入れてね (Text Input)
- usernameに.xmlを付け足す (String Concatenate)
- friends一覧のURLを作る (URL Builder)
- xmlで取得 (Fetch Data)
- screen_nameをauthorっていう名前にリネーム (Rename)
- 左側のデータと右側のデータを合体 (Union)
- 合体して、authorが重複した場合ひとつにまとめる (Unique)
- y:twitcountに値が入っていて、y:repeatcountが1であるデータ(つまり、左側(Twitter検索結果)には存在して、右側(自分のFriends)には存在しないデータ)だけを抽出 (Filter)
- 出力 (Pipe Output)
特にy:repeatcountでFilterしているところは、ふたつのデータを合体して、重複しないデータ(y:repeatcountが1のもの)を抽出するというやり方。いろいろ応用できそうな気もする。
これ役に立つの?
作ってて思ったけど、これ役に立つかなあ。私はもう最近こっちからAddする機会が減ってしまったので、しばらく使ってみます。
- この記事のURI:
- http://muumoo.jp/news/2007/05/25/0clustterpipe.html
最新の関連記事
直後の関連記事
直前の関連記事