@python_alert_jaのツイートをCouchDBにぶち込んでRTランキングとか

昨日行われた
第3回「入門 ソーシャルデータ」真面目に勉強する会 @神泉(渋谷)
http://atnd.org/events/24517
に参加してきました.

今回は第3章 : 「古き良きメールボックス」.内容はメールのデータをCouchDBに入れてごにょごにょだったんですが,NoSQLが便利すぎてウケたw
JSONそのままぶち込めばOK!レコードの取得や分析はmap/reduce関数書こうね! ってのは用途によってはRDMSよりかなりお手軽で便利ですね.Web APIとの親和性が高そう.1年半前に知っておけば研究楽になったのに……どうして今まで誰も教えてくれなかったんですか.
どうして今まで誰も教えてくれなかったんですか(迫真)

嘆いててもしょうがないので,CouchDB+Twitter APIでなんか面白いことやってみましょう.

てなわけで,自分が管理してるTwitterbot,@python_alert_jaを使います.Google AlertsPythonに関連する記事取ってきてTwitterfeedで流すだけの簡単なbotですが,フォロワー1,000人近くいて(本垢の倍以上……)記事によっては結構RTされたりふぁぼられたりします.

APIでツイート取ってくると何回RTされたかとかもわかるんで,こいつのツイート全部引っ張ってきてRT回数のランキング作ればどんな記事がウケるのかわかって面白くね? てことでやってみました.

コード↓
http://github.com/who-you-me/PA_analysis

setting.py

Twitter API叩くためのキーやらトークンやらを設定.あとデータベースの名前もここに.

load_tweet.py

Oauth2ライブラリ使ってAPI叩いてcouchdb-python使ってDBにぶち込む.楽すぎワロタwwwww

map_tweet_by_datetime

日付をkeyにしてマッピングする.必要かわからんけど本のサンプルコードにあったから.

map_tweet_by_retweet_count

今度はリツイートされた回数でマッピング

最後のスクリプトでビュー作ったおかげで簡単にリツイート回数でソートして見れるようになります.
ではRT回数TOP10の発表です!!ジャジャーン!!!

1位

1位は16RTで2つが同着です.
「PTVS」v1.0が公開、「Visual Studio」でスクリプト言語“Python”が利用可能に - 窓の杜
http://d.hatena.ne.jp/norio515/20111112/1321105385
1つはVisual StudioPython使えるようになったよ!て記事.皆さんなんだかんだでWindows好きなんですね(ニヤニヤ
もう1つは僕はよくわからないんですが,「NVIDIAが提供するGPGPUの開発環境」であるCUDAをPythonから扱うらしいです.マニアックなところ来ましたね.

3位

11RTです
米Basho、分散Key-Valueストア型データベースシステム「Riak 1.0」を発表 | OSDN Magazine
NoSQLきました.これPython向けドライバもあるよってだけでPythonあんま関係ない記事ですが(笑),やはりNoSQLへの関心の高さが伺えますねー

6位

8RT
最も todo と fix meが多いプログラミング言語は Python かもしれない - higepon blog(なんか元記事消えてたんでタイトルでぐぐって出てきたのを貼りました.内容全く同じだったんだけど……消えた方はパクリだったのか?)
これも言語比較ネタですね

7位

7RTで3つ並びました
さくらのクラウド、Amazon EC2の半額以下で11月開始へ − @IT
さくらクラウドです.Python直接関係ないですがw
PythonによるPython実装PyPy、バグフィックスとパフォーマンス向上が行われたバージョン1.7リリース | OSDN Magazine
PyPyも関心高いですよねー.
「PyPyってPythonPythonで実装するとかわけわからないことやってるけど,なんでCPythonより早いの?」
「PyPyには夢が詰まってるからだよ!!」
Pythonを始める人への日本語情報集 - None is None is None
Pythonは日本語情報少ない」とのたまう輩はGoogle先生に言いつけてやりましょう

10位

これも3つ並びました.6RTです.
Heroku上でPython と Django
Herokuです.GAEが最近アレなことになってるのでHerokuに手を出したいと思ってるんですが思ってるだけで何もやってないです.
「Google Cloud SQL」発表、Google App EngineでSQLデータベース利用可能に -INTERNET Watch Watch
こんなんありましたねー忘れてました.GAEでSQL使えればかなり便利なずだけど最近ほとんど話聞かないね.
Mitchell Harper 「ソフトウェア技術者にとって大学教育は時間の無駄だ」
ラストはなんかアレなタイトルです.僕もプログラミング独学ですが,情報系でバリバリやった連中には叶わないよ!と思うけどなあ


以上です.皆さんいかがでしょうか.
これだけで終わるのももったいないので,テキストマイニングやって記事分類とか暇ならやってみます.