農水省の市町村別データ

例)耕地面積

47都道府県一覧は
http://www.tdb.maff.go.jp/toukei/a02smenu2?TokID=D003&TokKbn=C&TokID1=D003C-001&TokKbnName=%92%B7%8A%FA%97%DD%94N%93%9D%8Cv

この下の北海道は
http://www.tdb.maff.go.jp/toukei/a02smenu3?TokID=D003&TokKbn=C&TokID1=D003C-001&TokID2=D003C-001-001&TokKbnName=%92%B7%8A%FA%97%DD%94N%93%9D%8Cv

ここでページのソースをみると、ファイルの名前がわかる。
札幌市は
a02stoukeiexl?Fname=D003C-001-001-100-000.xls

ファイルにアクセスするには
http://www.tdb.maff.go.jp/toukei/"ファイル名"
でよい。
つまり、札幌市のファイルは
http://www.tdb.maff.go.jp/toukei/a02stoukeiexl?Fname=D003C-001-001-100-000.xls

ファイル名の規則

a02stoukeiexl?Fname=D003C-001-"都道府県番号(3桁)"-"市町村番号(3桁)"-000.xls

データ収集用プログラム

HTMLを読んで、エクセルファイルのURL一覧を生成する。
   get.url.maff.py
URL一覧は、テキストで吐き出される。

ファイルURL一覧ファイルを読み、ファイルをダウンロードする
   get.webfile.py

エクセルファイルから必要なデータを読み、ファイルに書き出す。
   rdxl_maffdata.py
最終更新:2009年11月30日 21:22
ツールボックス

下から選んでください:

新しいページを作成する
ヘルプ / FAQ もご覧ください。