« 流派!と流派? | トップページ | Google SpreadSheetで東村山市民新聞の字数カウントやってみた(追記2あり) »

東村山市民新聞の勝手な目次をGoogle SpreadSheetで作ってみた

前回の投稿から随分と間が空いてしまいました。何もしていなかった訳ではなく、データ共有方法としてGoogle SpreadSheetを試してみたり、Perlの日本語処理にハマったりと、裏では忙しい日々を過ごしていたのですが、とても記事を書くところまで行きませんでした。ブログをやっておられる皆さんは良く毎日のように記事を投稿できるものだと感心してしまいます。

という訳で、まずはGoogle SpreadSheetの話から。

私の住むデタおた国では、万人でデータを共有できる方法が大きな課題です。ブログは文章や写真の公開には良い方法ですが、データとなると良い手段がなく、結局巨大なHTMLファイルを作るほかありません。データは大きな一覧になってしまいがちで、良いビュー(見え方)の提供が重要ですが、HTMLやJavaScriptのテクニックを駆使した画面を作るのは素人には無理です。

そういう訳で、簡単に使える良い共有方法を模索していたのですが、Google SpreadSheetが非常に適しているのではないかと気がつきました。以下のような特長があるからです。

  • ブラウザ上で使えるスプレッドシート(Excel等の購入やインストールは不要)。
  • 共有・公開が簡単。Googleアカウントを持っていない人にも公開できます。
  • ローカルのPCにあるデータの登録(Import)や、ローカルへの取りだし(Export)が簡単。
  • インターネットに公開されているデータをソースとして使える。

PC上で独立して使うスプレッドシートとして見た場合には、性能・機能の面でExcelの方がずっと上でしょう。個人で作表して、それをメールで上司や同僚に送るといった作業の場合には、Excel&Outlookの方が使い勝手が良いし、それで十分です。私もGoogle SpreadSheetが登場した時には、触れ込みほどには使えないツールだと思ってました。

しかし、インターネットを通じた他者とのデータ共有を考えた時、これほど便利なものはかつてなかったと思います。と言っても分かりにくいので、実例を作ってみました。題材は、先日と同じ東村山市民新聞の勝手な目次です。前回と違うのは、右端のカラムにWebページから取りだしたテキストの全文を入れ、その左カラムにはその先頭200文字を表示させた点です。

  1. 目次を入れたSpreadSheetをWeb画面として公開
  2. 目次を入れたSpreadSheetをログイン不要で共有(要注意:下記)【追記:結構重たいページになっていたのでリンクを削除しました】

なお、上記2.の場合、アクセスしている人がGoogleにログインしていると、Googleアカウント名が同時にアクセスしている人やSpreadSheetのオーナー(私)には見えてしまうようです。アクセスする際にはそのリスクをご承知おきください。Googleからログアウトしてアクセスすれば、この問題は起こらないと思われます。

また、日本語の処理には不十分な点が残っているようです。UTF-8以外は文字化けするようですし、UTF-8でも関数の処理でうまく行かないケースがありました。この辺は今後のGoogleの改善に期待しています。

如何でしょうか。登録する方から見れば、データをアップロード(Import)するだけですし、見る方も便利になっていると思います。2.ではFileメニューからExportを選べば、データをCSV等の形式でダウンロードもできるようです。

上記の例では使っていませんが、4点目に挙げたインターネットをデータソースとして使える機能は特筆ものです。Google SpreadSheetには、以下のような関数が用意されており、他のWebページやCSV・XML形式の公開データから必要なデータを取りだして使う事ができるのです。Excelだとせいぜいシート間で行っていたデータの再利用が、インターネットを跨いで可能になっているのです。これは面白い。

  • GoogleLookup(entity, attribute)
    Retrieves facts from the web.
  • ImportData(URL)
    Retrieves information from a CSV or TSV file.
  • ImportFeed(URL, query, headers, numItems)
    Retrieves information from a data feed.
  • ImportHtml(URL, query, index)
    Retrieves information from an HTML file.
  • ImportRange(spreadsheet_key, [sheet!]range)
    Pulls one or multiple cell values from one spreadsheet into another.
  • ImportXML(URL, query)
    Retrieves information from an XML file.

今回は以上です。今後のデータ公開にはGoogle SpreadSheetを積極的に使ってみようと思います。

|

« 流派!と流派? | トップページ | Google SpreadSheetで東村山市民新聞の字数カウントやってみた(追記2あり) »

東村山」カテゴリの記事

コメント

共有すると白紙化されたりするんでしょうかw

首相動静でも使ってみました。単に引き算しただけですけど^^;
本文は残しておいて後は手作業という感じでしょうか。時間も原文では「同○○分」とか午後12時を午後0時と書いてあったりして面倒なんですけどね。

投稿: Mauii | 2008年10月20日 (月) 16時14分

Mauiiさん、今日のASO君を拝見しました。
動静だと、手作業が多くてたいへんですね。新聞社が最初から再利用可能な形でデータを出してくれれば良いのにといつも思います。でも、集積されれば、いつか役立つ時がくると思います。

投稿: でぶちん | 2008年10月21日 (火) 01時01分

コメントを書く



(ウェブ上には掲載しません)




トラックバック

この記事のトラックバックURL:
http://app.f.cocolog-nifty.com/t/trackback/1109195/24615468

この記事へのトラックバック一覧です: 東村山市民新聞の勝手な目次をGoogle SpreadSheetで作ってみた:

« 流派!と流派? | トップページ | Google SpreadSheetで東村山市民新聞の字数カウントやってみた(追記2あり) »