エントリー

2010年07月の記事は以下のとおりです。

KildleでPDFのメタデータはどう扱われるのか

 ここ数日,少しずつKindleDXの環境構築を進めています。

 なんとか持ち歩きに便利になるよう,KindleDXで出来ることと出来ない事をはっきりさせ,快適に使えそうな機能の洗い出しと,すっぱりあきらめるべきところを切り分けたいと考えて試行錯誤を続けています。

 現在解決の目処が立っていないのが,PDFのメタデータの取り扱いです。

 事の起こりは,青空文庫をPDFにオンラインで変換してくれるというありがたいサービス「青空キンドル」を使って作成したPDFを入れた時に,それまで出てこなかった著者名がローマ字で出ていたことを見つけたことに始まります。

 そういえば,プリインストールされていたKindleDXの説明書にも,著者名としてAmazon.comと出ていたことを思い出しましたが,なぜか自炊したPDFファイルには著者名が出てきません。

 きっと空欄になっているのだろうと,PDFのメタデータを確認すると,予想通り空欄になっています。そこでここに日本語で著者名とタイトルを書き込み,ワクワクしながらKindleに入れたのですが,結果は変わらず表示されません。

 なぜだ,この疑問が消えるまで試行錯誤がしばらく続くことになります。


(1)青空キンドルで作成したPDFではなぜ著者名が出ているのか

 青空キンドルで作成したPDFでは,半角アルファベットで著者名が出ています。一方タイトルは日本語ですが,これはファイルネームがそのまま,拡張子無し表示されているだけです。

 このファイルをBeCyPDFMetaEditで開いてみると,Authorに半角アルファベットで著者名が書かれています。ならばこれを日本語に書き換えて試してみると,著者名は出てこなくなってしまいました。


(2)再起動

 Kindleはフォントの入れ替えを行った際にも再起動しなければ変更が反映されません。本も同じ話らしく,キャッシュをクリアしないといけないとのことで,メタデータを埋め込んだ同名のファイルを上書きした場合,再起動がないと著者名が表示されないようです。

 結果,日本語でメタデータを書いたものは再起動後も著者名が出てきませんが,半角のアルファベットで書いたものは再起動後には著者名が出てきました。やはり再起動は必要なようです。


(3)メタデータが正しく埋め込まれているのか

 ある海外のblogによると,正しいメタデータが埋め込まれないとダメだとあります。当たり前の話ですが,ではその正しいメタデータの埋め込みとは,どうやって行えば良いのでしょうか。

 PDFのメタデータはAdobe Acrobatで書き込むのが確実なのでしょうが,そこそこ高価なアプリですのでどこにでもあるようなものではありません。私の場合,AcrobatとBeCyPDFMetaEditというフリーソフトと,定番のpdftkの3つを使ってみました。

 結果だけ書くと,どれも同じになりました。当たり前の話ですが,足下をすくわれたのは,Acrobatをインストールしたマシンでは,エクスプローラ上でプロパティを選ぶとPDFタグが現れ,ここでメタデータを編集できるのですが,実際には編集が反映されていないケースがあったようです。

 でも,そんなことが本当にあるのか,作業がややこしくなって変更前のファイルが混じってしまったんじゃないかなど,不確かなことも多いので,話半分と思っていてください。


(4)メタデータの文字エンコード

 ふと,メタデータの文字エンコードって実はなにを使ってんだろ?と疑問がわきました。KindleはUnicodeですので,もしメタデータの日本語がSJISなどで書かれていたら正しい表示は期待できません。

 そこで,pdftkを使ってメタデータを打ち込んでみます。pdftkでは,メタデータを別途テキストファイルに書いておく必要があるのですが,このテキストファイルをSJISとUTF-8の両方で作成し,それぞれで試してみました。

 出来上がったPDFをBeCyPDFMetaEditで見ると,UTF-8では正しく表示されているのに,SJISでは文字化けしています。予想通り,メタデータはUnicodeで書くべきもののようです。

 さっそくこのUTF-8でメタデータを書いたPDFをkindleに入れてみましたが,結果は残念なことに,なにも表示されませんでした。


(5)PDFのバージョン

 これも同じ海外のblogにあったのですが,Kindleでメタデータを反映させるには,PDFのバージョンが1.4以上でなければならないらしいのです。1.4というのはAcrobat5以降で対応可能なフォーマットなのですが,実はMacOSXのQuartzは1.3でPDFを生成します。ということは私が自炊したPDFは,メタデータが反映されないということになります。事実だとしたら結構深刻です。

 でこれは結論から言うとウソでした。

 1.3と1.4のそれぞれに,BeCyPDFMetaEditを使って日本語と半角アルファベットを著者名に埋め込んだファイルを用意しました。すると,1.3だろうが1.4だろうが,半角のアルファベットを埋め込んだ方は表示されたし,日本語を埋め込んだ方はどちらも表示されませんでした。

 
(6)タイトルはどうなの

 Authorについては,どうやら半角なら出てくるらしいとわかりました。ではTitleはどうかというと,これが不思議なもので,半角だろうと全角だろうと,メタデータからは表示されず,あくまでファイルネームの拡張子無しがそのまま出てきます。日本語のタイトルを付ければ,それがそのままタイトルとして列びます。


(7)フォントのせいではないのか

 日本語を含まないフォントを使っているから非表示なっているという可能性については,否定こそ出来ませんが,Kindleで使用するSans,Serif,Monospaceの3書体のうち,日本語を含まないフォントのままにしてあるのはMonospaceだけです。

 表示されている著者名のアルファベットを見ていると,およそMonospaceとは思えませんので,Monospaceを日本語を含むものにしたところで,解決しないと思います。


 とまあ,こんな具合です。

 すでにおわかりのように問題はとてもシンプルで,結局メタデータはAuthorだけが有効で,それも半角で書かれた場合のみ表示されるようです。タイトルはメタデータに関係なく,ファイル名から拡張子を除いたものがそのまま日本語だろうが何だろうが表示されます。

 しかし,google先生に聞いてみますと,「メタデータを日本語にすれば著者名も日本語で出るはず」という意見が見られる上,日本語は著者名では出ない,という記述が見当たりません。私だけの問題なのか,そういうものとあきらめるべき所なのか・・・

 さらにgoogle先生に聞いてみると,某巨大掲示板の過去ログに,同じ疑問で悩んでいる人がいて,どうも半角アルファベット以外は無効なデータとしてスキップするようになっているんじゃないだろうか,ということが書かれていました。

 うむー,ファイルネームに日本語が混じっていた場合,無効なデータとしてタイトルを空欄にすると,そのファイルへのアクセスが出来なくなってしまいますので,特にそういうフィルタを入れていないというのはなるほど分かる話で,メタデータのみに限定してフィルタを入れたというこの憶測は,あながち否定できません。

 まあどっちにしても,仕様であるかないかに関わらず,私と同じく著者名が日本語で出ないという人がいて,同時に日本語で出たという人が見当たらない現状では,最終的にPDFのメタデータを使って著者名を日本語で出す方法はない,という結論に落ち着きそうです。

 実は,Kindleは著者名でソートをかけられるので,著者名が出てきてくれるととてもありがたいのです。そこで,著者名は半角アルファベットで記述するという運用を行うことにしました。

 過去の自炊データも含めてすべてのPDFにメタデータを書くのはさすがに骨が折れるので,Kindleに入れることになったものに限定することとします。

 とにかく,BeCyPDFMEtaEditを使えばKindleに有効なメタデータを書き込むことが出来て,同じ名前のファイル名のものを上書きしても再起動すれば茶社名が反映されることが分かっていますので,あとは単純な作業をコツコツやるだけです。

 でも,やっぱり日本語にこだわる書籍だからこそ,著者名も日本人として,日本語で書かれたものを見たいものです。これを実現するにはフォントハックを改良し,著者名をメタデータから取ってくるときに,余計なフィルタを外すだけで済みそうな気もするのですが,私にそこまでの根性もあるわけはなく,さくっとあきらめることにします。

 最後の手段は,PDFをmobipocket形式に変換することです。MobiPocketCreatorというソフトが無償で公開されていて,これを使えば一応作る事ができるということなのですが,どういうわけだか私は一度もPDFからまともに変換できずにいます。手間もかかるし綺麗に変換できないので,メタデータのためにわざわざこの手順を開拓するのは,やめにします。

 さあ,あとは持ち運びのためのケースを考えれば,持ち歩きが可能になります。いろいろ考えていますが,いいものが出来たらここで紹介したいと思います。

黒Kindleを日本語表示可能にする

ファイル 386-1.jpg

 さて,私の手元に届いたKindleDXですが,久々にワクワクしています。絶対に必要という訳ではないが,あれば確実に生活を変えてくれるであろうという期待がある時には,特有の高揚感を楽しむことが出来るものです。

 はるばるアメリカからやってきた段ボール箱を開くと,充電をしなさいと言う画面を表示した本体が目に飛び込んできます。

ファイル 386-2.jpg

 私は紙を挟んであると一瞬考えてしまったのですが,冷静に考えるとこれは紙を挟んであるわけでも,シールを貼ってあるわけでもありません。本体のディスプレイにそのまま表示されているものです。

 保護用のフィルムを剥がすと,さらに感動します。いやー,eInkも良くなっているんだなあ。

 本体を取り出します。底にはケーブルとアダプタ,そして簡単なスタートアップガイドが入っていますが,iPodほどでなないにせよ,十分に開梱の儀式を楽しめました。統一された世界観で作られていることが,なにより楽しいです。

ファイル 386-3.jpg

 まずは充電をしないといけません。充電が終わったら,いろいろいじってみますが,思った以上にディスプレイの書き換えも速く,私はストレスをほとんど感じませんでした。

 書籍は何も買っていないので,とりあえずインストール済みの取扱説明書を読んでみますが,その段階で表示の美しさと,大画面の見やすさに素直に感動しました。紙の本ように分厚くなく,それで紙に近い取り扱いが出来ていることは,全く新しい体験と言えます。

 UIは前近代的な感じがする古くさいものではありますが,これがリッチなものであってもきっとディスプレイが原因で破綻したでしょうし,タッチパネルがあるとよいとは思いましたが,単機能なKindleの操作方法がややこしいわけでもありませんから,タッチパネルを付けることで重くなったり見にくくなるくらいなら,私はいりません。

 操作はとてもシンプルです。文字の拡大などはQWERTYキーで行うので知らないと操作できないのですが,知ってしまえばなんと言うことはありません。基本的にページ送りをするだけの話です。

 そして非常にシンプルなのは,書籍の格納方法です。USBで繋ぐとマスストレージでマウントします。第1階層にあるdocumentというフォルダにファイルを突っ込んでアンマウントすれば,すぐに認識されて画面から選択できるようになります。

 あとは普通のPDFのようにパラパラめくって読むだけです。

 ただし,よく言われていることですが,自炊PDFのように画像でスキャンしたPDFファイルなら日本語だろうとなんだろうと表示は可能ですが,日本語テキストが入ったPDFは開くことが出来ません。

 これは,フォントがKindleにないことも理由になっています。だからPDFにフォントの埋め込みを行うと表示されるようになるのですが,Macの場合この作業はとても楽で,プレビューで表示した後,別名で保存するとフォントが埋め込まれます。

 しかし,開くことが出来るようになっても,線画や解像度の高い画像の扱いが苦手なKindleは,フォントが埋め込まれてもそれらの画像の処理に膨大な時間がかかり,ものにも寄りますが実用的な速度で読むことが出来ない場合もありました。

 例えば先日購入したテレビの説明書です。そのままでは開くことが出来ず,フォント埋め込みで開くことが出来ましたが,図が多いページにさしかかるとフリーズしたかと思うくらい黙り込んでしまいます。電子レンジの説明書はもっと深刻で5分ほどなんの操作も受け付けませんでした。しばらく放っておくと動くようになっていたので,やっぱりPDFというのは重いフォーマットなんだなあと思いました。

 ということで,自炊PDFについては,何の工夫もしないで,十分に読書端末として機能してくれそうです。

 しかし,やっぱり書籍一覧で口の字がずらーっとならんで日本語が一切出ないというのは,やっぱり寂しいものです。せめてそこだけでも改善できないものでしょうか。

 世の中には,いろいろ面白いことを考える人たちがいます。実はHackすることで機能拡張を行うのが,すでにKindleでは当たり前のことになっているのです。

 スクリーンセーバを入れ替えるもの,フォントを入れ替えるものなど,いろいろあるようですが,定番はやはり日本語表示が可能になるようなHackです。

 しかし,私のKindleDXは7月7日に出たばかりの最新版。これにHackが揃っているとは思えません。複雑な手順を一発で済ませるHackも日本の有志の方が用意してくださっていて,これを使うと失敗することなく一発で日本語が扱えるようになるのですが,そんな便利なものがあるわけありません。

 ところが,海外には,すでに新しいKindleDXで動作可能なHackが用意されているのですね。早速JailBreakとFontHack,そしてScreenSaverHackを入手し,ドキドキしながら自分のKindleに入れます。

 フォントはUnicodeでエンコードされたTrueTypeでないといけない(ここで失敗すると再起不能になるらしい)とのことですが,私は手持ちがなかったのでxxxをyyyしてzzzすることで,ささっと作ってしまいました。必要な書体はサンセリフとセリフのレギュラー,ボールド,イタリックのレギュラーとイタリックのボールドの,合計8つです。FontForgeを使って作りました。

 そしてドキドキしながらインストール。再起動してやると,うまい具合に日本語のタイトルが出るようになりました。WEBを見てみましたが,Wikipediaの日本語サイトなども問題なく表示されるようになっています。

 残念ながらスラッシュドットをみたら再起動がかかってしまいました。

 まあ,WEBを見るのが目的ではありませんので,これで十分です。そもそも日本語入力も出来ないわけですからgoogleも使い物にならず,KindleであちこちWEBを見て回ろうとは思いません。確かに無料で使える3Gの通信回線は魅力的なのですが・・

 スクリーンセーバは,デフォルトのものがちょっと日本人には気持ち悪い図柄が多いので,是非入れ替えたいところです。何を入れようかなあと考えたのですが,本屋さんで付けてもらえる,あのブックカバーをスキャンして表示させようと閃きました。

 いくつか集めてみると,本屋さんごとに,あるいは時期によって,なかなかバラエティに富んでいて,面白いものです。電子書籍端末でもこうして本屋さんの個性を持ち歩けると,また別の楽しみが生まれます。

 ということで,ここまでは昨日までに終わった話。ここから先のお話として,デフォルトの辞書を英和辞典にすることがあります。もちろんコンテンツの充実も必要です。青空文庫をPDFにして読むとよいそうですので,早速作成してインストールしました。

 コレクションという,フォルダに似たような概念の仕組みがあるのですが,コレクション名は当然ながらアルファベットしか入力できないので,日本語のものを作成できません。しかし,USBで接続し,systemフォルダにあるファイルをエディタで開き,該当する名前に日本語を使い,en-USをja-JPに変更すると,ちゃんとコレクション名も日本語になってくれました。

 それとなにより,持ち歩きのために,カバーなり袋を用意しなければなりません。純正も含めてカバーを考えていましたが,せっかくの薄い本体が何ミリか分厚くなってしまうことは惜しいので,本のケースのような長辺側に口のある袋を用意し,これに入れて持ち歩けたらなと思っています。まあ,こんなものは既製品があるとは思えませんので,自分で何とか作らねばならんでしょう。

ファイル 386-4.jpg

 このWelcomeは,私にとっては,単なる顧客としての歓迎ではなく,一度は否定された電子書籍との関係を,違う立場から取り戻したという記念すべきWelcomeなのです。

 2010年は,私にとっての電子書籍元年となりました。

新しい第一歩とKindleDX

  • 2010/07/12 18:41
  • カテゴリー:散財

ファイル 385-1.jpg

 久々にワクワクするガジェットを買いました。Amazon Kindle DXです。

 ご存じのように,KindleはアメリカのAmazon.comが販売する電子書籍端末です。薄く,軽く,持ち運びに便利で,高反射率,高コントラストの電子ペーパー「eInkディスプレイ」を搭載し,本を読むという行為に最適化された,単機能端末です。

 我々日本人はこうしたハードウェアそのものに目が行きがちですが,Kindleの本質は,携帯電話を内蔵し,24時間いつでもどこでも繋がっていることと,そして繋がっていることに費用が一切かからないことです。もちろん,この通信機能を使って本を購入すれば,それにはお金を支払わねばなりませんが,費用の発生は購入したときだけ,とにかく繋がっているだけでお金がかかるという心理的負担が一切ないのです。

 考えてみてください。送料がかかる,電車賃がかかる,という話になったとき,その本を気軽に買おうという気がするでしょうか。

 もちろん,本当に欲しい本なら送料がかかろうと電車賃がかかろうと,プレミアが付いていようと買うとは思います。しかし,雑誌やどこにでもある本を,そうして買おうとするでしょうか。

 逆の視点で考えてみると,入手の難しい部数の少ない書籍であっても,予約もせず,大きな本屋に行くこともなく,もちろん送料もかからず,24時間どこでも買えてすぐに手元にやってきたなら,その本をもっと気軽に,それこそ雑誌気分で読んでみようと思うのではないでしょうか。

 私の思う,Kindleの本質はここにあります。我々は本を読みたいのであって,本を買いたいわけではありません。もっとも,本屋さんはブラブラするだけで楽しい場所ですが,通販サイトであるamazonにはその楽しさはありません。だから,目的である「読書」に極力早く簡単に達することができれば,それが一番だといえるわけです。

 かつて,内外の電機メーカー数社から,似たような書籍端末が出ていました。しかし,本体だけで本を買うことは当然出来ず,PCとの接続が前提でした。ひどいものになるとレンタルだけで購入することすら出来ないという,本好きを愚弄するような事を平気でやってのけて,当然ながら見事に大失敗をこいた例すらありました。

 電子ペーパーと言われる新しいデバイスは,LCDのように1/60秒でリフレッシュされるようなディスプレイではありません。LCDがブラウン管の後継なら,電子ペーパーはプリンタと紙の後継です。

 しかし,書き換え可能な紙をプリンタで何度も何度もその場で印刷するような経験を我々はしたことがありません。加えて,低速デバイスの代表であるプリンタを,組み込みシステム上どうやって扱うのがふさわしいのか,そこが思案のしどころです。

 当時はパネルだけが存在する状態で,これを制御するLSIもなければ,動かすソフトも,動かし方の大枠を決める概念すらありません。

 決まったパターンを専用の装置を使って表示することは出来ても,組み込み用のマイコンで任意の画像を描く方法が存在せず,それをどうやって作り上げればいいかさえ誰も答えを持っていませんでした。

 いかにすぐれたデバイスでも,他と組み合わせて完成品にしなければ,広くお客様に使って頂くことはできません。そして完成品があまりに複雑であると,今度はお客様に提供する側の負担が大きく,結果として良い製品を作ることが出来なくなります。

 何もお手本がないところで物事をスタートさせるときには,こうして買って頂く方と,作る人たちの顔を思い描きながら,どちらもハッピーになるように,考えて作る事が求められると,私は思っています。

 見た目はLCDのようなディスプレイパネル,でもその本質は紙,もし理解を誤ってしまうと,この新しいディスプレイはお客様を失望させ,受け入れられる事無しに,姿を消すことになるでしょう。

 私の父は出版社の営業にいました。母は本屋さんで店員をしています。本は大好きで,本屋も大好きです。そして私は技術者になり,自分の力を大好きな本と本屋さんのために使うことが出来るはずと,そう考えていました。

 しかし,よくある「失敗」として処理され,私は本からも本屋からも必要のない人間だと宣言されるに至ります。

 Kindleの画面を見ると,なぜか暗雲の垂れ込めたような,今にも雨の降り出しそうな,複雑な気持ちになってしまいます。これはもう避けようのないことですね。

 閑話休題。

 そのKindleは,本を読む,本を買うということに特化した単機能端末であることは既に書きました。この点で何でも出来るマシン,例えばiPadなどとは全く性格を異にします。

 動画も音楽もゲームも満足に扱えませんが,文字を読むにはこれ以上のものはないと思われるほど視認性に優れたeInkディスプレイを持っています。私が選んだDXは,実に824x1200ピクセルという高精細なもので,その解像度は150dpiです。かつて日本の標準プリンタだったNECのPC-PR201などは160dpi,エプソンのVPシリーズで180dpiでしたし,プリンタと違って16階調のグレイスケールですので,うまくデータを作れば300dpi程度の視認性は持っているでしょう。

 カラーではなく,自発光でもありません。まさにモノクロの印刷がなされた紙です。書き換えには時間がかかり,しかも表示完了から時間が経過すると少しずつコントラストが落ちてしまい,白がグレーに寄ってきます。

 ちょうど,紙の悪い週刊誌や新聞という感じでしょう。しかし,紙と同じとは言いませんが,明らかにコンピュータとは異なる,間違いなく本を読むという体験を味わうことが出来ます。

 ここに,全世界で無料で接続可能なワイヤレス接続機能が付いていて,世界中どこからでも本を買うことが出来ることも前述の通りです。

 Kindleには初代のKindleの系統である小型版のKindle2と,大型化したKindle DXの2つがあり,それぞれにアメリカ国内版と国際版の2種類があります。初期のKindleは専用フォーマットのみが扱えたのですが,最近はPDFやMobipocketも扱う事が出来るようになりました。

 残念なことに,国際版でも購入はアメリカのamazon.comからでないとダメなのですが,手続きは簡単ですし,受け取ることも問題はありません。大した時代になったものです。

 7月7日,そのKindleDXにグラファイトと呼ばれる最新のモデルが加わりました。改良されたのは電子ペーパーの性能向上です。

 お値段は送料と関税をいれて約400ドル。円高ですので,35000円ほどで買える計算です。

 ずっとこの手の書籍端末を買おう買おうと思っていましたが,なかなか日本語に対応してくれず,国内販売も行われません。富士通から出てはいますが,あれもWindowsCEだったりして,今ひとつな感じです。

 iPadはやっぱり電子書籍端末ではないと私は思いますし,国内でも始まるであろう電子書籍ビジネスを待つのも,ちょっとどうかなと思っていました。

 それに私は,いわゆる「自炊」を初めて,もう3年になります。300GBを越える大量のPDFが,蔵書として揃っています。古いトラ技から新書・文庫,果てはコミックのたぐいまで,本を捨てられない本好きの私は,本を切り刻んでスキャンし捨てるという苦渋の選択によって,ようやく新しい本を買うことが可能な状態にあります。

 入力と蓄積は出来ています。あとは出力です。

 ここで紙に近いディスプレイを持つ電子書籍端末を揃えれば,このワークフローは完成します。

 そして,7月7日の新しいKindleDXの登場は,紙に変わる新しい出力先を提供するものとして,私の目に映りました。

 白より黒い方が好きでしたし,電子ペーパーはコントラストが命と思っている私は,もうくよくよしていても仕方がないと,思い切って買うことにしたのです。

 本体の大きさはおおよそB5のノートくらいです。厚みもノートくらいです。重さは結構あるのですが,薄くできているためハードカバーの文芸書を持ち歩くよりはずっと楽でしょう。

 なにもいいことがなかったという複雑な気持ちも手伝って,なかなか踏ん切りの付かなかった私は,amazon.comでぽちった後,大変に晴れやかな気持ちになりました。

 それでも持ち続けていたかすかな期待との完全なる決別,過去を踏み越えて進むことの気持ちよさ,そしてくだらないバイアスに惑わされることなく,手元に届く新しいガジェットを純粋に待ち焦がれる気持ち,数日そうした気分を味わいながら,7月6日に発送,翌日には日本に向けて飛び立ち,7月8日に成田に到着,当日中に配達されるも不在で受け取り損ね,そして7月10日に再配達という手順で,それは私の手元にやってきたのです。

ファイル 385-2.jpg

 ・・・長くなったので,続きは明日。

ページ移動

  • ページ
  • 1
  • 2

ユーティリティ

2010年07月

- - - - 1 2 3
4 5 6 7 8 9 10
11 12 13 14 15 16 17
18 19 20 21 22 23 24
25 26 27 28 29 30 31

検索

エントリー検索フォーム
キーワード

ユーザー

新着画像

新着エントリー

過去ログ

Feed