5月の最後に青空文庫のITインフラ周りの未来を考えるアイデアソンが開かれた。残念ながら、傍からでも参加できなかったのだけれどもなかなかの盛況だったようだ。ゆくゆくは若い世代に引き継がなければならないのだから今のところは遠いところから見ていようと思うのだが、何点か気になる点があったので最初にコメントしておこうと思う。
まず、今問題になっている校正システム(というのも実態を示していないと思うけれど)だが、会の中では校正待ちファイルが最重要というようなコメントがあったようだけれども、青空文庫としては入力受付からの作業中のステータス情報すべてが大切なんだと思っている。それはその情報が青空文庫の活動そのものだから。もし、中の人たちがテキストファイルが重要という認識を持っているのだとすれば、それは活動としては問題だと感じた。入力を宣言して、何か月も、何年もかけながらファイルを仕上げる人たちひとりひとりの善意が大切だと思ってほしいものだ。
ネットワークを利用した校正システムを立ち上げることは反対はしないけれど、いくつかの問題や課題があることも認識してほしい。ひとつはテキストアーカイブという作業が必ずしもネットワークのつながる場所でのみ行われる行為ではないこと。そして、校正作業に関しては紙の上で行った方が効果があることもあることをおさえて欲しい。特に青空文庫で問題となる「字形」についてはいいかげんなunicodeではなく、JIS字形に従ったコード体系で扱う必要があることに注意してほしい。これは、現代かなを中心に扱う現代の文章作成と古典的な字体も扱う青空文庫との違いの一つでもある。
それから、校正システムをネット上に置くことは、著作権の残る作品の場合には問題となることも注意してほしい。毎年、正月にアップしている著作権切れ作者のファイルは実際には著作権が有効になっている2年前、3年前から始まっている。このことは、個人で底本からファイルを作成し、青空文庫に送り、誰かがそれを校正する(青空文庫で受け取って校正にまわす時点でかなりグレーだとは思うが)。この作業は実際には著作権が生きている状況で行われている。これを底本や入力したテキストファイルを多数の見える場所に置くということは著作権保有者の要らぬ反発を招くのではないかと心配している。青空文庫の存在自体は認知されてきたとはいっても、青空文庫で行っていること全体がフェアユースとして認められているわけではないので、ひとつひとつの作業や環境について、著作権法から見て大丈夫なのかどうかをきちんと検証しながら進めていく必要があるだろう。
テキストの間違い指摘のシステム化の話も出たらしいが、会の中ではどうやら黒歴史の問題が大きいとコメントされたらしい。しかし、実際的には間違いの指摘において、もめる前に、底本の確認なく読者が違和感を感じただけで指摘を上げ、それを底本にあたって調査するといったやりとりの負荷がまず問題だったと感じている。当時、ほとんどの指摘に関して、県立図書館、市立中央図書館という中核図書館の近所にいた富田さんが対応していたが、そのやりとりは見ていても頭が下がるものだった。しかも、ほとんどは「底本ママ」ということで、指摘者の誤指摘なのだけれども、そうしたやり取りが対応者の負荷となっていた。せめて、底本との比較をして、その結果をもって通知というプロセスを求めるべきであったと、今思い起こすとそのように感じている。
その中で、底本原理主義者ともいうべき、「ケ」「カ」にまつわる問題が発生する。基本的に底本のまま、ただし、日本語が揺れる過程で発生した「ケ」「カ」という文字については青空文庫のテキストではこうしますと決めてしまえば問題ないように思うのだが、自分の考えは曲げられないという主張が長い間の論争につながってしまったのは残念だ。
同様に、日本語の解析のために青空文庫を利用できるようにしたらどうかという意見もあったようだけれども、文学部の論文のためには、校正のしっかりとした底本が欲しいというアカデミアサイドからの文庫本底本排斥の動きがあったこともひとつ覚えておくべきだろう。本来、論文に使うのであれば、きちんとした底本に基づいて各自が校正をかけてから使うというのが正しい研究の進め方のようにも思うのだが、自分の論文の研究に使えないから青空文庫は危険だという主張も過去にはあったということも覚えておいて欲しい。それほど、他力本願と自己主張のターゲットに青空文庫も巻き込まれた歴史がある。
この話の最後に、当日のツイートを読んでいて悲しくなったということを付け加えておこう。
前半のプレゼンの最中のコメントで「80のためになんで対応しなければならない」という趣旨の発言があったが、現在、利用できる青空文庫のテキストは、その80歳の人たちも含めて多くの先達たちの努力のもとに作られてきたことを忘れてはいけないだろう。それだけでなく、死後50年で涙をのんだ遺族やその何十年も前に著作を書き上げた方たちの行為の上で、私たちはそれを利用できているのだということを、もし、青空文庫の活動に関わるのであれば忘れてはいけないと思う。
いろいろな背景と現状システムの状態遷移、フロー図については、力になれる部分もあると思うので、必要ならよろしくです。
さて、長い長い脱線から戻して、きっと短い本題へと入ろう。
青空文庫のまず初期は量を増やすことが活動の中心だったように記憶しているというのは前回までのお話。
さて、量が出てきたところで、工作員の私が勝手に考えたのは次の2点だった。
(1)青空文庫を読む人を増やそう
(2)青空文庫を使って、青空文庫らしいテキストを拾おう
当時、数の増加に寄与したのは森鴎外、夏目漱石と全集のほとんどがテキストになった芥川龍之介の存在だった。一時は芥川文庫などとも揶揄されたが、そのくらい、芥川の量は多かった。純文学に、特に古典の偏った状態は読者を広げられるとは思えなかった。
文学作品の基本は大衆文学であるというおかしな信念を持っている私は、まず、大衆文学の分野の拡充に手を染めようと思った。それが、チャンバラと探偵小説の入力だった。林不忘や大阪圭吉などの作家を探しては入力することをしていた。その中で、翻訳が欲しいと探し出したのがポーの一連の翻訳だった。長らく黒猫やモルグ街がランキング上位に入っているのを見ると、その選択は正しかったように感じている。
また、その作家探しの中で見つけ出したのが、佐左木俊郎である。
新潮社の編集者であり、若くして亡くなった作家であった佐左木の作品は独特の雰囲気を持ったものばかりで、私は一気に引き込まれた。特にショックを受けたのはその全集の立派さと、その割に進んでいるようには見えない版の状態だった。要は立派なやすい古い本を入手して、これはダメだろうと思ったという事だ。そこで、全集を題材にいくつか見繕って入力公開することで紹介できないかと思った。いまでも、ランキングの上位に入ることはないけれども、朗読のファイルが作られたり、ドラマ化されたことを考えるといくらかは前の状況よりはよくなったのかもしれない。
次の話は、佐左木の経験とよく似ている。
インターネットとテキストアーカイブを利用することで変わることはなんだろうか? それは、自分の著作の流通コストが下がるということだと考えている。下がることで、いままでは読者が少なくて流通に乗ることが少なかった作者の著作を広げられることはできないか? この発想から、日本における(青空文庫が日本語のアーカイブだから)マイノリティの作品を取り上げてみようという作品探しだった。この作品探しから、沖縄、併合時の朝鮮人といった視点で作者を選び出したが、残念ながらマイノリティの文学はその量が著しく少ない。特に、アイヌと琉球は、物語を小説という文字ではなく、歌で残すという文化が似ていて、なかなか文字で残されたものを探し出すのが難しかった。ちなみに我が家には東洋文庫の伊波の「をなり神の島」(全2巻)が入手済みになっている。いつか作業できればと思うが、さて、いつ開始できるものかわからない。
次のマイブームはSFをコレクションしようだったけれども、この話は、青空文庫の未来の話とともに次にまわそうと思う。