青空文庫

提供: miniwiki
2018/8/13/ (月) 01:11時点におけるAdmin (トーク | 投稿記録)による版 (1版 をインポートしました)
(差分) ← 古い版 | 最新版 (差分) | 新しい版 → (差分)
移動先:案内検索

テンプレート:Selfref

青空文庫
ファイル:Aozora Bunko Logo.png
URL
https://www.aozora.gr.jp/
タイプ 電子図書館
使用言語 日本語
項目数 14,704作品 (2018年4月12日現在)[1]
閲覧 無料
登録 不要
著作権 青空文庫収録ファイルの取り扱い規準[2]に従う
資金 寄付
営利性 非営利
設立 1997年2月[3]
現状 作品数増加中

青空文庫(あおぞらぶんこ)は、著作権が消滅した作品著者が許諾した作品のテキストを公開しているインターネット上の電子図書館である[4]富田倫生野口英司八巻美恵らんむろ・さてぃの4人が呼びかけ人となって発足した[5]日本で著作権切れ作品をオンライン公開する動きの先駆者[6]。2017年の年間アクセス数の合計は920万件以上[7]

収録作品はボランティアの手によりJIS X 0208漢字の範囲で青空文庫形式テキストファイルやHTMLとして電子化されている。また、「青空文庫収録ファイルの取り扱い規準」に従い自由に利用出来るため、その収録作品はパーソナルコンピュータのみならずPDA携帯電話などの環境でも利用されている。テキストファイルである事から、大きな文字で印刷したり、テキストを読み上げるソフトウェアと組み合わせるなど、視覚障害者向けとしても利用が期待されている。

青空文庫として閲覧ソフトウェアを開発したり提供したりはしていないが、電子辞書やiPhoneアプリなどで専用ビューアーがサードパーティによって開発されている[8]

収録作品

著者の没後50年を経て日本国内において著作権が消滅した、明治から昭和初期の作品が蔵書の大部分を占める。外国語作品の翻訳や著者自身により無償閲覧の認められた現代の作品もある。ジャンルは政治から趣味まで幅広いが、比較的文学作品(時代小説・探偵小説などの娯楽作品も含む)が多い。必ずしも著名な作品が全て揃っているとは言えないが、日本語作品に関しては相当充実してきている(外国語作品の場合、翻訳者の著作権の関係で、まだ数が少ない)。また、マイナーな作品を保存・紹介できる利点もある。作品の電子化は現在進行形で進められており、2011年3月15日、収録作品数が1万点になった[9]。古くは森鴎外夏目漱石芥川龍之介など、近くは中島敦(1942年没)、太宰治(1948年没)、林芙美子(1951年没)、宮本百合子(1951年没)、堀辰雄(1953年没)、坂口安吾(1955年没)、高村光太郎(1956年没)、永井荷風(1959年没)、吉川英治(1962年没)などの作品がある。

運営

青空文庫はボランティアで運営されており、閲覧は無料[4]。開始当初サーバーはボイジャー (企業)から提供された[3]。1998年から1999年にかけて富田らが作業ルールとマニュアルを決めた[8]

入力と校正はボランティアによって行われる[4]。入力は底本を見ながらの手入力かスキャナーを使う方法で行われる[4]。作品を入力する「入力者」と入力された作品を校正する「校正者」とは別々のボランティアが担当する[10]。そのため作品が公開されるまでには、作品を入力したあとで校正者が校正の予約をするまで作業状態が「校正待ち」となり、作業がストップすることになる。つまり入力者のボランティアが作品を入力しても校正者のボランティアが校正予約をして校正作業を完了しない限り作品を公開することはできない。そのため入力が完了しても作業状態が「校正待ち」のままになった作品が増加している[11]。これは入力者に対して校正者が不足しているためで、青空文庫が発足した当初から抱えている問題である[12]。この校正者不足問題に関しては、作品の校正作業なしで公開する案や、入力者による校正を認める案が提出されたことがあるが、これまでのところそれらの案は採用されていない[12]。寄付金を原資とした「有償校正」が2011年(平成23年)12月16日に公開された作品から始まった[13]

2013年8月に創設者の一人である富田が亡くなったことを機に、青空文庫への継続的な支援を目的とした「本の未来基金」が設立された[14]。しかし2015年現在はエンジニアが不在の状態でのサーバ運用を余儀なくされており、サーバ自体も老朽化が問題になっている。このため同年5月に「『Code for 青空文庫』アイデアソン」が開催され、今後のシステム運用についての意見交換が行われた[15]。その後同イベントを母体に、システム管理やコード改修などを行う「aozorahack」プロジェクトが立ち上がっている[16]

青空文庫形式

テキストファイルを青空文庫に収録する際にテキストファイルが従わなければならない書式のことを青空文庫形式という。

青空文庫形式は、テキストファイルとして多くの環境で読む事ができるように規格化されている。できる限り底本の忠実な再現を目指しているが、改行や挿絵などの情報は原則として含まれない。

青空文庫形式に対応しているテキストビューアやテキストエディタもあり、ルビや傍点などの再現も可能である。また、これらのテキストビューアでは本来の青空文庫形式に含まれない挿絵の情報を挿入したり、縦書き表示にしたりすることも可能であり、テキストを読みやすくするための様々な機能が用意されている。これらのソフトウェアに関しては有料・無料問わず色々なものがある。

ルビの表記

ルビの表記は |と《》によって表現される。[17]ルビを《》で囲んだり|でルビのかかる文字列を特定するのは、視覚障碍者読書支援協会(BBA)[18]の原文入力ルールに合わせた[19][20]ものである。

青空|文庫《ぶんこ》

とあれば、「ぶんこ」というルビが「文庫」についていることを示す。

本日は晴天《せいてん》なり。

のように、仮名と漢字の間に|が入る場合は|を省略することも出来る。

|ブルースカイ《青空》

のように、仮名にルビを強制的に振る時に使用することもある。

入力者注

底本の再現の補助として入力者注の形式も定められている。

これ[#「これ」に傍点]を、使って下さい。

喉を掻き※[#「てへん+劣」、第3水準1-84-77]《むし》って

のように傍点を入れたり、JIS X 0208漢字に含まれない旧字や外字などを説明したりする時などに使われることが多い。

問題

著作権保護期間延長問題

2003年以降、米国政府は「年次改革要望書」を通じ、日本政府に対して著作権の保護期間を「個人の場合は死後70年・法人の場合は公表後95年」に延長することを要求している。これを受けて文化庁は、2007年中に文化審議会著作権分科会で結論を得ると表明している。保護期間を延長する法改正が実際にされた場合、青空文庫は改正法の施行から最短でも20年間は新規の作品登録が困難になるおそれがあるため、2005年1月1日付けで反対声明を公表した。さらに、2007年1月1日からは同趣旨の請願署名を開始した[21]

日本国外では現に、エリック・エルドレッドEric Eldred)やオーストラリアプロジェクト・グーテンベルクの活動が著作権保護期間延長によって困難になってきている。青空文庫が延長反対を表明し、請願署名を行っているのも[22]、そうした前例を受けてのことである。

2015年10月5日に大筋合意に達した環太平洋経済連携協定(TPP)の中に著作権の保護期間延長を求める条項が含まれており、妥結の結果法改正が行われると青空文庫の活動にも影響が生じることから、今後を懸念する意見も出ている[23]

ケヶ問題

青空文庫の作業規定では、底本の「ケ」を「こ」「か」「が」と読む場合は「」に置き換えて入力するように方針を決めている[24]。例えば、底本に「霞ケ関(かすみがせき)」とある場合には、「ケ」を「が」と読むので「霞ヶ関」として入力する。さらに、青空文庫形式のファイル末尾の注釈に「※底本は、物を数える際や地名などに用いる「ヶ」(区点番号5-86)を、大振りにつくっています。」と注記する必要がある[25]

一方、作業規定の方針としては底本の文章は勝手な変更を加えずなるべく元のままで入力する規定もあり[26]、「ケ」を「ヶ」に置き換えしない方がいいとする意見もある。現行の作業規定に従うことに賛成するグループと反対するグループとの間で論争になっている[27]が、未だ決着は付いていない[28][29]

Unicode問題

青空文庫ではテキストの文字符号化方式Shift_JISを採用している。そのためテキスト入力に際して次の例のような置き換えを行っている。

森鷗外→森鴎外、內田百閒→内田百間、大倉燁子→大倉※[#「火+華」、第3水準1-87-62]子

置き換えを回避するため、Unicodeの採用を求める声もあるが、包摂分離のための見直しを公開済みの全てのテキストに対して行わなければUnicode化はできないと主張する運営側と、公開済みの分は保留として新規分からUnicode化すべきと主張するグループとの間で対立が生じている。

関連書籍

  • 『青空文庫へようこそ――インターネット公共図書館の試み』 青空文庫・本とコンピュータ編集室、トランスアート〈Honco双書〉、1999-11-11、初版。ISBN 4-88752-115-4。 - 青空文庫と季刊『本とコンピュータ』編集部との共同編集。
  • 『インターネット図書館 青空文庫』 野口英司、はる書房、2005-11-15、初版。ISBN 4-89984-072-1。 - DVD-ROM1枚が資料として付属している。
  • 『青空文庫 全』 - 2007年10月末から全国の公共図書館に無償配布したDVD-ROM付き小冊子[30]。なお、DVD-ROMの内容はBitTorrentで配信されている[31]

脚注

  1. 青空文庫 Aozora Bunko”. 青空文庫 (2018年4月12日). . 2018閲覧. 青空文庫トップページ下部の「収録作品数」より。
  2. 青空文庫収録ファイルの取り扱い規準
  3. 3.0 3.1 青空文庫の仕組みのページより。
  4. 4.0 4.1 4.2 4.3 「(文化の扉)はじめての青空文庫 タブレット広まり利用者急増」朝日新聞2012年1月23日31ページ
  5. 『青空文庫ものがたり』:新字新仮名 - 青空文庫
  6. 「メディア事情:ネットで文化遺産共有=国立情報学研究所客員教授・岡村久道氏」毎日新聞東京朝刊2006年9月10日26ページ
  7. 青空文庫 2016年-2017年の年間アクセス増率分析 aozorablog 投稿者:POKEPEEK2011 | 投稿日:2018年1月22日
  8. 8.0 8.1 『日本の電子出版を創ってきた男たち: この声を聞かずして、電子出版を語るなかれ。』 ISBN 978-4-86478-002-5 「日本が誇る青空文庫の軌跡」OnDeck編集部 2015年2月6日
  9. 工藤ひろえ (2011年3月16日). “青空文庫、収録作品が1万点に到達”. INTERNET Watch. . 2011閲覧.
  10. 工作員志願者へのお願い (青空文庫)を参照。
  11. 作業中 作家別作品一覧:全て(CSV形式、 zip圧縮)」によると、2010年(平成22年)1月29日の時点で「校正待ち」の作品は1695作品である。「校正待ち」の作品で最も古いものは戸坂潤の作品「現代唯物論講話」等で日付は2001年(平成13年)7月28日である。一方、「公開中 作家別作品一覧:全て(CSV形式、 zip圧縮)」によると、2010年(平成22年)1月29日の時点で「公開中」の作品は8736作品である。
  12. 12.0 12.1 2010年(平成22年)01月18日付け「そらもよう」掲載のトレンドイーストによる校正支援を参照。
  13. “寄付金を原資とした校正について”. そらもよう (青空文庫). (2011年12月16日). https://www.aozora.gr.jp/soramoyou/soramoyou2011.html#000403 . 2013閲覧. 
  14. 青空文庫のしくみ
  15. 「Code for 青空文庫」アイデアソン #1 - ATND
  16. aozorahack - GitHub
  17. HTML版工作員作業マニュアル 2.入力-1(青空文庫)→(5)特殊な表記
  18. 視覚障碍者読書支援協会”. 視覚障碍者読書支援協会. 2008年6月16日時点のオリジナルよりアーカイブ。. 2011閲覧.
  19. 富田倫生〈イネーブル・ライブラリー〉としての青空文庫」、『現代の図書館』第37巻3号(通巻 151)、日本図書館協会、1999年9月、 176-181頁、 ISSN 0016-6332
  20. 「リンク」ページ(青空文庫)
  21. そらもよう 2005年01月01日 反対声明 (青空文庫)
  22. 著作権保護期間の延長を行わないよう求める請願署名 (最終更新 2008年10月13日、青空文庫)
  23. TPPの著作権保護期間20年延長で「青空文庫」はどうなる? - THE PAGE・2015年8月8日
  24. 区点番号5-17と5-86の使い分け指針 (青空文庫)
  25. 青空文庫収録ファイルへの記載事項
  26. 青空文庫からのメッセージ―本という財産とどう向き合うか
  27. 青空文庫の掲示板[こもれび]で批難の応酬が続いていたが、決着を見ないまま2013年12月をもって掲示板は青空文庫のサイトから外された。
  28. 賛成派の意見は「ケ」のように見える文字の入力について (富田倫生)を参照。
  29. 反対派の意見は『「ケ」のように見える文字の入力について』批判(土屋隆)を参照。
  30. 詳細は『青空文庫 全』寄贈計画のお知らせを参照。
  31. 詳細は「青空文庫 全」DVDのBitTorrent配信を始めました(2009.3.7 MediaLab Love)および「青空文庫 全」DVDから2009/3/5までの差分配信を開始しました。(2009.3.9 MediaLab Love)を参照。

外部リンク

テンプレート:Ebooks