PJA
PJA:アクセシブルな日本語EPUB/HTML作成補助ツール
PJAは、アクセシブルな日本語のEPUB/HTMLを作成するための補助ツールです。EPUB3、DAISY 2.02 あるいはHTMLファイルの編集時に、ルビやわかち書き情報を一括して付与し編集する汎用ツールとして無償でご利用いただけます。
DAISY製作ソフトであるDolphin PublisherによるEPUB作成機能では、原本ページ一覧、ルビ、わかち書き、見開き情報等について編集できません。このようなDolphin Publisherが実現できない日本語固有の機能を補助的に実現するのがPJAを開発を始めたきっかけです。
PJAによる変換
PJAによる変換は前変換と後変換の2つに分かれます。
1)前変換:ルビや分かち書き情報の一括付与
前変換では、本文中の日本語テキストをMeCabという形態素解析エンジンで解析し、ルビや分かち書きの情報を一括してPJAの独自記法でテキストとして書き出します。
デイジー教科書を編集します。
↓ 前変換
デイジー|教科書〈きょうかしょ〉を_|編集〈へんしゅう〉します。
2)後変換:ルビ・分かち書き情報のHTMLへの変換等
機械的にうまく読み情報が付与できていない箇所や、分かち書きが正しい位置に付与されていない箇所を手作業で編集した後に、後変換を行います。
後変換では、PJAの独自記法で記述された箇所を解析し、HTMLのタグに変換します。
デイジー|教科書〈きょうかしょ〉を_|編集〈へんしゅう〉します。
↓ 後変換
デイジー<ruby><rb>教科書</rb><rt<きょうかしょ</rt></ruby>を<wbr/><ruby><rb>編集</rb>
<rt>へんしゅう</rt></ruby>します。
注:分かち書きの箇所は<wbr/>というタグを用います。<wbr/>のタグを空白として表示するかどうかについてはW3Cの仕様案CSS Text Module Level 4にて検討が進んでいます。なお、弊社のEPUB、DAISY再生アプリであるボイス オブ デイジー 5では、<wbr/>による分かち書き箇所を「分かち書きしない」「分かち書きする」「|で表示」「/で表示」で切り替えられます。
◆ Dolphin Publisher固有の処理
Dolphin PublisherでEPUBを製作する際の固有の処理として、後変換時に以下の処理が行えます。
- 空のmetaタグの削除
- ページ番号箇所へのepub:type=”page-break”属性の付与
- ナビゲーションファイルにページ一覧の情報を追加
Dolphin Publisher以外でEPUBを製作する場合や、Dolphin PublisherでDAISY 2.02を製作する際には、この処理は不要です。
◆ ページめくり順情報の付与
EPUBの構成ファイルであるopfファイル内にページのめくり順の情報を付与できます。縦書きの場合にめくり順を付与しないと、見開き表示時に、左右の順にページが表示されてしまい、とても読みにくくなってしまいます。
■ 動作OS
Windows 7/10
■ インストール
PJAは弊社より無償で提供しているソフトウェアです。現在の最新版はバージョン1.3.0です。以下の手順でインストールしてご利用ください。
- インストールイメージが格納されているzipファイル(pja-1.3.0-2020-08-19.zip)をダウンロードします。
- zipファイルを解凍し、setup.exeを実行するとインストーラが起動します。画面の指示に従ってインストールを行ってください。
- インストールが完了すると、PJAという名前のアイコンがデスクトップやスタートメニューに登録されます。
詳しい使い方はヘルプをご覧ください。
■ その他の情報
支援技術開発機構(ATDO)様の以下のページに、PJAを併用したDolphin PublisherによるEPUB3 Media Overlays形式のデイジー教科書製作方法に関する紹介があります。Dolphin Publisherにてアクセシブルな日本語EPUB3 Media Overlays形式の製作をされる方は、下記のサイトをご覧ください。
https://www.atdo.jp/836(ATDO:DolphinPublisherで、縦書きルビ等を含むEPUB教科書を作る手順)
■ サポート
不具合報告、ご意見、ご希望等のPJAに関するお問い合わせは、cypac★cypac.co.jpまで電子メールにてお願いいたします。←★を@に置きかえてください。
■ 過去のバージョンのインストールイメージ
バージョン/インストールイメージ
- 1.3.0/pja-1.3.0-2020-08-19.zip
- 1.2.1/pja-1.2.1-2020-01-10.zip
- 1.1.2/pja-1.1.2-2019-10-24.zip
■ 既知のバグ
MeCabが単独でインストールされており、MeCabに標準添付されるIPADICの辞書をUTF-8以外の文字コードで生成していると、PJAの変換結果が文字化けします。単独でインストールされているMeCabを削除するか、単独でのMeCabのインストール時にIPADICの辞書をUTF-8の文字コードで生成してください。なお、PJAのインストールイメージにはMeCabが含まれているため、特別な理由が無い限り、MeCabを単独でインストールする必要はありません。
バージョン1.3.0を公開しました。(2020年8月21日)
バージョン1.3.0では以下の修正を行いました。
- rpのタグと括弧を出力するオプションを追加しました。
- 記号類に対してルビが振られる問題に対応しました。
- 「言い方」などのルビの付与が適切でなかった問題に対応しました。
分かち書きエンジン部分のソースコードを公開しました。(2020年2月10日)
PJAで分かち書きを行うのに利用している、C++で記述した分かち書きエンジン部分のソースコードです。
このソースコード一式にて、光村図書出版様の小学校低学年の国語教科書で使われている分かち書きの規則にできるだけ沿ってUTF-8のエンコーディングのテキストファイルを分かち書きする、コマンドライン版のmitumurawakati.exeをビルドできます。分かち書きを行うプログラムの開発にご利用ください。
詳しくは、mitumurawakati-2020-02-10.zip内のreadme.txtをご覧ください。
バージョン1.2.1を公開しました。(2020年2月7日)
光村図書出版様の小学校低学年の国語教科書で使われている分かち書きの規則にできるだけ沿って分かち書きを行う機能を追加しました。この分かち書きの処理については慶應義塾大学特任教授の村田真先生による研究成果を元にPJAへの実装を行いました。村田真先生、研究成果のご提供ありがとうございました。
アクセシブルな日本語EPUB作成補助ツールPJAを新規公開しました。(2019年10月29日)
サイパックで開発した、アクセシブルな日本語EPUBを製作する際に、ルビや分かち書きの一括付与等が行える作成補助ツールPJAを新規公開しました。こちらのツールはどなたでも無償でご利用いただけます。
リリースノート:pja-releasenote-2019-10-30.pdf