ページのヘッダイメージ

PJA:アクセシブルな日本語EPUB/HTML作成補助ツール

PJAは、アクセシブルな日本語のEPUB/HTMLを作成するための補助ツールです。EPUB3、DAISY 2.02 あるいはHTMLファイルの編集時に、ルビやわかち書き情報を一括して付与し編集する汎用ツールとして無償でご利用いただけます。

DAISY製作ソフトであるDolphin PublisherによるEPUB作成機能では、原本ページ一覧、ルビ、わかち書き、見開き情報等について編集できません。このようなDolphin Publisherが実現できない日本語固有の機能を補助的に実現するのがPJAを開発を始めたきっかけです。

2020年2月7日(金)にバージョン1.2.1を公開しました。光村図書出版様の小学校低学年の国語教科書で使われている分かち書きの規則にできるだけ沿って分かち書きを行う機能を追加しました。この分かち書きの処理については慶應義塾大学特任教授の村田真先生による研究成果を元にPJAへの実装を行いました。村田真先生、研究成果のご提供ありがとうございました。

PJAの分かち書きエンジン部分のソースコードをこちらのページにて公開しました。

PJAによる変換は前変換と後変換の2つに分かれます。

■ 前変換:ルビや分かち書き情報の一括付与

前変換では、本文中の日本語テキストをMeCabという形態素解析エンジンで解析し、ルビや分かち書きの情報を一括してPJAの独自記法でテキストとして書き出します。

デイジー教科書を編集します。
↓ 前変換
デイジー|教科書〈きょうかしょ〉を_|編集〈へんしゅう〉します。

■ 後変換:ルビ・分かち書き情報のHTMLへの変換等

機械的にうまく読み情報が付与できていない箇所や、分かち書きが正しい位置に付与されていない箇所を手作業で編集した後に、後変換を行います。

後変換では、PJAの独自記法で記述された箇所を解析し、HTMLのタグに変換します。

デイジー|教科書〈きょうかしょ〉を_|編集〈へんしゅう〉します。
↓ 後変換
デイジー<ruby><rb>教科書</rb><rt<きょうかしょ</rt></ruby>を<wbr/><ruby><rb>編集</rb>
<rt>へんしゅう</rt></ruby>します。

注:分かち書きの箇所は<wbr/>というタグを用います。<wbr/>のタグを空白として表示するかどうかについてはW3Cの仕様案CSS Text Module Level 4にて検討が進んでいます。なお、弊社のEPUB、DAISY再生アプリであるボイス オブ デイジー 5では、<wbr/>による分かち書き箇所を「分かち書きしない」「分かち書きする」「|で表示」「/で表示」で切り替えられます。

◆ Dolphin Publisher固有の処理

Dolphin PublisherでEPUBを製作する際の固有の処理として、後変換時に以下の処理が行えます。

Dolphin Publisher以外でEPUBを製作する場合や、Dolphin PublisherでDAISY 2.02を製作する際には、この処理は不要です。

◆ ページめくり順情報の付与

EPUBの構成ファイルであるopfファイル内にページのめくり順の情報を付与できます。縦書きの場合にめくり順を付与しないと、見開き表示時に、左右の順にページが表示されてしまい、とても読みにくくなってしまいます。

■ 動作OS

Windows 7/10

■ インストール

PJAは弊社より無償で提供しているソフトウェアです。現在の最新版はバージョン1.2.1です。以下の手順でインストールしてご利用ください。

  1. インストールイメージが格納されているzipファイル(pja-1.2.1-2020-01-10.zip)をダウンロードします。
  2. zipファイルを解凍し、setup.exeを実行するとインストーラが起動します。画面の指示に従ってインストールを行ってください。
  3. インストールが完了すると、PJAという名前のアイコンがデスクトップやスタートメニューに登録されます。

詳しい使い方はヘルプをご覧ください。

■ その他の情報

支援技術開発機構(ATDO)様の以下のページに、PJAを併用したDolphin PublisherによるEPUB3 Media Overlays形式のデイジー教科書製作方法に関する紹介があります。Dolphin Publisherにてアクセシブルな日本語EPUB3 Media Overlays形式の製作をされる方は、こちらをご覧ください。

https://atdo.website/2019/10/28/epub_text/

■ サポート

不具合報告、ご意見、ご希望等のPJAに関するお問い合わせは、cypac★cypac.co.jpまで電子メールにてお願いいたします。←★を@に置きかえてください。

■ 過去のバージョンのインストールイメージ

バージョン インストールイメージ
1.1.2 pja-1.1.2-2019-10-24.zip
1.2.1 pja-1.2.1-2020-01-10.zip

■ 既知のバグ

MeCabが単独でインストールされており、MeCabに標準添付されるIPADICの辞書をUTF-8以外の文字コードで生成していると、PJAの変換結果が文字化けします。単独でインストールされているMeCabを削除するか、単独でのMeCabのインストール時にIPADICの辞書をUTF-8の文字コードで生成してください。なお、PJAのインストールイメージにはMeCabが含まれているため、特別な理由が無い限り、MeCabを単独でインストールする必要はありません。