[PR]テレビ番組表
今夜の番組チェック

PenDicの使い方

辞書データ作成編-プログレッシブ英和辞典

(1)Microsoft Bookshelf2.0

ここで紹介する手順にはMicrosoft Bookshelf2.0(Basic版含む)が必要です。最新版の3.0では使用できませんので注意してください。
まず、プログレッシブ英和変換スクリプトをダウンロードして下さい。

(2)CD-ROMからテキストファイルへ

(1) うみうみさま作・スクリプトを動作させるソフトUWSCをインストールします。
(2) プログレッシブ英和変換スクリプトに入っているprogre.uwsをエディタで開き、最初のほうに書いてある出力先ファイル名を必要に応じて変更します。
(3) Bookshelfを起動し、英和辞典を選択します。
(4) 最初の項目「A」を選択し、Ctrl+Shift+「<」で著作権画面まで戻します。
(5) UWSCを起動し、progre.uwsを開き、再生させます。
最初はループが5回になっていますので、すぐ終わると思います。成功したらループの回数を増やしましょう。
83000回程度で辞書全体が終わりますが、全部で50〜60時間程度かかります。
分割して実行することもできるので、寝るときや出かけるとき等に行った方が良いでしょう。
(6) エラーファイルができていたら、エラーファイルに出力されている単語の前後をチェックして、読み飛ばされている単語があれば手作業で修正して下さい。

(3)テキストファイルを1行テキスト形式に

次に、プログレッシブ英和変換スクリプトに入っているperlスクリプトを以下のように実行して下さい。perlはActivePerlの使用をおすすめします。
perl progre.pl progre.txt>progre.pdc
これで1行テキスト形式の辞書ファイルができました。約15〜16MB程度の大きさになります。

注意: 変換後の発音記号は信用しないでください。かなり誤変換があります。

(4)おまけ:EPWING化

プログレッシブ英和変換スクリプトに入っているperlスクリプトを以下のように実行して下さい。
perl toebs_prog.pl progre.pdc>progre.htm
できたHTMLファイルを EBStudio で変換するとEPWING版の辞書が作成できます。 (発音記号の誤変換が難ですが。。)
外字定義ファイルは、 【「ロングマン現代英英辞典をEPWINGとして使う」・・・をさらに見やすく】 のサイトにあるものを使ってください。