TextToWav の質問と要望
  1. pan - 2014/09/26 (Fri) 21:36:36
    ①一般辞書と正規表現辞書の優先順位について質問が有ります。
    正規表現辞書よりも一般辞書の方が優先順位が高いかと思います。
    ふと思ったのですが、優先順位を逆にする事は可能なのでしょうか。
    何故その様に思い立ったかと言いますと

    私の辞書登録のスタイルとしては
    ネットの様々な所から専門用語などの単語と読み仮名を抽出し、一括して大量登録する。
    しかし、一般辞書の単純置き換えだと、別の単語の読み間違いの原因となっている事がままある。
    そこで、正規表現辞書で条件を付け、登録し直して誤読を減らしてやる。
    という流れになるのですが
    正規表現辞書に登録しても優先順位の関係で、一般辞書の方を削除しなければ効果が発揮されないので、後で一般辞書から原因を探し出し、削除する作業が必要となる訳です。

    大体の場合、私は読み間違いに気づいた時点で、『最初から読み間違っている』のか、既に登録した『一般辞書が原因』なのか、『正規表現辞書が原因』なのか忘れており、原因究明に突入します、これがかなりの時間を掛けてしまいまして。

    もし正規表現辞書の方が優先順位が高かったら、誤読の原因となった一般辞書を探さずに無視する事が出来るのでは、と考えたのです。
    一般辞書で難しかったものを、後から正規表現辞書で被せてやる、という観点から、正規表現辞書の方が優先順位が上だったら良いな、と思いました。

    ②もう一つの疑問です。
    一般辞書に大量登録してあるものを、正規表現辞書側で登録した場合、更に重くなるのか?と言うものです。
    ネットの情報を見ていると、正規表現は重い、という意見を目にします。
    一般辞書登録で済むものを、あえて正規表現辞書に登録していくと、結果としてTextToWavの負担は更に増えてしまうのでしょうか。
    あくまで単純置き換えなので正規表現辞書側に登録しても、負担が一般辞書と変わらないのであれば、最初から全ての登録を正規表現辞書に統一しても良いのか、と悩んでいます。

    実際一般辞書の内容を、正規表現辞書に移して試してみたのですが、体感速度的に違いが分かりませんでした。
    しかし、これまで作ってきた辞書はまだまだ少なく、将来的に何十倍に増えるかもしれません。
    今は差を体感できなくても、後で困るかもしれませんので、知っておきたいのです。
  2. Noah - 2014/09/27 (Sat) 07:28:52
    ①優先順位を逆にする事は可能なのでしょうか。
    テストはしていませんが、順番を逆にしたバージョンを公開しました。
    使ってみてください。

    ②一般辞書に大量登録してあるものを、正規表現辞書側で登録した場合、更に重くなる?
    正規表現辞書に移した場合、処理がとても重くなります。

    一般辞書ではバイナリーサーチを使用しているので、
    登録単語が増えても、それほど重くなりません。

    正規表現辞書では登録されたキーを一つずつ取り出して、
    条件にマッチするか調べてから置換しているので、
    キーが増えるにつれ処理が増大します。
  3. pan - 2014/09/28 (Sun) 09:12:25
    対応と回答をして頂き、有難うございます。
    おかげさまで疑問が晴れてスッキリしました。