はじめまして
すばらしいソフトを作ってもらって感謝しています。
今回青空文庫のテキストを読ませようとして、"漢字列《ルビ》"でルビだけ読ませたかったので正規表件で試しましたがうまく動作しません。
ルビだけ読ませようと以下のように設定しました。
(^|[^\p{Han}])\p{Han}+《([^\p{Han}|《》]+)》
を
$1$2
に置換しようとしましたが出来ませんでした。
行頭か漢字でない文字に続いて漢字列があって《ルビ》があるものを、漢字でない文字とルビを抜き出そうとしています。
同様な以下の物は動作しています
"|文字列《ルビ》"をルビのみ抜きだす
|[^|《》]+《([^\p{Han}|《》]+)》
を
$1
に置換
正しく動作させるにはどう記述すればよいのでしょうか?