金額の点字表記がわかりにくくなった
点字ビューアーで \1,500 を確認した結果。文字化けしそうですが: 2015.3jp ⠠⠦\⠠⠴1,500 ⠠⠦⠫⠠⠴⠼⠁⠄⠑⠚⠚ 2015.4jp ⠠⠦\1⠠⠴,500 ⠠⠦⠫⠼⠁⠠⠴⠄⠼⠑⠚⠚ 2015.3jp 6の点 236の点 \ 6の点 256の点 1,500 6 236 1246 6 256 3456 1 3 15 245 245 2015.4jp 6の点 236の点 \ 1 6の点 256の点 ,500 6 236 1246 3456 1 6 356 3 3456 15 245 245
テキスト解析のログ:
text : \1,500 correct: ⠠⠦\⠠⠴1,500 result : ⠠⠦\1⠠⠴,500 pat : ⠠⠦⠫⠼⠁⠠⠴⠄⠼⠑⠚⠚ res_in2: 0,0,0,1,1,1,2,3,4,5 res_in1: 0,1,2,3,3,4,5,6,7,7,8,9 res_in : 0,0,0,1,1,1,1,2,3,3,4,5 res_out: 0,3,7,8,10,11 0 ¥,記号,一般,*,*,*,*,¥,エン,エン,1/2,* 1 1,名詞,数,*,*,*,*,1,イチ,イチ,2/2,C3 2 ,,名詞,数,*,*,*,*,,,,,,,*/*,* 3 5,名詞,数,*,*,*,*,5,ゴ,ゴ,1/1,C3 4 0,名詞,数,*,*,*,*,0,ゼロ,ゼロ,1/2,C3 5 0,名詞,数,*,*,*,*,0,ゼロ,ゼロ,1/2,C3 ¥1,\1,名詞,アルファベット,*,*,*,*,¥,エン1,エン1,1/2,⠠⠦\1⠠⠴,0 ,,,,名詞,数,*,*,*,*,,,,,,,*/*,,,0 500,500,名詞,数,*,*,*,*,5,500,500,1/1,500,0
似たような文字列について、現状を確認した。 コンマのない "\1500" だと 現状では全体が情報処理点字の開始と終了でくくられる。 (空白があるとそこで情報処理点字が終わったと判断される)
報告された "\1,500" については、 2015.3jp までの結果も 2015.4jp での結果もどちらも不適切で、 本来は "\1,500" 全体が情報処理点字として扱われるべきと思う。 2015.3jp のほうが分かりやすかったといわれるかも知れないが。
NVDA日本語版の説明 7.1. 記号の出力
http://www.nvda.jp/nvda2015.4jp/ja/readmejp.html#toc43
これによると 「メールアドレスやWebサイトのURLなどに日本の情報処理用点字」 「その他の日本語点字では記号は以下」 ということで、半角円マークは「16 の点」と書いています。
実際には「C:\Program Files」のような (バックスラッシュの意味での)半角円マークを含む文字列は、 日本の情報処理用点字を使う実装になっています。 これは URL のようなものと言えなくもないでしょう。
「半角円マークと数字とカンマが並んでいるもの」 は明らかに「メールアドレスやURL」ではありません。
これを情報処理点字として出力している現在の実装は、 仕様に合っていないことになります。
ですが、日本の情報処理点字を使うほうが安全な場合もあるでしょう。 こういう文字列で実際に意図されているものが、 半角円マークなのか半角バックスラッシュなのか、 区別が付かないこともあるからです。
どういうふうに直せばいいのか、もうすこし検討したいと思います。
現在の実装で、半角円マーク(または半角バックスラッシュ)は URL であるかどうかの判定に使っている。
仕様としては金額に情報処理点字を使うのは間違いかも知れないが、 半角で数字とバックスラッシュとカンマが並んでいたら「URLのような文字列」と見なして 情報処理点字で処理するのは、現状で破綻しにくい安全な仕様であると判断しました。
2015.4jp のリリース後に nvdajp の問い合わせメールアドレスに下記の連絡がありました: