argra****@users*****
argra****@users*****
2009年 1月 16日 (金) 04:56:09 JST
Index: docs/perl/5.10.0/perlapi.pod diff -u docs/perl/5.10.0/perlapi.pod:1.6 docs/perl/5.10.0/perlapi.pod:1.7 --- docs/perl/5.10.0/perlapi.pod:1.6 Sat Jan 3 03:53:34 2009 +++ docs/perl/5.10.0/perlapi.pod Fri Jan 16 04:56:09 2009 @@ -31,13 +31,13 @@ =end original -This file contains the documentation of the perl public API generated by -embed.pl, specifically a listing of functions, macros, flags, and variables -that may be used by extension writers. The interfaces of any functions that -are not listed here are subject to change without notice. For this reason, -blindly using functions listed in proto.h is to be avoided when writing -extensions. -(TBT) +このファイルは embed.pl で生成された perl の公式な API のドキュメントです; +特にエクステンションの作者が使うかもしれない関数、マクロ、フラグ、変数の +一覧です。 +ここに挙げられていないどの関数のインターフェースも予告なしに +変更されることがあります。 +この理由により、エクステンションを書くときに proto.h に挙げられている +関数を盲目的に使うことは避けるべきです。 =begin original @@ -253,9 +253,8 @@ =end original -Push an SV onto the end of the array, creating the array if necessary. -A small internal helper function to remove a commonly duplicated idiom. -(TBT) +SV を配列の最後にプッシュします; もし必要なら配列を作ります。 +一般的に複製された慣用句を削除するための小さい内部ヘルパーです。 =begin original @@ -282,10 +281,8 @@ =end original -Unshifts an SV onto the beginning of the array, creating the array if -necessary. -A small internal helper function to remove a commonly duplicated idiom. -(TBT) +SV を配列の最初に unshift します; もし必要なら配列を作ります。 +一般的に複製された慣用句を削除するための小さい内部ヘルパーです。 =begin original @@ -1320,9 +1317,8 @@ =end original -Stub that provides thread hook for perl_destruct when there are -no threads. -(TBT) +スレッドがないときの perl_destruct のためのスレッドフックを提供する +スタブです。 int nothreadhook() @@ -1766,9 +1762,8 @@ =end original -Return a pointer to the byte-encoded representation of the SV. -May cause the SV to be downgraded from UTF-8 as a side-effect. -(TBT) +SV のバイトエンコードされた表現へのポインタを返します。 +副作用として、SV が UTF-8 から降格するかもしれません。 =begin original @@ -1793,9 +1788,8 @@ =end original -Return a pointer to the UTF-8-encoded representation of the SV. -May cause the SV to be upgraded to UTF-8 as a side-effect. -(TBT) +SV の UTF-8 エンコードされた表現へのポインタを返します。 +副作用として、SV が UTF-8 へ昇格するかもしれません。 =begin original @@ -1912,10 +1906,9 @@ =end original -Dummy routine which "locks" an SV when there is no locking module present. -Exists to avoid test for a NULL function pointer and because it could -potentially warn under some level of strict-ness. -(TBT) +ロックモジュールがないときに SV を「ロックする」ダミールーチンです。 +NULL 関数をテストして、あるレベルでの strict での潜在的な警告を +回避するために存在します。 =begin original @@ -1941,10 +1934,9 @@ =end original -Dummy routine which "unlocks" an SV when there is no locking module present. -Exists to avoid test for a NULL function pointer and because it could -potentially warn under some level of strict-ness. -(TBT) +ロックモジュールがないときに SV を「アンロックする」ダミールーチンです。 +NULL 関数をテストして、あるレベルでの strict での潜在的な警告を +回避するために存在します。 =begin original @@ -4701,10 +4693,11 @@ =end original -Dummy routine which reports that object can be destroyed when there is no -sharing module present. It ignores its single SV argument, and returns -'true'. Exists to avoid test for a NULL function pointer and because it -could potentially warn under some level of strict-ness. +Dummy routine which reports that object can be destroyed when there is no sharing module present. +It ignores its single SV argument, and returns +'true'. +NULL 関数をテストして、あるレベルでの strict での潜在的な警告を +回避するために存在します。 (TBT) bool sv_destroyable(SV *sv) @@ -4724,11 +4717,12 @@ =end original -Dummy routine which "shares" an SV when there is no sharing module present. -Or "locks" it. Or "unlocks" it. In other words, ignores its single SV argument. -Exists to avoid test for a NULL function pointer and because it could -potentially warn under some level of strict-ness. -(TBT) +share モジュールがないときに SV を「share する」ダミールーチンです。 +あるいは「ロックします」。 +あるいは「アンロックします」。 +言い換えると、単一の SV 引数を無視します。 +NULL 関数をテストして、あるレベルでの strict での潜在的な警告を +回避するために存在します。 void sv_nosharing(SV *sv) @@ -9442,10 +9436,9 @@ =end original -Return a pointer to the byte-encoded representation of the SV, and set *lp -to its length. May cause the SV to be downgraded from UTF-8 as a -side-effect. -(TBT) +SV のバイトエンコードされた表現へのポインタを返し、その長さを *lp に +セットします。 +副作用として、SV が UTF-8 から降格するかもしれません。 =begin original @@ -9470,9 +9463,9 @@ =end original -Return a pointer to the UTF-8-encoded representation of the SV, and set *lp -to its length. May cause the SV to be upgraded to UTF-8 as a side-effect. -(TBT) +SV の UTF-8 エンコードされた表現へのポインタを返し、その長さを *lp に +セットします。 +副作用として、SV が UTF-8 へ昇格するかもしれません。 =begin original @@ -11468,8 +11461,7 @@ =end original -Usually used via its frontend C<sv_catpvf>. -(TBT) +普通はフロントエンドである C<sv_catpvf> 経由で使われます。 void sv_vcatpvf(SV* sv, const char* pat, va_list* args) @@ -11503,8 +11495,8 @@ =end original -Usually used via one of its frontends C<sv_vcatpvf> and C<sv_vcatpvf_mg>. -(TBT) +普通はフロントエンドである C<sv_vcatpvf> や C<sv_vcatpvf_mg> 経由で +使われます。 void sv_vcatpvfn(SV* sv, const char* pat, STRLEN patlen, va_list* args, SV** svargs, I32 svmax, bool *maybe_tainted) @@ -11528,8 +11520,7 @@ =end original -Usually used via its frontend C<sv_catpvf_mg>. -(TBT) +普通はフロントエンドである C<sv_catpvf_mg> 経由で使われます。 void sv_vcatpvf_mg(SV* sv, const char* pat, va_list* args) @@ -11556,8 +11547,7 @@ =end original -Usually used via its frontend C<sv_setpvf>. -(TBT) +普通はフロントエンドである C<sv_setpvf> 経由で使われます。 void sv_vsetpvf(SV* sv, const char* pat, va_list* args) @@ -11583,6 +11573,8 @@ =end original +普通はフロントエンドである C<sv_vsetpvf> や C<sv_vsetpvf_mg> 経由で +使われます。 void sv_vsetpvfn(SV* sv, const char* pat, STRLEN patlen, va_list* args, SV** svargs, I32 svmax, bool *maybe_tainted) @@ -11606,8 +11598,7 @@ =end original -Usually used via its frontend C<sv_setpvf_mg>. -(TBT) +普通はフロントエンドである C<sv_setpvf_mg> 経由で使われます。 void sv_vsetpvf_mg(SV* sv, const char* pat, va_list* args) @@ -11809,8 +11800,7 @@ =end original -See also is_utf8_string_loclen() and is_utf8_string_loc(). -(TBT) +is_utf8_string_loclen() と is_utf8_string_loc() も参照してください。 bool is_utf8_string(const U8 *s, STRLEN len) @@ -11839,8 +11829,7 @@ =end original -See also is_utf8_string_loclen() and is_utf8_string(). -(TBT) +is_utf8_string_loclen() と is_utf8_string() も参照してください。 bool is_utf8_string_loc(const U8 *s, STRLEN len, const U8 **p) @@ -11871,8 +11860,7 @@ =end original -See also is_utf8_string_loc() and is_utf8_string(). -(TBT) +is_utf8_string_loc() と is_utf8_string() も参照してください。 bool is_utf8_string_loclen(const U8 *s, STRLEN len, const U8 **ep, STRLEN *el) @@ -12632,8 +12620,7 @@ =end original -or, in most cases, -(TBT) +または、ほとんどの場合では、 d = uvuni_to_utf8(d, uv); @@ -12643,8 +12630,7 @@ =end original -(which is equivalent to) -(TBT) +(これは以下と等価です) d = uvuni_to_utf8_flags(d, uv, 0); @@ -12654,8 +12640,8 @@ =end original -is the recommended Unicode-aware way of saying -(TBT) +というのものが、以下のようなものの Unicode を考慮に入れた方法として +推奨されます。 *(d++) = uv; @@ -13014,6 +13000,8 @@ =head1 Warning and Dieing +(警告と die) + =over 8 =item croak @@ -13078,6 +13066,8 @@ =head1 AUTHORS +(著者) + =begin original Until May 1997, this document was maintained by Jeff Okamoto @@ -13085,9 +13075,9 @@ =end original -Until May 1997, this document was maintained by Jeff Okamoto -<okamo****@corp*****>. It is now maintained as part of Perl itself. -(TBT) +1997 年 5 月まで、このドキュメントは Jeff Okamoto +<okamo****@corp*****> によって管理されていました。 +今では Perl 自身の一部として管理されています。 =begin original @@ -13098,11 +13088,10 @@ =end original -With lots of help and suggestions from Dean Roehrich, Malcolm Beattie, +Dean Roehrich, Malcolm Beattie, Andreas Koenig, Paul Hudson, Ilya Zakharevich, Paul Marquess, Neil Bowers, Matthew Green, Tim Bunce, Spider Boardman, Ulrich Pfeifer, -Stephen McCamant, and Gurusamy Sarathy. -(TBT) +Stephen McCamant, Gurusamy Sarathy から多くの助力と提案を受けました。 =begin original @@ -13110,8 +13099,7 @@ =end original -API Listing originally by Dean Roehrich <roehr****@cray*****>. -(TBT) +元の API 一覧は Dean Roehrich <roehr****@cray*****> によるものです。 =begin original @@ -13119,8 +13107,8 @@ =end original -Updated to be autogenerated from comments in the source by Benjamin Stuhl. -(TBT) +Benjamin Stuhl によって、ソースのコメントから自動生成するように +更新されました。 =head1 SEE ALSO Index: docs/perl/5.10.0/perldebtut.pod diff -u docs/perl/5.10.0/perldebtut.pod:1.1 docs/perl/5.10.0/perldebtut.pod:1.2 --- docs/perl/5.10.0/perldebtut.pod:1.1 Fri Jan 2 23:17:18 2009 +++ docs/perl/5.10.0/perldebtut.pod Fri Jan 16 04:56:09 2009 @@ -353,13 +353,13 @@ =end original -There's a couple of useful ones to know about straight away. You wouldn't -think we're using any libraries at all at the moment, but 'B<M>' will show -which modules are currently loaded, and their version number, while 'B<m>' -will show the methods, and 'B<S>' shows all subroutines (by pattern) as -shown below. 'B<V>' and 'B<X>' show variables in the program by package -scope and can be constrained by pattern. -(TBT) +There's a couple of useful ones to know about straight away. +この時点では何かのライブラリを使っているとは考えていないでしょうが、 +'B<M>' は現在読み込まれているモジュールとバージョン番号を表示し、 +一方 'B<m>' はメソッドを表示し、'B<S>' は以下のように、(パターンによって) +全てのサブルーチンを表示します。 +'B<V>' と'B<X>' は、パッケージスコープと、パターンによって制限できる、 +変数を表示します。 DB<2>S str dumpvar::stringify @@ -820,8 +820,10 @@ =end original -Not very consistent! We'll set a breakpoint in the code manually and run it -under the debugger to see what's going on. A breakpoint is a flag, to which +全く一貫していません! +手動でコードにブレークポイントをセットして、何が起きているかを見るために +デバッガで実行してみます。 +A breakpoint is a flag, to which the debugger will run without interruption, when it reaches the breakpoint, it will stop execution and offer a prompt for further interaction. In normal use, these debugger commands are completely ignored, and they are safe - if a @@ -922,8 +924,8 @@ =end original -Note that to delete a breakpoint you use 'd' or 'D'. -(TBT) +ブレークポイントを削除するためには 'd' や 'D' を使うことに +注意してください。 =begin original @@ -976,8 +978,7 @@ =end original -And have a look at the return value: -(TBT) +そして返り値を見てみます: DB<5> p $c 162.944444444444 @@ -990,10 +991,9 @@ =end original -This is not the right answer at all, but the sum looks correct. I wonder if -it's anything to do with operator precedence? We'll try a couple of other -possibilities with our sum: -(TBT) +これは全く正しい答えではありませんが、合計は正しいように見えます。 +演算子の優先順位が何かを行っているのでしょうか? +合計に関してその他の可能性を試してみます: DB<6> p (5 * $f - 32 / 9) 162.944444444444 @@ -1052,14 +1052,15 @@ =head1 Placeholder for a, w, t, T +(a, w, t, T のためのプレースホルダ) + =begin original Actions, watch variables, stack traces etc.: on the TODO list. =end original -Actions, watch variables, stack traces etc.: on the TODO list. -(TBT) +アクション、変数の監視、スタックトレースなど: TODO リストです。 a @@ -1072,6 +1073,8 @@ =head1 REGULAR EXPRESSIONS +(正規表現) + =begin original Ever wanted to know what a regex looked like? You'll need perl compiled with @@ -1079,9 +1082,9 @@ =end original -Ever wanted to know what a regex looked like? You'll need perl compiled with -the DEBUGGING flag for this one: -(TBT) +正規表現がどのように見えるか知りたいと思いましたか? +以下のようにするには perl を DEBUGGING フラグ付きでコンパイルする必要が +あります: > perl -Dr -e '/^pe(a)*rl$/i' Compiling REx `^pe(a)*rl$' @@ -1115,15 +1118,16 @@ =end original -Did you really want to know? :-) +本当に知りたかったですか? :-) For more gory details on getting regular expressions to work, have a look at L<perlre>, L<perlretut>, and to decode the mysterious labels (BOL and CURLYN, etc. above), see L<perldebguts>. (TBT) - =head1 OUTPUT TIPS +(出力の小技) + =begin original To get all the output from your error log, and not miss any messages via @@ -1132,10 +1136,9 @@ =end original -To get all the output from your error log, and not miss any messages via -helpful operating system buffering, insert a line like this, at the start of -your script: -(TBT) +エラーログからの全ての出力を得て、親切な OS のバッファリングで +メッセージを失わないようにするには、スクリプトの最初に以下のような行を +挿入してください: $|=1; @@ -1145,8 +1148,7 @@ =end original -To watch the tail of a dynamically growing logfile, (from the command line): -(TBT) +動的に増え続けるログファイルの末尾を監視するには、(コマンドラインから): tail -f $error_log @@ -1174,7 +1176,6 @@ are explained in L<perlopentut> and L<perlfaq8>. (TBT) - =head1 CGI =begin original @@ -1198,12 +1199,12 @@ =end original -Of course L<CGI> and L<perlfaq9> will tell you more. -(TBT) - +もちろん L<CGI> と L<perlfaq9> にはもっと多くの情報があります。 =head1 GUIs +(GUI) + =begin original The command line interface is tightly integrated with an B<emacs> extension @@ -1211,9 +1212,8 @@ =end original -The command line interface is tightly integrated with an B<emacs> extension -and there's a B<vi> interface too. -(TBT) +コマンドラインインターフェースは B<emacs> 拡張と密接に統合されていて、 +B<vi> インターフェースもあります。 =begin original @@ -1224,8 +1224,9 @@ =end original -You don't have to do this all on the command line, though, there are a few GUI -options out there. The nice thing about these is you can wave a mouse over a +しかし、これら全てをコマンドラインで実行する必要はありません; +いくつかの GUI の選択肢もあります。 +The nice thing about these is you can wave a mouse over a variable and a dump of its data will appear in an appropriate window, or in a popup balloon, no more tiresome typing of 'x $varname' :-) (TBT) @@ -1236,8 +1237,7 @@ =end original -In particular have a hunt around for the following: -(TBT) +特に以下のものの辺りを調べてみてください: =begin original @@ -1245,8 +1245,7 @@ =end original -B<ptkdb> perlTK based wrapper for the built-in debugger -(TBT) +B<ptkdb> ビルドインデバッガのための perlTK ベースのラッパー =begin original @@ -1254,8 +1253,7 @@ =end original -B<ddd> data display debugger -(TBT) +B<ddd> データ表示デバッガ =begin original @@ -1263,8 +1261,7 @@ =end original -B<PerlDevKit> and B<PerlBuilder> are NT specific -(TBT) +B<PerlDevKit> と B<PerlBuilder> は NT 固有です =begin original @@ -1272,8 +1269,8 @@ =end original -NB. (more info on these and others would be appreciated). -(TBT) +注意せよ。 +(これらやその他のものに関するさらなる情報を頂ければ幸いです)。 =head1 SUMMARY Index: docs/perl/5.10.0/perlunicode.pod diff -u docs/perl/5.10.0/perlunicode.pod:1.1 docs/perl/5.10.0/perlunicode.pod:1.2 --- docs/perl/5.10.0/perlunicode.pod:1.1 Sat Dec 27 03:13:23 2008 +++ docs/perl/5.10.0/perlunicode.pod Fri Jan 16 04:56:09 2009 @@ -9,7 +9,7 @@ =end original -perlunicode - PerlにおけるUnicodeサポート +perlunicode - Perl における Unicode サポート =head1 DESCRIPTION @@ -36,10 +36,8 @@ =end original -People who want to learn to use Unicode in Perl, should probably read -L<the Perl Unicode tutorial|perlunitut> before reading this reference -document. -(TBT) +Perl で Unicode を使うことを学びたい人は、多分このリファレンスを読む前に +L<the Perl Unicode tutorial|perlunitut> を読んだ方がよいでしょう。 =over 4 @@ -59,7 +57,8 @@ (UTF-8, or UTF-EBCDIC if in EBCDIC) if the filehandle is opened with the ":utf8" layer. Other encodings can be converted to Perl's encoding on input or from Perl's encoding on output by use of the -":encoding(...)" layer. See L<open>. +":encoding(...)" layer. +L<open> を参照してください。 (TBT) =begin original @@ -68,8 +67,8 @@ =end original -To indicate that Perl source itself is in UTF-8, use C<use utf8;>. -(TBT) +Perl のソース自身が UTF-8 であることを示すには、C<use utf8;> を +使ってください。 =item Regular Expressions @@ -83,14 +82,11 @@ =end original -正規表現コンパイラは polymorphic オペコードを生成します。 -つまり、パターンはデータに対して適用され、 -that is internally encoded in -UTF-8 -で表されている場合にはUnicode文字スキームに自動的に切り替わります。 -バイトデータで表されている場合には伝統的なバイトスキームが代わりに使われます。 - -(TBT) +正規表現コンパイラは多態的なオペコードを生成します。 +つまり、パターンはデータに対して適用され、データが内部で UTF-8 で +エンコードされている場合には Unicode 文字スキームに自動的に +切り替わります -- さもなければ、バイトデータで表されている場合には +伝統的なバイトスキームが使われます。 =item C<use utf8> still needed to enable UTF-8/UTF-EBCDIC in scripts @@ -193,9 +189,9 @@ =end original -しかしながら、compatibility measure の期間として、Perl は +しかしながら、一時的な互換性の措置として、Perl は プログラムに対するバイトセマンティクスから文字セマンティクスへの -安全な移行パスを提供するでしょう。 +安全な移行パスを提供することを目指します。 入力データが文字であると Perl が曖昧さなく決定できる操作については、 Perl は文字セマンティクスに切り替えます。 ユーザーからの付加的な情報抜きに決定することができない操作については @@ -226,7 +222,7 @@ =end original -C<bytes> プラグマは常に、プラットフォームとは無関係に特定の +C<bytes> プラグマは常に、プラットフォームとは無関係に、特定の レキシカルスコープにおいてバイトセマンティクスを強制します。 L<bytes> を参照してください。 @@ -240,12 +236,12 @@ =end original -C<utf8> プラグマは主としてパーサに遭遇するリテラル中の UTF-(8|EBCDIC) の +C<utf8> プラグマは主としてパーサが遭遇するリテラル中の UTF-(8|EBCDIC) の 認識を有効にする互換デバイス(compatibility device)です。 このプラグマは Perl のデフォルトがバイトセマンティクスであるときにのみ 必要であることに注意してください。 文字セマンティクスがデフォルトである場合には、 -このプラグマは no-op になります。 +このプラグマは何もしません。 L<utf8> を参照してください。 =begin original @@ -265,9 +261,9 @@ 文字セマンティクスを用い、非 Unicode データに対しては バイトセマンティクスを用います。 文字セマンティクスの使用の決定はトランスペアレントに行われます。 -もし入力データが Unicode ソースから来たもの--たとえば、 +もし入力データが Unicode ソースから来たもの -- たとえば、 文字エンコーディングレイヤーがファイルハンドルに附加されているか -リテラルの Unicode 文字列定数がプログラムの中にある--のであれば +リテラルの Unicode 文字列定数がプログラムの中にある -- のであれば 文字セマンティクスが適用されます。 そうでなければ、バイトセマンティクスが有効になります。 C<bytes> プラグマは Unicode データに対してバイトセマンティクスを @@ -310,6 +306,8 @@ =head2 Effects of Character Semantics +(文字セマンティクスの効果) + =begin original Character semantics have the following effects: @@ -329,7 +327,7 @@ =end original -文字列--ハッシュのキーを含め--と正規表現パターンは序数値として 255 を +文字列 -- ハッシュのキーを含め -- と正規表現パターンは序数値として 255 を 超える値を持つ文字を含めることができます。 =begin original @@ -341,11 +339,10 @@ =end original -プログラムを編集するのにUnicodeエディタを使っているのであれば、 Unicodeの +プログラムを編集するのに Unicode エディタを使っているのであれば、Unicode の 文字 UTF-8 か UTF-16 のエンコーディングコーディングでリテラル文字列に 含めることができます。 -(The former requires a BOM or C<use utf8>, the latter requires a BOM.) -(TBT) +(前者は BOM か C<use utf8> を必要とし、後者は BOM を必要とします。) =begin original @@ -358,16 +355,13 @@ =end original - -Unicodeの文字は C<\x{...}> 表記を使うことにより文字列に +Unicode の文字は C<\x{...}> 表記を使うことにより文字列に 追加することもできます。 -その表現されるUnicodeコードは、十六進でブレースに囲まれているべきでしょう。 -たとえば、smiley faceは C<\x{263A}> です。 -このエンコーディングスキームは -only works for all characters, but -for characters under 0x100, note that Perl may use an 8 bit encoding -internally, for optimization and/or backward compatibility. -(TBT) +その表現される Unicode コードは、16 進でブレースに囲みます。 +たとえば、smiley face は C<\x{263A}> です。 +このエンコーディングスキームは 0x100 未満の全ての文字でのみ動作します; +Perl は最適化や後方互換性のために内部で 8 ビットエンコーディングを +使うかもしれないことに注意してください。 =begin original @@ -452,8 +446,8 @@ =end original -See L</"Unicode Character Properties"> for more details. -(TBT) +さらなる詳細については L</"Unicode Character Properties"> を +参照してください。 =begin original @@ -504,7 +498,8 @@ C<tr///> 演算子はバイトではなく文字で変換します。 C<tr///CU> は削除されたことに注意してください。 -同様のことを行うにはpack('U0', ...) と pack('C0', ...)を参照してください。 +同様のことを行うには pack('U0', ...) と pack('C0', ...) を +参照してください。 =item * @@ -613,9 +608,10 @@ operations when characters are all less than 256 in ordinal value, one should not use C<~> (the bit complement) with characters of both values less than 256 and values greater than 256. -最も重要なことはド・モルガンの法則 (C<~($x|$y) eq ~$x&~$y> と C<~($x&$y) eq ~$x|~$y>)が成り立たないということです。 -この数学的な I<過失> の理由は補数(complement)が 8 ビットのビット補数 B<および> -文字幅のビット補数の B<両方> を返すことができないためです。 +最も重要なことはド・モルガンの法則 (C<~($x|$y) eq ~$x&~$y> と +C<~($x&$y) eq ~$x|~$y>) が成り立たないということです。 +この数学的な I<過失> の理由は補数(complement)が 8 ビットのビット補数 +B<および> 文字幅のビット補数の B<両方> を返すことができないためです。 (TBT) =item * @@ -736,7 +732,7 @@ =end original -たとえば、C<\p{Lu}> は Unicode の "Lu(Letter, uppercase) 特性を持つ任意の +たとえば、C<\p{Lu}> は Unicode の "Lu" (Letter, uppercase) 特性を持つ任意の 文字にマッチし、C<\p{M}> は "M" (mark -- アクセントなど) 特性を持つ任意の 文字にマッチします。 ブラケットは一文字の特性では省略することができるので、C<\p{M}> は @@ -756,7 +752,7 @@ =end original -公式のUnicode用字およびブロックの名前はスペースとダッシュを +公式の Unicode 用字およびブロックの名前はスペースとダッシュを セパレータとして使っていますが、便利のため、ダッシュ、スペース、 アンダーバーを使うことができ、また、大小文字の違いは重要ではありません。 しかしながら、以下のネーミングにしたがって、首尾一貫して使うことを @@ -784,7 +780,7 @@ =end original -B<注意: ここでの特性、用字、ブロックは 2006 年 7 月のUnicode 5.0.0 に +B<注意: ここでの特性、用字、ブロックは 2006 年 7 月の Unicode 5.0.0 に 従っています。> =over 4 @@ -890,7 +886,7 @@ =end original -用字はその方向性で異なるので--たとえばヘブライ語は右から左に書きます-- +用字はその方向性で異なるので--たとえばヘブライ語は右から左に書きます -- Unicode は以下の特性を BidiClass クラスで提供しています: Property Meaning @@ -1376,8 +1372,7 @@ =end original -A single hexadecimal number denoting a Unicode code point to include. -(TBT) +含まれる Unicode 符号位置を示す 1 つの 16 進数。 =item * @@ -1388,8 +1383,8 @@ =end original -水平的空白(スペースもしくはタブ)によって区切られる十六進数値は含まれる -Unicode の符号位置の範囲を示します。 +含まれる Unicode の符号位置の範囲を示す、 +水平的空白(スペースもしくはタブ)によって区切られる 2 つの 16 進数。 =item * @@ -1462,7 +1457,8 @@ =end original -For example, to define a property that covers both the Japanese syllabaries (hiragana and katakana), you can define +例えば、両方の日本語の音節(ひらがなとカタカナ)を対象とする特性を +定義するには、以下のように定義します sub InKana { return <<END; @@ -1589,7 +1585,7 @@ =end original -サブルーチンから返される文字列はタブで区切られた三つの十六進数字を +サブルーチンから返される文字列はタブで区切られた 3 つの 16 進数を 必要とします: ソースの範囲の始まり、ソースの範囲の終わり、そして デスティネーション範囲の始まりです。 例を挙げましょう: @@ -1655,9 +1651,11 @@ =end original -(For serious hackers only) デフォルトのマッピングを内省したいのなら、 C<$Config{privlib}>/F<unicore/To/> というディレクトリにデータを +(For serious hackers only) デフォルトのマッピングを内省したいのなら、 +C<$Config{privlib}>/F<unicore/To/> というディレクトリにデータを 見つけ出すことができます。 -マッピングデータはヒアドキュメントとして返され、C<utf8::ToSpecFoo> は C<$Config{privlib}>/F<unicore/SpecialCasing.txt> から派生した特殊な +マッピングデータはヒアドキュメントとして返され、C<utf8::ToSpecFoo> は +C<$Config{privlib}>/F<unicore/SpecialCasing.txt> から派生した特殊な 例外マッピングです。 そのディレクトリで見つけることのできる C<Digit> と C<Fold> のマッピングは ユーザーがダイレクトにアクセスできず、C<Unicode::UCD> モジュールを使うか @@ -1677,6 +1675,8 @@ =head2 Character Encodings for Input and Output +(入出力のための文字エンコーディング) + =begin original See L<Encode>. @@ -1698,8 +1698,7 @@ 以下に挙げるリストは現在サポートされているすべての機能を記述する 正規表現のための Unicode サポートのリストです。 -``Level N''に対する参照と -セクション番号は +"Level N" に対する参照とセクション番号は Unicode Technical Standard #18, "Unicode Regular Expressions", version 11, in May 2005 を参照しています。 @@ -1791,7 +1790,7 @@ =end original -これはGreek 用字の一部として知られている assigned characterにマッチします。 +これは Greek 用字の一部として知られている assigned character にマッチします。 =begin original @@ -1914,7 +1913,7 @@ =end original -Uncode文字は抽象的な数値である I<符号位置> にアサインされています。 +Unicode 文字は抽象的な数値である I<符号位置> にアサインされています。 これらの数値を使うために、さまざまなエンコーディングが必要となります。 =over 4 @@ -1933,8 +1932,10 @@ =end original UTF-8は可変長(1から6バイト。 -現在の文字アロケーションは4バイトを要求します)で、バイトの並び順に依存しないエンコーディングです。 -ASCII(ここでは 7-bit ASCII のことで、他の 8-bit エンコーディングのことではありません)と UTF-8 は透過です。 +現在の文字アロケーションは4バイトを要求します)で、バイトの並び順に依存しない +エンコーディングです。 +ASCII(ここでは 7-bit ASCII のことで、他の 8-bit エンコーディングのことでは +ありません)と UTF-8 は透過です。 =begin original @@ -2050,9 +2051,12 @@ =end original UTF-16は2バイトもしくは4バイトのエンコーディングです。 -C<U+0000..U+FFFF> の範囲の Unicode の符号位置はひとつの 16 ビットユニットに収められ、C<U+10000..U+10FFFF> の範囲の符号位置は二つの 16 ビットユニットに収められます。 +C<U+0000..U+FFFF> の範囲の Unicode の符号位置はひとつの 16 ビット +ユニットに収められ、C<U+10000..U+10FFFF> の範囲の符号位置は 2 つの +16 ビットユニットに収められます。 後者をサロゲート(surrogates) と呼びます。 -最初の16ビットユニットは I<high surrogate> で、二番目は I<low surrogate> となります。 +最初の 16 ビットユニットは I<high surrogate> で、二番目は +I<low surrogate> となります。 =begin original @@ -2063,8 +2067,10 @@ =end original -サロゲートは Unicode の符号位置の C<U+10000..U+10FFFF> の範囲を 16 ビットユニットのペアで表現する集合です。 -I<high surrogates> は C<U+D800..U+DBFF> の範囲で、I<low surrogates> はC<U+DC00..U+DFFF> の範囲です。 +サロゲートは Unicode の符号位置の C<U+10000..U+10FFFF> の範囲を +16 ビットユニットのペアで表現する集合です。 +I<high surrogates> は C<U+D800..U+DBFF> の範囲で、I<low surrogates> は +C<U+DC00..U+DFFF> の範囲です。 サロゲートのエンコーディングは $hi = ($uni - 0x10000) / 0x400 + 0xD800; @@ -2101,8 +2107,8 @@ =end original -16-bitnessのため、UTF-16はバイトの並び順に依存します。 -UTF-16それ自身はメモリ内の計算に使うことができますが、格納や転送の際には +16-bitness のため、UTF-16 はバイトの並び順に依存します。 +UTF-16 それ自身はメモリ内の計算に使うことができますが、格納や転送の際には UTF-16BE (ビッグエンディアン)か UTF-16LE (リトルエンディアン)の いずれかのエンコーディングを選択しなければなりません。 @@ -2118,8 +2124,8 @@ このことは別の問題を引き起こします: あなたのデータが UTF-16 であることだけを 知っていて、そのバイト並び順を知らなかったとしたら? -バイト順マークもしくは BOMs はこれを解決します。 -バイト並びのマーカーとしての機能のためにUnicodeでは特殊な文字が +バイト順マークもしくは BOM はこれを解決します。 +バイト並びのマーカーとしての機能のために Unicode では特殊な文字が 予約されています: その文字は符号位置の C<U+FEFF> です。 =begin original @@ -2136,9 +2142,8 @@ ビッグエンディアンのプラットフォームで書かれたものならなら C<0xFE 0xFF> を読み出し、リトルエンディガンのプラットフォームで 書かれたものなら C<0xFF 0xFE> を読み出します。 -(そしてもし元の -プラットフォームで UTF-8 で書かれたものならば C<0xEF 0xBB 0xBF> と -いうバイト列を読むことになるでしょう。) +(そしてもし元のプラットフォームで UTF-8 で書かれたものならば +C<0xEF 0xBB 0xBF> というバイト列を読むことになるでしょう。) =begin original @@ -2203,7 +2208,7 @@ =end original -7 ビットセーフ(非8ビット)エンコーディングで、8 ビットセーフでない +7 ビットセーフ(非 8 ビット)エンコーディングで、8 ビットセーフでない 転送や格納に便利です。 RFC 2152 によって定義されています。 @@ -2258,7 +2263,8 @@ =end original -正規表現はバイトデータと文字(Unicode)データとでまったく異なる振る舞いをします。 +正規表現はバイトデータと文字(Unicode)データとでまったく異なる +振る舞いをします。 たとえば、単語文字("word character")クラス C<\w> はそのデータが 8 ビットバイトか Unicode かに依存して異なる働きをします。 @@ -2289,11 +2295,11 @@ =end original 第二の場合、C<\w> の文字集合は相対的に大きなものになります。 -最も重要なことは、最初の256文字の集合にあってさえ異なる文字と +最も重要なことは、最初の 256 文字の集合にあってさえ異なる文字と マッチする可能性があるということです: 言語と国のペアで指定される 大部分のロケールと異なり、Unicode のクラス分けは I<どこかにある> すべての文字を C<\w> に属するものとします。 -たとえば、あなたの使っているロケールはLATIN SMALL LETTER ETH が +たとえば、あなたの使っているロケールは LATIN SMALL LETTER ETH が (アイスランド語を使っていない限り)属していないとみなしているでしょうが、 Unicode は属するものとしてみなすのです。 @@ -2374,8 +2380,8 @@ =end original -デフォルトの C<open()> レイヤーや C<@ARGV> の標準ファイルハンドルの自動的な -UTF-8 化を、C<-C> コマンドラインスイッチか +デフォルトの C<open()> レイヤーや C<@ARGV> の標準ファイルハンドルの +自動的な UTF-8 化を、C<-C> コマンドラインスイッチか 環境変数 C<PERL_UNICODE> によって有効にできます。 C<-C> スイッチについての説明は L<perlrun> を参照してください。 @@ -2424,10 +2430,8 @@ 以下に挙げるのはそのようなインターフェースです。 これらすべてが現在の Perl(5.8.3) では単純に引数と戻り値の両方が -バイト文字列か、 -or UTF-8 strings if the C<encoding> pragma has been used. -であると仮定しています。 -(TBT) +バイト文字列か、C<encoding> プラグマが使われていれば UTF-8 文字列で +あると仮定しています。 =begin original @@ -2516,7 +2520,7 @@ =end original しかし、これらを使うときには十分注意しなければなりません: あなたが突然 -スカラのような'性質'(nature)を突然変えたりしたら、 Perl は簡単に混乱し、 +スカラのような'性質'(nature)を突然変えたりしたら、Perl は簡単に混乱し、 怒り、クラッシュしてしまいます。 utf8::upgrade() を使うときには特に注意が必要です: 任意のランダムな バイト列は正当な UTF-8 ではありません。 @@ -2635,7 +2639,8 @@ これらの欠如が一般的な目的のエンコーディングやデコーディングの インターフェースとして使われていることに注意してください: C<use Encode> がそのためにあります。 -C<sv_utf8_upgrade()> はエンコーディングプラグマに影響を受けますが、C<sv_utf8_downgrade()> はそうではありません(なぜならエンコーディング +C<sv_utf8_upgrade()> はエンコーディングプラグマに影響を受けますが、 +C<sv_utf8_downgrade()> はそうではありません(なぜならエンコーディング プラグマは一方通行にデザインされているからです)。 =item * @@ -2647,7 +2652,7 @@ =end original -C<is_utf8_char(s)> はポインタが正しいUTF-8文字を指し示しているときに +C<is_utf8_char(s)> はポインタが正しい UTF-8 文字を指し示しているときに 真を返します。 =item * @@ -2675,13 +2680,13 @@ =end original -C<UTF8SKIP(buf)> はバッファの中にあるUTF-8エンコードされた文字の +C<UTF8SKIP(buf)> はバッファの中にある UTF-8 エンコードされた文字の バイト数を返します。 -C<UNISKIP(chr)> はUTF-8エンコードするUnicode 文字の符号位置が要求する +C<UNISKIP(chr)> はUTF-8エンコードする Unicode 文字の符号位置が要求する バイト数を返します。 C<UTF8SKIP()> はUTF-8エンコードされたバッファの文字に対して繰り返しを 行うような例に便利です。 -C<UNISKIP()> はたとえば、 UTF-8エンコードされたバッファの要求する大きさを +C<UNISKIP()> はたとえば、 UTF-8 エンコードされたバッファの要求する大きさを 計算するのに便利です。 =item * @@ -2733,7 +2738,8 @@ C<sv_uni_display(dsv, ssv, pvlim, flags)> は Unicode の文字列やスカラの 出力をデバッグするのに便利です。 デフォルトではデバッグのみに便利です -- B<すべての> 文字を -十六進の符号位置として表示します -- しかし C<UNI_DISPLAY_ISPRINT>, C<UNI_DISPLAY_BACKSLASH>, C<UNI_DISPLAY_QQ> というフラグを +16 進の符号位置として表示します -- しかし C<UNI_DISPLAY_ISPRINT>, +C<UNI_DISPLAY_BACKSLASH>, C<UNI_DISPLAY_QQ> というフラグを 与えることによって、出力を読みやすくすることができるでしょう。 =item * @@ -2922,7 +2928,7 @@ 一部のエクステンションはデータのエントリ/脱出ポイントでフィルターを 提供しています。 -たとえばDB_File::filter_store_keyとその仲間です。 +たとえば DB_File::filter_store_keyとその仲間です。 あなた使うエクステンションのドキュメントにあるそのようなフィルターに 注意してください。 それらは Unicode データの変化をより容易にします。 @@ -2941,7 +2947,7 @@ =end original -一部の関数はUTF-8でエンコードされた文字列に対して適用したときにバイト +一部の関数は UTF-8 でエンコードされた文字列に対して適用したときにバイト エンコードされた文字列に対するときよりも遅くなります。 文字に対して働く必要のある length()、substr()、index()のような関数のすべてと 正規表現マッチングは、データが @@ -3030,7 +3036,7 @@ Compress::Zlib、Apache::Request などの、マニュアルページに Unicode に 関する記載がない何らかのエクステンションで、確実に UTF8 フラグが オフにする必要があるでしょう。 -これを書いている時点(2002年の10月)では、上記のモジュールは +これを書いている時点(2002 年の 10 月)では、上記のモジュールは UTF-8 対応でないことに注意してください。 これがまだ真であるのなら、ドキュメントをチェックして確かめてください。 @@ -3102,7 +3108,7 @@ =end original データベースが UTF-8 のみから構成されているとき、ラッパー関数や -ラッパーメソッドはあなたのfetchrow_arrayやfetchrow_hashrefの呼び出しを +ラッパーメソッドはあなたの fetchrow_array や fetchrow_hashref の呼び出しを 置き換えるのに便利な方法でしょう。 ラッパー関数はまた、あなたの使っているデータベースドライバが 将来拡張されたときに適用しやすくするでしょう。 Index: docs/perl/5.10.0/perlunifaq.pod diff -u docs/perl/5.10.0/perlunifaq.pod:1.1 docs/perl/5.10.0/perlunifaq.pod:1.2 --- docs/perl/5.10.0/perlunifaq.pod:1.1 Thu Jan 1 23:38:18 2009 +++ docs/perl/5.10.0/perlunifaq.pod Fri Jan 16 04:56:09 2009 @@ -323,11 +323,10 @@ =end original -This doesn't do anything to your input, or to your output. It only influences -the way your sources are read. You can use Unicode in string literals, in -identifiers (but they still have to be "word characters" according to C<\w>), -and even in custom delimiters. -(TBT) +これは入出力に対しては何も行いません。 +ソースを読み込む方法のみに影響を与えます。 +文字列リテラル、識別子(しかし C<\w> に従った「単語文字」である必要が +あります)、そして独自デリミタにすら Unicode が使えます。 =head2 Data::Dumper doesn't restore the UTF8 flag; is it broken? @@ -342,11 +341,11 @@ =end original -No, Data::Dumper's Unicode abilities are as they should be. There have been -some complaints that it should restore the UTF8 flag when the data is read -again with C<eval>. However, you should really not look at the flag, and -nothing indicates that Data::Dumper should break this rule. -(TBT) +いいえ、Data::Dumper の Unicode 能力は、あるべき形であります。 +C<eval> で再びデータを読み込むとき、UTF8 フラグを復元するべきだという +苦情が来ることがあります。 +しかし、実際にはフラグを見るべきではないですし、Data::Dumper がこの規則を +破っていることを示すものは何もありません。 =begin original @@ -358,12 +357,12 @@ =end original -Here's what happens: when Perl reads in a string literal, it sticks to 8 bit -encoding as long as it can. (But perhaps originally it was internally encoded -as UTF-8, when you dumped it.) When it has to give that up because other -characters are added to the text string, it silently upgrades the string to -UTF-8. -(TBT) +起きているのは以下のようなことです: Perl が文字列リテラルを読み込むとき、 +可能な限り長く 8 ビットエンコーディングにこだわります。 +(しかしおそらく、これをダンプしたときには内部では UTF-8 でエンコード +されていました。) +それ以外の文字をテキスト文字列に追加するためにこれを諦めなければならない +とき、Perl は暗黙のうちに文字列を UTF-8 に昇格させます。 =begin original @@ -755,14 +754,12 @@ =end original C<UTF-8> は公式な標準です。 -C<utf8> is Perl's way of being liberal in -what it accepts. +C<utf8> は、何を受け入れるかに関して自由な Perl のやり方です。 もしそれほど自由でないものと対話する必要があるなら、 C<UTF-8> を使うことを考えたくなるかもしれません。 自由すぎるものと対話する必要があるなら、C<utf8> を 使わなければならないかもしれません。 完全な説明は L<Encode> にあります。 -(TBT) =begin original @@ -798,9 +795,9 @@ =end original -Okay, if you insist: the "internal format" is utf8, not UTF-8. (When it's not -some other encoding.) -(TBT) +わかりました、どうしてもと言うのなら:「内部形式」は utf8 であって、 +UTF-8 ではありません。 +(もしその他のエンコーディングでないのなら。) =head2 I lost track; what encoding is the internal format really?