summaryrefslogtreecommitdiff
path: root/doc/RE.ja
diff options
context:
space:
mode:
authorJörg Frings-Fürst <debian@jff-webhosting.net>2017-09-01 18:53:26 +0200
committerJörg Frings-Fürst <debian@jff-webhosting.net>2017-09-01 18:53:26 +0200
commitd077404170160a6936e448a40cbb74a95d19ff3c (patch)
tree1ab0d5a03a46659e39de2e611e89642d9de5867b /doc/RE.ja
parent6b31069db6198cd50cc17f2c63917dd2df5775fb (diff)
parentb62fc1758f4ae8459e6d7e8386ca547274b4daa2 (diff)
Updated version 6.6.1 from 'upstream/6.6.1'
with Debian dir 43da96f2ad45c214a26fc8b155a175b1c828e493
Diffstat (limited to 'doc/RE.ja')
-rw-r--r--doc/RE.ja60
1 files changed, 40 insertions, 20 deletions
diff --git a/doc/RE.ja b/doc/RE.ja
index c05468d..97fde3f 100644
--- a/doc/RE.ja
+++ b/doc/RE.ja
@@ -1,4 +1,4 @@
-鬼車 正規表現 Version 6.5.0 2017/07/30
+鬼車 正規表現 Version 6.6.0 2017/08/29
使用文法: ONIG_SYNTAX_RUBY (既定値)
@@ -80,6 +80,16 @@
\O 真任意文字 (?m:.) (* 原作)
+ \X 拡張書記素房 (?>\O(?:\Y\O)*)
+
+ \Xは照合の開始位置が拡張書記素房の境界かどうかを確認しない。
+ それを確実にしたければ、\y\Xと書けば良い。
+
+ Unicodeの場合:
+ 参照 [Unicode Standard Annex #29: http://unicode.org/reports/tr29/]
+
+ Unicode以外の場合: (?>\r\n|\O)
+
Character Property
@@ -139,10 +149,13 @@
$ 行末
\b 単語境界
\B 非単語境界
+ \y 拡張書記素房 境界
+ \Y 拡張書記素房 非境界
+
\A 文字列先頭
\Z 文字列末尾、または文字列末尾の改行の直前
\z 文字列末尾
- \G 照合開始位置
+ \G 探索開始位置
\K 保持 (結果の開始位置をこの位置に保つ)
@@ -205,11 +218,19 @@
7. 拡張式集合
(?#...) 注釈
- (?imx-imx) 孤立オプション
- i: 大文字小文字照合
- m: 複数行
- x: 拡張形式
- (?imx-imx:式) 式オプション
+ (?imxWDSP-imxWDSP) 孤立オプション
+ i: 大文字小文字照合
+ m: 複数行
+ x: 拡張形式
+ W: wordがASCIIのみ (\w, \p{Word}, [[:word:]])
+ word境界がASCIIのみ (\b)
+ D: digitがASCIIのみ (\d, \p{Digit}, [[:digit:]])
+ S: spaceがASCIIのみ (\s, \p{Space}, [[:space:]])
+ P: POSIXプロパティがASCIIのみ (W,D,Sを全て含んでいる)
+ (alnum, alpha, blank, cntrl, digit, graph,
+ lower, print, punct, space, upper, xdigit, word)
+
+ (?imxWDSP-imxWDSP:式) 式オプション
(式) 捕獲式集合
(?:式) 非捕獲式集合
@@ -245,40 +266,39 @@
<不在機能群>
(?~不在式) 不在繰り返し (*原案 田中哲)
- これは.*のように(より正確には\O*)動作するが、不在式に
+ これは.*(より正確には\O*)のように動作するが、<不在式>に
適合する文字列を含まない範囲に制限される。
これは(?~|不在式|\O*)の省略表記である。
- \O*の部分はマルチラインオプション(?m)の影響を受けない。
(?~|不在式|式) 不在式 (* 原作)
- これは"式"のように動作するが、不在式に適合する文字列を
+ これは<式>のように動作するが、<不在式>に適合する文字列を
含まない範囲に制限される。
例 (?~|345|\d*) "12345678" ==> "12", "1", ""
- (?~|不在式) 不在切断 (* 原作)
+ (?~|不在式) 不在停止 (* 原作)
この演算子を通過した後は、対象文字列の適合範囲の最後が
- 不在式に適合する文字列を含まない範囲に制限される。
+ <不在式>に適合する文字列を含まない範囲に制限される。
- (?~|) 不在消去
- 不在切断の効果を消して、初期状態にする。
- (* この演算子の効果は後退再試行で無効化されない)
+ (?~|) 範囲消去
+ 不在停止の効果を消して、初期状態にする。
- * 不在機能の入れ子はサポートしておらず、挙動は不定とする。
+ * 不在機能の入れ子には対応しておらず、挙動は不定とする。
(?(条件式)成功式|失敗式) 条件式が成功すれば成功式、失敗すれば失敗式を実行する
この機能の存在理由は、成功式が失敗しても失敗式には
行かないこと。これは他の正規表現で書くことができない。
- もうひとつは、条件式が後方参照のとき、後方参照値の有効性
- を調べる(文字列とマッチングはしない)意味になる。
+ もうひとつは、条件式が後方参照の番号/名前のとき、
+ 後方参照値の有効性を調べる(文字列と照合はしない)
+ 意味になる。
(?(条件式)成功式) 条件式が成功すれば成功式を実行する
(条件式が通常の式のときには、この構文は不必要だが
今のところエラーにはしない。)
- 条件式は後方参照または通常の式を使用できる。
+ 条件式は後方参照の番号/名前または普通の式を使用できる。
条件式が後方参照の場合、成功式と失敗式の両方を省略可能であり、
この場合、後方参照値有効性を調べる(成功/失敗)機能のみになる。
@@ -428,7 +448,7 @@
補記 3. Perl 5.8.0と比較して存在しない機能
+ \N{name}
- + \l,\u,\L,\U, \X, \C
+ + \l,\u,\L,\U,\C
+ (?{code})
+ (??{code})