README.ja 2016/05/06 ���� ---- (C) K.Kosako <kkosako0@gmail.com> https://github.com/kkos/oniguruma ���֤�����ɽ���饤�֥��Ǥ��롣 ���Υ饤�֥�����Ĺ�ϡ����줾�������ɽ�����֥������Ȥ��Ȥ� ʸ�������ǥ������Ǥ��뤳�ȤǤ��롣 ���ݡ��Ȥ��Ƥ���ʸ�������ǥ���: ASCII, UTF-8, UTF-16BE, UTF-16LE, UTF-32BE, UTF-32LE, EUC-JP, EUC-TW, EUC-KR, EUC-CN, Shift_JIS, Big5, GB18030, KOI8-R, CP1251, ISO-8859-1, ISO-8859-2, ISO-8859-3, ISO-8859-4, ISO-8859-5, ISO-8859-6, ISO-8859-7, ISO-8859-8, ISO-8859-9, ISO-8859-10, ISO-8859-11, ISO-8859-13, ISO-8859-14, ISO-8859-15, ISO-8859-16 * GB18030: ���ݷ��λ��� * CP1251: Byte���� ------------------------------------------------------------ �饤���� BSD�饤���� ���ȡ��� ��������: Unix��Cygwin�Ķ� 1. autoreconf -vfi (* configure������ץȤ��ʤ��Ȥ�����) 2. ./configure 3. make 4. make install ���ȡ��� make uninstall ������ǧ onig-config --cflags onig-config --libs onig-config --prefix onig-config --exec-prefix ��������: Windows 64/32bit (Visual Studio)�Ķ� make_win64 ���뤤�� make_win32 ��¹� onig_s.lib: static link library onig.dll: dynamic link library * ư��ƥ��� (ASCII/Shift_JIS) 1. cd src 2. copy ..\windows\testc.c . 3. nmake -f Makefile.windows ctest (Visual Studio Community 2015 ��ư���ǧ) ����ɽ�� doc/RE.ja�� ������ˡ ���Ѥ���ץ������ǡ�oniguruma.h�롼�ɤ���(Oniguruma API�ξ��)�� Oniguruma API�ˤĤ��Ƥϡ�doc/API.ja�ȡ� oniguruma.h���������Ƥ��뷿̾UChar(== unsigned char)��̵���ˤ�������� �ˤϡ�ONIG_ESCAPE_UCHAR_COLLISION��define���Ƥ���oniguruma.h�롼�� ���뤳�ȡ����ΤȤ��ˤ�UChar��������줺��OnigUChar�Ȥ���̾��������Τߤ� ͭ���ˤʤ롣 oniguruma.h���������Ƥ��뷿̾regex_t��̵���ˤ��������ˤϡ� ONIG_ESCAPE_REGEX_T_COLLISION��define���Ƥ���oniguruma.h�롼�� ���뤳�ȡ����ΤȤ��ˤ�regex_t��������줺��OnigRegexType, OnigRegex�Ȥ��� ̾��������Τߤ�ͭ���ˤʤ롣 Unix/Cygwin��ǥ���ѥ��롢���������㡧 (prefix��/usr/local�ΤȤ�) cc sample.c -L/usr/local/lib -lonig GNU libtool����Ѥ��Ƥ���Τǡ��ץ�åȥե����ब��ͭ�饤�֥��ݡ��Ȥ��� ����С����ѤǤ���褦�ˤʤäƤ��롣 ��Ū�饤�֥��ȶ�ͭ�饤�֥��Τɤ������Ѥ��뤫����ꤹ����ˡ���¹Ի����Ǥ� �Ķ�������ˡ�ˤĤ��Ƥϡ���ʬ��Ĵ�٤Ʋ������� Win32�ǥ����ƥ��å���饤�֥��(onig_s.lib)��������ˤϡ� ����ѥ��뤹��Ȥ��� -DONIG_EXTERN=extern ��ѥ���������ɲä��뤳�ȡ� ������ץ������ sample/simple.c �Ǿ��� (Oniguruma API) sample/names.c ̾���դ����롼�ץ�����Хå������� sample/encode.c ���Ĥ���ʸ�������ǥ������� sample/listcap.c �������ǽ�λ����� sample/posix.c POSIX API������ sample/sql.c ���ѥʸ����ǽ������ (SQL-like �ѥ�����) sample/user_property.c �桼�����Unicode�ץ��ѥƥ��λ����� �ƥ��ȥץ������ sample/syntax.c Perl��Java��ASISʸˡ�Υƥ��� sample/crnl.c --enable-crnl-as-line-terminator �ƥ��� �������ե����� oniguruma.h ����API�إå� (����) onig-config.in onig-config�ץ������ �ƥ�ץ졼�� regenc.h ʸ�������ǥ������Ȥߥإå� regint.h ������� regparse.h regparse.c��regcomp.c�Τ����������� regcomp.c ����ѥ��롢��Ŭ���ؿ� regenc.c ʸ�������ǥ������Ȥ� regerror.c ���顼��å������ؿ� regext.c ��ĥAPI�ؿ� regexec.c �������ȹ�ؿ� regparse.c ����ɽ���ѥ�������ϴؿ� regsyntax.c ����ɽ���ѥ�����ʸˡ�ؿ����ȹ���ʸˡ��� regtrav.c ��������ڽ��ؿ� regversion.c �Ǿ���ؿ� st.h �ϥå���ơ��֥�ؿ���� st.c �ϥå���ơ��֥�ؿ� oniggnu.h GNU regex API�إå� (����) reggnu.c GNU regex API�ؿ� onigposix.h POSIX API�إå� (����) regposerr.c POSIX API���顼��å������ؿ� regposix.c POSIX API�ؿ� mktable.c ʸ�������ץơ��֥������ץ������ ascii.c ASCII �����ǥ��� euc_jp.c EUC-JP �����ǥ��� euc_tw.c EUC-TW �����ǥ��� euc_kr.c EUC-KR, EUC-CN �����ǥ��� sjis.c Shift_JIS �����ǥ��� big5.c Big5 �����ǥ��� gb18030.c GB18030 �����ǥ��� koi8.c KOI8 �����ǥ��� koi8_r.c KOI8-R �����ǥ��� cp1251.c CP1251 �����ǥ��� iso8859_1.c ISO-8859-1 (Latin-1) iso8859_2.c ISO-8859-2 (Latin-2) iso8859_3.c ISO-8859-3 (Latin-3) iso8859_4.c ISO-8859-4 (Latin-4) iso8859_5.c ISO-8859-5 (Cyrillic) iso8859_6.c ISO-8859-6 (Arabic) iso8859_7.c ISO-8859-7 (Greek) iso8859_8.c ISO-8859-8 (Hebrew) iso8859_9.c ISO-8859-9 (Latin-5 �ޤ��� Turkish) iso8859_10.c ISO-8859-10 (Latin-6 �ޤ��� Nordic) iso8859_11.c ISO-8859-11 (Thai) iso8859_13.c ISO-8859-13 (Latin-7 �ޤ��� Baltic Rim) iso8859_14.c ISO-8859-14 (Latin-8 �ޤ��� Celtic) iso8859_15.c ISO-8859-15 (Latin-9 �ޤ��� West European with Euro) iso8859_16.c ISO-8859-16 (Latin-10 �ޤ��� South-Eastern European with Euro) utf8.c UTF-8 �����ǥ��� utf16_be.c UTF-16BE �����ǥ��� utf16_le.c UTF-16LE �����ǥ��� utf32_be.c UTF-32BE �����ǥ��� utf32_le.c UTF-32LE �����ǥ��� unicode.c Unicode�����ǥ��ζ��̽��� win32/Makefile Win32�� Makefile (for VC++) win32/config.h Win32�� config.h �ķ� ? case fold flag: Katakana <-> Hiragana ? ONIG_OPTION_NOTBOS/NOTEOS�ɲ� (\A, \z, \Z) ?? \X (== \PM\pM*) ?? ʸˡ���� ONIG_SYN_CONTEXT_INDEP_ANCHORS�μ��� ?? �������ְ�ư��߱黻�� (match_at()����ONIG_STOP���֤�) and I'm thankful to Akinori MUSHA. ���ɥ쥹: K.Kosako <kkosako0@gmail.com>