README.ja  2007/05/31

����  ----   (C) K.Kosako <sndgk393 AT ybb DOT ne DOT jp>

http://www.geocities.jp/kosako3/oniguruma/

���֤�����ɽ���饤�֥��Ǥ��롣
���Υ饤�֥�����Ĺ�ϡ����줾�������ɽ�����֥������Ȥ��Ȥ�
ʸ�����󥳡��ǥ��󥰤����Ǥ��뤳�ȤǤ��롣

���ݡ��Ȥ��Ƥ���ʸ�����󥳡��ǥ���:

  ASCII, UTF-8, UTF-16BE, UTF-16LE, UTF-32BE, UTF-32LE,
  EUC-JP, EUC-TW, EUC-KR, EUC-CN,
  Shift_JIS, Big5, GB18030, KOI8-R, CP1251,
  ISO-8859-1, ISO-8859-2, ISO-8859-3, ISO-8859-4, ISO-8859-5,
  ISO-8859-6, ISO-8859-7, ISO-8859-8, ISO-8859-9, ISO-8859-10,
  ISO-8859-11, ISO-8859-13, ISO-8859-14, ISO-8859-15, ISO-8859-16

* GB18030: ���ݷ��λ���
* CP1251:  Byte����
------------------------------------------------------------

�饤����

  BSD�饤���󥹤˽�����


���󥹥ȡ���

 ��������: Unix��Cygwin�Ķ�

   1. ./configure
   2. make
   3. make install

   ���󥤥󥹥ȡ���

     make uninstall

   ư��ƥ��� (ASCII/EUC-JP)

     make atest


   ������ǧ

     onig-config --cflags
     onig-config --libs
     onig-config --prefix
     onig-config --exec-prefix



 ��������: Win32(VC++)�Ķ�

   1. copy win32\Makefile Makefile
   2. copy win32\config.h config.h
   3. nmake

      onig_s.lib:  static link library
      onig.dll:    dynamic link library

  * ư��ƥ��� (ASCII/Shift_JIS)
   4. copy win32\testc.c testc.c
   5. nmake ctest



����ɽ��

  doc/RE.ja�򻲾�


������ˡ

  ���Ѥ���ץ������ǡ�oniguruma.h�򥤥󥯥롼�ɤ���(Oniguruma API�ξ��)��
  Oniguruma API�ˤĤ��Ƥϡ�doc/API.ja�򻲾ȡ�

  oniguruma.h���������Ƥ��뷿̾UChar(== unsigned char)��̵���ˤ��������
  �ˤϡ�ONIG_ESCAPE_UCHAR_COLLISION��define���Ƥ���oniguruma.h�򥤥󥯥롼��
  ���뤳�ȡ����ΤȤ��ˤ�UChar��������줺��OnigUChar�Ȥ���̾��������Τߤ�
  ͭ���ˤʤ롣

  oniguruma.h���������Ƥ��뷿̾regex_t��̵���ˤ��������ˤϡ�
  ONIG_ESCAPE_REGEX_T_COLLISION��define���Ƥ���oniguruma.h�򥤥󥯥롼��
  ���뤳�ȡ����ΤȤ��ˤ�regex_t��������줺��OnigRegexType, OnigRegex�Ȥ���
  ̾��������Τߤ�ͭ���ˤʤ롣

  Unix/Cygwin��ǥ���ѥ��롢��󥯤�������㡧
  (prefix��/usr/local�ΤȤ�)
  cc sample.c -L/usr/local/lib -lonig

  GNU libtool����Ѥ��Ƥ���Τǡ��ץ�åȥե����ब��ͭ�饤�֥��򥵥ݡ��Ȥ���
  ����С����ѤǤ���褦�ˤʤäƤ��롣
  ��Ū�饤�֥��ȶ�ͭ�饤�֥��Τɤ������Ѥ��뤫����ꤹ����ˡ���¹Ի����Ǥ�
  �Ķ�������ˡ�ˤĤ��Ƥϡ���ʬ��Ĵ�٤Ʋ�������


  Win32�ǥ����ƥ��å���󥯥饤�֥��(onig_s.lib)���󥯤�����ˤϡ�
  ����ѥ��뤹��Ȥ��� -DONIG_EXTERN=extern �򥳥�ѥ���������ɲä��뤳�ȡ�


������ץ������

  sample/simple.c    �Ǿ��� (Oniguruma API)
  sample/names.c     ̾���դ����롼�ץ�����Хå�������
  sample/encode.c    ���Ĥ���ʸ�����󥳡��ǥ��󥰻�����
  sample/listcap.c   �������ǽ�λ�����
  sample/posix.c     POSIX API������
  sample/sql.c       ���ѥ᥿ʸ����ǽ������ (SQL-like �ѥ�����)

�ƥ��ȥץ������
  sample/syntax.c    Perl��Java��ASISʸˡ�Υƥ���
  sample/crnl.c      --enable-crnl-as-line-terminator �ƥ���


�������ե�����

  oniguruma.h        ����API�إå� (����)
  onig-config.in     onig-config�ץ������ �ƥ�ץ졼��

  regenc.h           ʸ�����󥳡��ǥ������Ȥߥإå�
  regint.h           �������
  regparse.h         regparse.c��regcomp.c������������
  regcomp.c          ����ѥ��롢��Ŭ���ؿ�
  regenc.c           ʸ�����󥳡��ǥ������Ȥ�
  regerror.c         ���顼��å������ؿ�
  regext.c           ��ĥAPI�ؿ�
  regexec.c          �������ȹ�ؿ�
  regparse.c         ����ɽ���ѥ�������ϴؿ�
  regsyntax.c        ����ɽ���ѥ�����ʸˡ�ؿ����ȹ���ʸˡ���
  regtrav.c          ��������ڽ��ؿ�
  regversion.c       �Ǿ���ؿ�
  st.h               �ϥå���ơ��֥�ؿ����
  st.c               �ϥå���ơ��֥�ؿ�

  oniggnu.h          GNU regex API�إå� (����)
  reggnu.c           GNU regex API�ؿ�

  onigposix.h        POSIX API�إå� (����)
  regposerr.c        POSIX API���顼��å������ؿ�
  regposix.c         POSIX API�ؿ�

  enc/mktable.c      ʸ�������ץơ��֥������ץ������
  enc/ascii.c        ASCII ���󥳡��ǥ���
  enc/euc_jp.c       EUC-JP ���󥳡��ǥ���
  enc/euc_tw.c       EUC-TW ���󥳡��ǥ���
  enc/euc_kr.c       EUC-KR, EUC-CN ���󥳡��ǥ���
  enc/sjis.c         Shift_JIS ���󥳡��ǥ���
  enc/big5.c         Big5 ���󥳡��ǥ���
  enc/gb18030.c      GB18030 ���󥳡��ǥ���
  enc/koi8.c         KOI8 ���󥳡��ǥ���
  enc/koi8_r.c       KOI8-R ���󥳡��ǥ���
  enc/cp1251.c       CP1251 ���󥳡��ǥ���
  enc/iso8859_1.c    ISO-8859-1  (Latin-1)
  enc/iso8859_2.c    ISO-8859-2  (Latin-2)
  enc/iso8859_3.c    ISO-8859-3  (Latin-3)
  enc/iso8859_4.c    ISO-8859-4  (Latin-4)
  enc/iso8859_5.c    ISO-8859-5  (Cyrillic)
  enc/iso8859_6.c    ISO-8859-6  (Arabic)
  enc/iso8859_7.c    ISO-8859-7  (Greek)
  enc/iso8859_8.c    ISO-8859-8  (Hebrew)
  enc/iso8859_9.c    ISO-8859-9  (Latin-5 �ޤ��� Turkish)
  enc/iso8859_10.c   ISO-8859-10 (Latin-6 �ޤ��� Nordic)
  enc/iso8859_11.c   ISO-8859-11 (Thai)
  enc/iso8859_13.c   ISO-8859-13 (Latin-7 �ޤ��� Baltic Rim)
  enc/iso8859_14.c   ISO-8859-14 (Latin-8 �ޤ��� Celtic)
  enc/iso8859_15.c   ISO-8859-15 (Latin-9 �ޤ��� West European with Euro)
  enc/iso8859_16.c   ISO-8859-16
                     (Latin-10 �ޤ��� South-Eastern European with Euro)
  enc/utf8.c         UTF-8    ���󥳡��ǥ���
  enc/utf16_be.c     UTF-16BE ���󥳡��ǥ���
  enc/utf16_le.c     UTF-16LE ���󥳡��ǥ���
  enc/utf32_be.c     UTF-32BE ���󥳡��ǥ���
  enc/utf32_le.c     UTF-32LE ���󥳡��ǥ���
  enc/unicode.c      Unicode����

  win32/Makefile     Win32�� Makefile (for VC++)
  win32/config.h     Win32�� config.h



�ķ�

  ? case fold flag: Katakana <-> Hiragana
  ? ONIG_OPTION_NOTBOS/NOTEOS�ɲ� (\A, \z, \Z)
 ?? \X (== \PM\pM*)
 ?? ʸˡ���� ONIG_SYN_CONTEXT_INDEP_ANCHORS�μ���
 ?? �������ְ�ư��߱黻�� (match_at()����ONIG_STOP���֤�)

and I'm thankful to Akinori MUSHA.


���ɥ쥹: K.Kosako <sndgk393 AT ybb DOT ne DOT jp>