2008-02-07から1日間の記事一覧

テキストの文字種分割の補足

Perl で日本語テキストを簡単に字種かたまりに分割できないかな、 と思い、perlunicode を読みながらサンプルプログラムを書いてみました。 対象テキストは UTF-8。 Perl で日本語テキストを字種分割 たつをさんは,m// でマッチングさせて分割させてますけ…