# NAME
AozoraBunko::Tools::Checkerkun - 青空文庫の工作員のための文字チェッカー(作:結城浩)をライブラリ化したもの
# SYNOPSIS
use AozoraBunko::Tools::Checkerkun;
use utf8;
my $checker1 = AozoraBunko::Tools::Checkerkun->new;
$checker1->check('森※[#「區+鳥」、第3水準1-94-69]外💓'); # => '森※[#「區+鳥」、第3水準1-94-69]→[78hosetsu_tekiyo]【鴎】外💓[gaiji]'
$checker1->check('森鷗外'); # => '森鷗[gaiji]外'
$checker1->check('森鴎外'); # => '森鴎外'
my $checker2 = AozoraBunko::Tools::Checkerkun->new({ output_format => 'html', gonin1 => 1, gonin2 => 1, gonin3 => 1 });
$checker2->check('桂さんが柱を壊した。'); # => '桂さんが柱を壊した。'
# DESCRIPTION
AozoraBunko::Tools::Checkerkun は、青空文庫工作員のための文字チェッカーで、結城浩氏が作成したスクリプトを私がライブラリ化したものです。
# METHODS
## $checker = AozoraBunko::Tools::Checkerkun->new(\\%option)
新しい Aozorabunko::Tools::Checkerkun インスタンスを生成する。
my $checker = AozoraBunko::Tools::Checkerkun->new(
'gaiji' => 1, # JIS外字をチェックする
'hansp' => 1, # 半角スペースをチェックする
'hanpar' => 1, # 半角カッコをチェックする
'zensp' => 0, # 全角スペースをチェックする
'78hosetsu_tekiyo' => 1, # 78互換包摂の対象となる不要な外字注記をチェックする
'hosetsu_tekiyo' => 1, # 包摂の対象となる不要な外字注記をチェックする
'78' => 0, # 78互換包摂29字をチェックする
'jyogai' => 0, # 新JIS漢字で包摂規準の適用除外となる104字をチェックする
'gonin1' => 0, # 誤認しやすい文字をチェックする(1)
'gonin2' => 0, # 誤認しやすい文字をチェックする(2)
'gonin3' => 0, # 誤認しやすい文字をチェックする(3)
'simplesp' => 0, # 半角スペースは「_」で、全角スペースは「□」で出力する
'output_format' => 'plaintext', # 出力フォーマット(plaintext または html)
);
上記のコードで設定されている値がデフォルト値です。
## $checked\_text = $checker->check($text)
new で指定したオプションでテキストをチェックします。戻り値はチェック後のテキストです。
# SEE ALSO
[青空文庫作業マニュアル【入力編】](http://www.aozora.gr.jp/aozora-manual/index-input.html)
[チェッカー君](http://www.aozora.jp/tools/checker.cgi)
[外字](http://www.aozora.gr.jp/annotation/external_character.html)
[包摂 (文字コード) - Wikipedia](https://ja.wikipedia.org/wiki/%E5%8C%85%E6%91%82_\(%E6%96%87%E5%AD%97%E3%82%B3%E3%83%BC%E3%83%89\))
[JIS漢字で包摂の扱いが変わる文字(\[78\] \[jyogai\] など)](http://www.aozora.gr.jp/newJIS-Kanji/gokan_henkou_list.html)
[Embedding custom non-visible data-\* with the data attributes](http://www.w3.org/TR/html5/dom.html#embedding-custom-non-visible-data-with-the-data-*-attributes)
# LICENSE
Copyright (C) pawa.
This library is free software; you can redistribute it and/or modify
it under the same terms as Perl itself.
# AUTHOR
pawa