2012年7月27日金曜日

中華タブレット+USBミニ扇風機


本当のところはどうなのか知らないが。
電力不足だ、計画停電だ、って話がある以上、出来る範囲で節電してみようかと。
てな訳でこの夏は基本的に事務所のエアコンはつけず、扇風機でしのぐ予定。
あくまでも予定だが。


ということで、少し前に卓上のUSB扇風機を購入して使っている。



・・・・これが意外といい感じ。

音も思ったよりも静か。
もちろん扇風機だけだとツライので、アイスノンや半裸(上半身裸)を併用してではあるが、「この夏、乗りきれるんじゃね?」と思い始めている。

ただ、買ったあとに気付いたのだが、首振り機能はない。
こっちにしておけばよかったような気もしている。





で、ここからが本題だが。

書籍をPDF化して中華タブレットで読む、というのが今の私の読書スタイル。
その場所は主にトイレの中が多い。
で、そのトイレの中が死ぬほど暑い。
堪りかねてある日卓上の扇風機をトイレに持ち込んでみた。
USB式なので中華タブレットに挿して使うことが出来る。

・・・・これがまたいい感じ。

ただ、いくら卓上タイプでさほど大きくないとはいえ、毎度持ち運ぶのはやや不便というかメンドクサイ。
クリップ式で挟めるのだがトイレ内に適当な箇所がなく、といってタブレット端末につけると重すぎるし邪魔。
また、屋内ならまだしも、さすがに外に持ち歩くのはちょっと無理。


ならばもっと小さいやつを、ということでこちらを買ってみた。



・・・・エエやん。

さすがに「あ~、超涼しい~」とまではいかないが。
羽はやわらか素材でできてるので稼働中に触っても問題なし。
風量は卓上タイプに比べればあれだが、まぁなんとか。
音は、多少「ブィィィ~ン」という音がするがこれも我慢できる範囲。
ちなみに、Amazonレビューで「プロペラを外してモーターの軸にクレ556的な潤滑油を注すとほとんど音がしなくなる」と書いてあったので試そうと思ったが、羽の外し方が分からず・・・。
とりあえず軸の見えてる部分にクレ556を注してみたが、全く効果はなかった。

サイズ的にはちょうどいい感じだし、外に持ち歩くのも一応アリかな、と。
収納ケースもついてることだし。


そんな訳で、ビバ!モバイル扇風機!!


P.S
そういえば子どもが乾電池で動く手のひらサイズの扇風機持ってたのを思い出した。
わざわざ買わなくてもそれで良かったんじゃ・・・・・。
という気がしないでもないが、忘れることにする。

P.S
そういえば、トイレの次に多いのが移動中の電車内での読書。
でも、電車の中って涼しいし、場合によってはむしろ寒いくらい。
わざわざ扇風機を持ち歩く必要があるんだろうか・・・・・。
という気がしないでもないが、忘れることにする。


2012年7月24日火曜日

タックスアンサーが更新されてた・・・。

以前こちらの記事にもした「30万円未満の少額減価償却資産特例」の解説ページをを含む、国税庁タックスアンサーのページが更新されている。

昨年暮れの税制改正大綱公表から年明けの改正法案提出、そのタイミングでタックスアンサーのページを書き換えることはもちろんあり得ないが。
3月末の改正法案成立後もしばらく当該サイトは古い情報のままとなっていた。
上記のいずれかのタイミングで「延長の可能性がある」など何らかのアナウンスがあると親切かなとは思うが、現実的にはなかなか厳しいのだろう。

が、6月(7月)になり、ようやくタックスアンサーの各ページも「平成24年4月1日現在法令等」をベースとした内容に更新された模様だ。

(法人)


(個人)

もちろん上記以外のページも更新されている。(はず)

ちなみに、上記の画像で表示されている「07/18/2012」や「06/29/2012」という日付は、サイトが更新された日時を表している。
そのような機能を持つブックマークレットを利用して表示させているだけなので、本当に正確な更新日時なのかは何とも言えないが・・・。


なにはともあれ、これで一安心、と・・・・・。

2012年7月20日金曜日

預金通帳のOCR読取精度を上げるコツ(濁点半濁点)



預金通帳をOCRで読み取ってデータ化するにあたり、濁点や半濁点は認識結果が悪くなる原因のひとつ。
冒頭画像でもあるように、濁点半濁点は元の文字とはやや離れ気味に印字される。
ちなみに上記は三菱東京UFJ銀行の通帳だが、他の金融機関の通帳でも同じような傾向かと。


上記のような通帳をOCRソフト(辞書登録がない状態)にかけると、「シ」と「’」や、「ホ」と「●」など別々の文字等として認識されることが多い。
それでは困るので別々に認識されたものをひとつに結合したうえで「ジ」とか「ポ」として辞書登録する、という作業に当初は励んでいた。


が、それでも相変わらず別のキャラクターとして認識されたりすることも多く。
「ポ(Po)」と「ボ(Bo)」が登録されているとただの「ホ(Ho)」の認識の時でも「ポ(Po)」や「ボ(Bo)」となることも多くなる。


結局、2文字と認識されたものを1文字としてどんなに頑張って辞書に登録しても、やはり無理があるっぽい。
ならば、濁点半濁点は分けて辞書登録してしまおう、と。
つまり、「シ」と「゛」、「ホ」と「゜」という感じで「゛」と「゜」を単独の文字として辞書登録する。
当然認識結果は「シ゛」「ホ゜」となり「ジ」「ポ」とはならない。
でも、これでいったんOKとする。
とは言うものの、そのままだと当然扱いにくい。
なので、後はExcelに任せることにする。


そもそも濁点半濁点がつく文字というのは限られている。
が ぎ ぐ げ ご ざ じ ず ぜ ぞ だ ぢ づ で ど ば び ぶ べ ぼ ガ ギ グ ゲ ゴ ザ ジ ズ ゼ ゾ ダ ヂ ヅ デ ド バ ビ ブ ベ ボ ぱ ぴ ぷ ぺ ぽ パ ピ プ ペ ポ ヴ
これらをExcelの置換機能で「か゛」→「が」のように置換してしまえばよい。
通常の置換だと1パターンずつしか出来ないので、そこはマクロで一気に。
みるみる文字が置き換わっていくのは実に快感。