2012年4月30日月曜日

預金通帳のOCR読取精度を上げるコツ(認識字種)

こちらの記事(Blog the Minor: 通帳を1行ずつ会計ソフトへ入力するのはもう飽きちゃったんだ。)の続き。

ちょっとおさらいをしておくと、

・通帳のスキャンに使用するスキャナーはScanSnapS1100
・OCRソフトはe.Typist
・通帳は頭やお尻からではなく横からスキャナーに挿し込んで読み込ませる
・スキャナーに挿し込む前に通帳のページはよく開いておく
・通帳には余計なカキコミはしない
・スキャナーの設定は「スーパーファインモード・白黒・PDF形式」
・三菱○京UFJの通帳はクソ
・ゆう○ょ銀行の通帳も意外とクソ(← NEW!)

といった感じ。


で、今日はe.Typistの認識字種設定について。


e.Typistは表の列ごとに字種を設定することが出来る。
今回のような預金通帳の読み取りには非常に効果的なので上手に使いたい。


「年月日」列

記号・数字のみチェック
基本的に数字と「-(ハイフン)」のみの列なので認識率も高いはずと期待するのだが、意外にそれほど高くなかったりもする。
例えば、左端の通帳行番号が「年」の数字にかかってしまったり。
あるいは、次の通帳(三菱東京UFJ)のようにハイフンが数字にかぶってしまう場合。

このような場合は、ハイフン込で数字を辞書に登録してハイフンは捨て。
あとで修正。Excelなら、Excel先生ならきっとなんとかしてくれる!


「摘要」列

通帳によって異なるので適宜
データとしては重要性はそれほど高くないのでまぁ適当に


「お支払金額」・「お預り金額」列

金額だけでなく、反対側の金額に対応する振込先等が記載されることが多い。
金融機関(通帳)によって漢字の有無などあるので字種設定は適宜。
ひらがなはおそらくほとんど使われないので外してもOKかと。

問題は英字にチェックを入れるかどうか。
アルファベットを使用した振込先等やが記載されることは少なくないが。
たとえそれらの認識率を落とすことになるとしても英字は外した方が良いように思う。
これを入れると肝心の「金額の認識率」が下がるからだ。

例えば
0(ゼロ) → o(オー)
1(イチ) → i(アイ)
2(ニ)  → z(ゼット)
5(ゴ)  → s(エス)
6(ロク) → b(ビー)
など。

前にも書いたが、摘要欄に多少誤字があっても大した問題ではない。
例えば「GOOGLE」(ジーオーオー〜)が「G00GLE」(ジーゼロゼロ〜)と書いてあっても読めちゃうし。
もちろん必ずしも読めちゃうとは限らないが、気になるレベルのものは後でまとめて修正すれば良い。
それよりも金額が正しく認識されないというのは問題だ。
通帳のフォントによっては「英字」にチェックを入れたままでも金額の認識率が高い場合もあり、この辺は様子を見ながら、といった感じか。


「差引残高(現在高)」列

記号・数字のみでOK。
この列は認識率がかなり高いと思う。


「符号(記号・店番号)」などの列

会計処理には不要なデータのため認識範囲外

ちなみに、残高列の金額自体はそもそも会計ソフト等で自動計算されるので認識不要と思われるかも知れないが。
支払金額や預り金額が正しく認識されているかどうかを後で検証する際に役立つのでやはり必要。


で、上記の設定も大切だが、もっと精度アップに効果的な方法を発見したような・・・・そんな気がする。

それを書きたかったのだが力尽きたので、また次回にでも・・・。






2012年4月19日木曜日

MacTypeの入ってないWindowsなんて起動する気しなくなっちった。

数年前にiPhoneを使い始め、まんまと昨年よりMacを使うようになってしまった。
それまではフォントなんてまったく気にしたことがなかったが。
やはり使い比べてしまうとエライ違いだな・・・と。

仕事柄、Macに全面移行はムリなので、どうしてもWindowsマシンを使わざるを得ない。
なんとかならないかと、GDI++などを使っていたこともある。
これはこれで良かったのだが、変なエラーメッセージがいつも出たりして、PC買い替えとともになんとなく使わなくなってしまった。

で、今日こちらのサイトで知ったのが「MacType」というソフト。
導入も簡単だし、試してみればGDI++と同じでWindowsマシンが見違える。
最初の画面が中国語ということで若干の抵抗感がありつつも、入れてしまえば特に気にはならない。
変なエラーや重くなったりなどの副作用も今のところ特に感じられない。


例えば、会計ソフトなどはMac用のものでなかなか良いソフトがない。
どうしてもWin環境で使わざるを得ないのだが、見た目の部分だけはMacTypeを入れることによって多少マシになるかも。
いくつかの会計ソフト(バージョンは古いやつもある)で試してみたので、以下にビフォーアフターの画像を貼ってみる。
左側が元々のMSゴシック、右側がMacTypeを入れた後のMSゴシックである。

なお、当然ながら、データは全てサンプルデータである。

PCA会計



弥生会計



会計王



以上、この画像だけでは伝わりきらない部分もあると思うが一応。
(ちなみにスクリーンショットの画像ファイルの容量的にも結構違う。)


MacTypeはフォントの見え方を自分好みに微調整できるようであるが、メンドクサイのでそこまでは試していない。
また、モードもいくつか選べるようであるが、「漢は黙ってレギストリ(レジストリ)モード(要再起動)だろ」ってことで。


なんとなく文字がクッキリすると情報が向こうから飛び込んでくるような感じ。
今までよりも多くの情報が取り入れられそうに感じるが、まぁ錯覚だろう・・・。
そもそも処理能力が上がってるわけじゃないので処理しきれないか・・・。


そんなわけで、Winユーザーなら試してみる価値はあるかも。
何と言ってもタダだし。



2012年4月16日月曜日

税務通達・質疑応答事例等カスタム検索の便利な使い方

前の記事(Blog the Minor: Googleカスタム検索を利用して国税庁サイトの通達や質疑応答などを税目毎に検索)で紹介した、Googleカスタム検索を利用して国税庁サイトの通達や質疑応答事例等を税目毎に検索する方法。
あの記事をお気に入りに登録したりするよりもっと便利な使い方がある。

ブラウザで、InternetExplorer利用の場合はよく分からないが、ChromeやFirefoxだと拡張機能(エクステンション・アドオン)がある。
で、その拡張機能に「ブラウザに自分の好きな検索エンジンを登録して、それを右クリックから検索実行できる」ものがある。

例えば、Chromeの場合「Context Menu Search」という拡張機能がある。 これなら、メールのやり取りやサイトを閲覧していて通達番号が出てきたり調べたいキーワードを見つけたら、右クリックして好きな税目の検索エンジンで検索できるので素早く情報に辿り着けるかと。


なお、通達番号で検索すると基本的には一番上にズバリのページがヒットする感じだけど、番号が全角だとムリっぽい。
その場合は再度半角で入力し直すか、ダブルクオーテーション(「””」)でくくるとOKだがちょいメンドクサイ。
なので、メール等のやり取りでは普段から通達番号は半角で入力して欲しいとつくづく思う。 ただのワガママだけど・・・。
※ 2012/06/10 追記 
この問題を解決する方法をこちらの記事に書いた。(Blog the Minor: フレーズ検索で税務通達・質疑応答事例等カスタム検索がさらに便利に!


で、拡張機能「Context Menu Search」の設定画面。
ここに各検索エンジンを登録していく。
(デフォルトでいくつか入ってるエンジンは削除してある)




・・・・・え? せっかく試してみてやろうかと思ったのに、こんなのチマチマ設定してられるかって?


そんなこともあろうかと。
こちらのオプション画面で設定が一括インポートできる。



で、そのインポートする設定事項の中身は以下。
(2012/06/10 修正 = 以下は修正後)
[["-1","法人税関係通達検索 ","http://www.google.com/cse?cx=000841340855942113389%3Aznyvzfkxq3i&ie=UTF-8&q=%s&sa=%E6%A4%9C%E7%B4%A2&siteurl=www.google.com%2Fcse%2Fhome%3Fcx%3D000841340855942113389%3Aznyvzfkxq3i&ref=www.google.com%2",true],["-1","法人税質疑応答事例等検索 ","http://www.google.com/cse?cx=000841340855942113389%3Ahx9uox_0xlo&ie=UTF-8&q=%s&sa=%E6%A4%9C%E7%B4%A2&siteurl=www.google.com%2Fcse%2Fhome%3Fcx%3D000841340855942113389%3Ahx9uox_0xlo&ref=www.google.com%2",true],["-1","消費税関係通達検索 ","http://www.google.com/cse?cx=000841340855942113389%3Axuolgxuex7u&ie=UTF-8&q=%s&sa=%E6%A4%9C%E7%B4%A2&siteurl=www.google.com%2Fcse%2Fhome%3Fcx%3D000841340855942113389%3Axuolgxuex7u&ref=www.google.com%2",true],["-1","消費税質疑応答事例等検索","http://www.google.com/cse?cx=000841340855942113389%3Acfzpthdrixe&ie=UTF-8&q=%s&sa=%E6%A4%9C%E7%B4%A2&siteurl=www.google.com%2Fcse%2Fhome%3Fcx%3D000841340855942113389%3Acfzpthdrixe&ref=www.google.com%2",true],["-1","所得税関係通達検索 ","http://www.google.com/cse?cx=000841340855942113389%3Airgdysiaqek&ie=UTF-8&q=%s&sa=%E6%A4%9C%E7%B4%A2&siteurl=www.google.com%2Fcse%2Fhome%3Fcx%3D000841340855942113389%3Airgdysiaqek&ref=www.google.com%2",true],["-1","所得税質疑応答事例等検索 ","http://www.google.com/cse?cx=000841340855942113389%3Acpfuk5qyxrm&ie=UTF-8&q=%s&sa=%E6%A4%9C%E7%B4%A2&siteurl=www.google.com%2Fcse%2Fhome%3Fcx%3D000841340855942113389%3Acpfuk5qyxrm&ref=www.google.com%2",true],["-1","相続税関係通達検索 ","http://www.google.com/cse?cx=000841340855942113389%3Ajhmjo4n866m&ie=UTF-8&q=%s&sa=%E6%A4%9C%E7%B4%A2&siteurl=www.google.com%2Fcse%2Fhome%3Fcx%3D000841340855942113389%3Ajhmjo4n866m&ref=www.google.com%2",true],["-1","相続税財産評価関係通達検索 ","http://www.google.com/cse?cx=000841340855942113389%3Ahbi4qxkpkgo&ie=UTF-8&q=%s&sa=%E6%A4%9C%E7%B4%A2&siteurl=www.google.com%2Fcse%2Fhome%3Fcx%3D000841340855942113389%3Ahbi4qxkpkgo&ref=www.google.com%2",true],["-1","相続税質疑応答事例等検索 ","http://www.google.com/cse?cx=000841340855942113389%3A9zfcctogltg&ie=UTF-8&q=%s&sa=%E6%A4%9C%E7%B4%A2&siteurl=www.google.com%2Fcse%2Fhome%3Fcx%3D000841340855942113389%3A9zfcctogltg&ref=www.google.com%2",true],["-1","耐用年数取扱通達","http://www.google.com/cse?cx=000841340855942113389%3Akxcip-f1bxq&ie=UTF-8&q=%s&sa=%E6%A4%9C%E7%B4%A2&siteurl=www.google.com%2Fcse%2Fhome%3Fcx%3D000841340855942113389%3Akxcip-f1bxq&ref=www.google.com%2",true]]
これをコピーして「Export/Import search options」の欄に貼付けて保存すればすぐに使えるかと。

ちなみに、Firefoxは最近使ってないのでよく分からないが、同様のアドオンは確かあったはず。(調べるのメンドクサクなっちゃった)
(2012/06/10 追記  Firefox向けの記事を追加「Blog the Minor: 税務通達・質疑応答事例等カスタム検索の便利な使い方(Firefox編)」)

以上。



Googleカスタム検索を利用して国税庁サイトの通達や質疑応答などを税目毎に検索



仕事柄、国税庁のサイトを良く利用する。
それなりに使いやすいし、情報も充実していると思う。

が、情報が充実している割に検索機能(サイト内検索)がイマイチというか、もうちょい使えると有難いなと感じる。
上の画像にある通り、日付指定やAND・OR、各メニューごとに絞込みなど基本的な部分は抑えている。
ただ、自分としては税目毎の通達検索や質疑応答事例等検索がしたい。
そういう時ってあるよね?
え、ない?・・・いや、そこはあるってことにしてもらわないと・・・。
少なくとも私はある。

そこで、Googleのカスタム検索機能を使って、各税目毎に、通達(基本通達・個別通達)や質疑応答事例等(質疑応答事例・その他法令解釈に関する情報)を検索できるようにしてみた。
文書回答事例のページが検索対象に入ってないが、あえて外したのだったか・・・なんでだったっけ・・・。


国税庁サイトのリニューアル等でうまく動作しないケースも出てくるかもしれないが、とりあえず。


法人税関係通達検索


法人税質疑応答事例等検索


消費税関係通達検索


消費税質疑応答事例等検索


所得税関係通達検索


所得税質疑応答事例等検索


相続税関係通達検索


相続税財産評価関係通達検索


相続税質疑応答事例等検索


耐用年数取扱通達検索


以上。


P.S
宜しければこちらも。
Blog the Minor: 税務通達・質疑応答事例等カスタム検索の便利な使い方



D2(メール自動データベース変換ソフト)を利用するためのメールデータについて

先日の記事(Blog the Minor: Amazon購入履歴データ(CSV)取得のためのパラメータ公開)に関連して。

D2というソフトを利用してAmazon等からくるメールの内容を解析しCSVに変換するのだが。
自分の場合、そのメールデータを用意するところで少々手間取ったので一応メモ的に。

メールの環境は千差万別、人それぞれなのでなんとも言えないが。
自分の場合は基本的にGmailを利用し、メール自体はローカルにダウンロードせずにWEBのみで利用する感じ。
もちろんいつ何があるか分からないのでバックアップは必要だが、それも別のWEBメールアカウントに転送で。
ただ、D2を利用する場合にはメールデータをローカル上に置いておく必要がある。

こちらの解説を読むとD2の設定でGmailを受信することが出来るようだ。
が、このへんなどを見るとGmailはちょっと特殊らしく、そのせいかどうか自分の環境では上手く受信できず。
さらに、D2のメール設定画面でGmailのアドレスとパスワードを入力するのだが。
この情報がDCVファイル(D2のプロジェクトファイル)に平文で保存される仕様のようで、これがちょっと抵抗あってD2上でのメール受信は諦めた。

で、試したのが「MailStore Home」というフリーのソフト。
Gmailのバックアップ用途としても使えるようだ。
ソフトは基本的に英語(かドイツ語)の表示。
もしかしたら日本語化したものがどこかにあるかも知れないが。
それほど難しいことをするわけではないので英語のまま使っている。
このソフトはGmailのラベル単位でバックアップも出来る。
自分の場合、全メールのダウンロードまではしたくないので有難い。
全バックアップするなら「Gmail Backup」というフリーソフトもあるようだが。

  1. MailStore Homeを起動

  2. 「Archive E-mail」を選択

  3. Googleのメールアドレス・パスワードを入力

  4. 「Folders」でバックアップしたいGmailのラベルを選択、他のオプションは適当に

  5. Gmailのラベルを選択する画面

  6. Finishボタンを押して実行

  7. バックアップ成功、ラベル毎にフォルダに別れる

  8. 後日に再度バックアップを実行した場合には差分だけが取り込まれる

  9. 上の時点でローカルのどこかしらにメールデータがダウンロードされているはずだがここからさらにD2で扱う用のEML形式に変換

  10. Exportを実行し保存するフォルダを選択する

  11. ちなみに、最後の最後でスクリーンショットを撮り忘れるという詰めの甘さ。
    ここまで書けばまぁいいか・・・。


まぁこのように、やはりメンドクサイ。
多分他のメーラーとか使ってればもっとラクなのかも知れないが。


なお、D2での解析自体を外部に委託(会計処理目的)する場合。
上記のようにメールデータを別途保存して用意しなくても、メールの転送設定(委託先のアドレスに)を最初に設定しておけば良いかも。
その場合、転送するのはAmazonからのメールだけで良いので、必ずフィルタを設定する必要がある。
そうじゃないとすべてのメールが転送されてしまうので。
ただ、すべてのAmazonでの買い物の情報が転送されてしまうので、例えば会計処理に必要な買い物とコッソリ楽しむ系の買い物が混在してる場合は向かないかも。
あるいは買い物の都度判断して手作業でメール転送するとか。
メールデータをダウンロードしてEML形式でDropbox上の共有フォルダに保存するのとどっちがメンドウだろうか・・・。


そんなわけで、繰り返しになるが。
Amazonさん、購入履歴データをCSVで下さいっ!


P.S
この記事を全部書き終わった後でMailStore Homeの更新をチェックしてみたら、なんと新しいバージョンが・・・。
アップデートしてみたら見た目も変わってたけど、もうスクリーンショット撮り直す気力は・・・ない・・・。


2012年4月13日金曜日

Amazon購入履歴データ(CSV)取得のためのパラメータ公開

以前にこちらの記事(Blog the Minor: Amazonほかネットショップのヘビーユーザー必見! 購入履歴を簡単に集計し会計データへ落とし込む方法)で紹介したAmazonでの購入履歴をCSVデータで取得する方法について。

D2というソフトを使うんだけど、そのパラメータを設定したファイルをせっかくなので公開してみようかと。
Amazonからくるメールのフォーマットが特に2011年は不安定だったんだけど、2012年は今のところイケてる感じがするので。
(ただ、従来はHTML形式で受信してたメールをテキスト形式に変えたので、その影響で上手く行っているのかもしれない。)

D2は30日の試用期間があるのでちょっとお試しで使うことも出来る。
動作環境はWindowのみだが、Macにも対応してくれないかな~と。
MacでこのD2に相当するソフトがないものだろうか。


D2のパラメータ画面はこちら。


パラメータを設定したプロジェクトファイルはこちら。
 → amazonメール2012年以降.DCV
※ 右クリックして「名前をつけてリンク先を保存」(ブラウザによって表現が違うと思うが)


上記DCVファイルをダウンロード保存し、D2を起動し、「ファイル」→「プロジェクトを開く」(ショートカットキーはCtrl+O)
次にメールを保存してあるフォルダをたどって「変換」ボタンをおすとこのような画面になる。はず。

このまま保存すればExcelで加工できる。

Amazonからのメールの状態や個々の環境によっても違うので上手くデータが取得できない場合はご容赦を。

2011年は何箇所かデータの取得漏れが生じているが、2012年に入ってからは今のところ順調。(まだ件数が少ないのでなんとも言えないが)
もし例えばカテゴリー以下が上手く取得できないデータがあるときは、パラメータの以下の部分にチェックを外すと最初に取得できなかった部分が取得できるかも知れない。(この部分、パラメータの設定で上手く1回で取得できないものだろうか・・・。)


ちなみに、販売者のところが最近「Amazon.co.jp」と表記されるように。
従来は「Amazon.com Int'l Sales, Inc.」となっていた。
以前にアマゾンの日本法人の課税について国税と争いがあったが、そのへんの絡みで今さら何か扱いが変わったのかな?と思ったが。
どうもそういうわけではなく、単に表記が変わっただけで、従来通り販売者はあくまでも「Amazon.com Int'l Sales, Inc.」のようだ。


で、そもそもなぜこのようなことをするのかをおさらい。

  • 買い物は基本的にAmazonで買えるものはAmazonを利用するので件数が多い。(私の場合)

  • クレジットカード決済にしてるが、カード利用明細だけでは内容が全く分からない。

  • ゆえにAmazonからの「納品書兼領収書」を参照するが、カードの引落金額と合わないことがある。

  • カード利用明細に記載された金額は複数商品の合計だったりするので、その場合は商品ごとに分ける必要がある。

  • カード利用明細を基に入力するとなると商品の内容は手入力になる。

  • Amazonマーケットプレイス利用だと納品書のみで金額の記載がないことが多い。

  • ギフト用として第三者に直送した商品についてはそもそも「納品書兼領収書」が残らない。

ということで、クレジットカードの利用明細と納品書兼領収書を基に会計処理をするのは結構厳しい。
また、計上のタイミングも遅くなるし。(後でまとめて処理する場合にはあまり関係ないけど)

そんなわけで、納品書兼領収書やカード利用明細ではなく、Amazonからの注文確認メールを基に会計処理をした方がラクかな、と。
商品のカテゴリーや送付先などでソートをかけることによって一気に会計処理(勘定科目振り分け=借方科目)が可能となる。
また、このCSVファイルを基に全商品について貸方科目を例えば未払金ACとかにしておけば、カード決済された時は未払金ACを消し込むだけで良い。
日付に関しては注文日で会計処理がしている。
厳密には納品日とかなのだろうが、もし必要があれば決算の時だけ対応すれば良いかなと。



というか、そもそもAmazonのサイト上で購入履歴がCSVでダウンロード出来るようになればこんなメンドウな事はしなくてよいわけで・・・ Amazonさん、お願いします!!



2012年4月11日水曜日

スキャンした領収書の絞り込み検索

領収書、スキャンしてますかーっ!

してない?・・・だよね。普通はね。

ま、自分の場合、こちらの記事(Blog the Minor: 私がせっせと領収書をスキャンする理由(本編))の通り全スキャンしてるわけだけど。

過去の領収書を探して確認しなきゃいけない時ってあるよね?

え、ない?・・・だよね。普通はね。


例えば、「なんか最近やけに電気代が高いな〜、過去の電気代を調べてみよう!」っていう場合。

事業用のものや家計簿をつけていればに記録していれば帳簿(ソフト)を見れば日付や金額は分かる。
が、電気の使用量(kWh)や単価まで確認したい場合、さすがにそこまでは入力していないはず。
となると領収書を見なければならない。

ちょっと苦しい展開だが、さっきたまたまそういう状況になったのと、このところブログ更新してないので一応・・・。

具体的には、

1.Explorerを起動する。(ショートカットキーは「Winマーク+E」)

2.領収書等が保存されているフォルダを辿る。

3.プレビューウィンドウを有効に。(ショートカットキーは「Alt+P」)

4.検索ボックスでに入力する。例えば「電気代.pdf」とか。

5.リストアップされたファイルを選択すると右側のプレビュー画面に領収書の内容が表示される。

6.ファイル選択で下(上)キーを押していけば順次内容が確認できる。

以上はWindowsでの手順だが、もちろんMacでもSpotlight+Finder+Quicklookで同様に。

もしPDFがうまくプレビュー出来ない場合にはこちらの記事(Blog the Minor: スキャンその後に(ファイル名変更テクニック))に書いた通り、デフォルトのPDFリーダーを変えてみると良いかもしれない。


以上。


え?Evernote? まぁそれでもいい・・・けど・・・。





2012年4月1日日曜日

H24年度税制改正法案(租税特別措置法等の一部を改正する法律案)成立!

平成24年3月30日金曜日、H24年度税制改正法案(租税特別措置法等の一部を改正する法律案)が成立した模様。(第180回国会における財務省関連法律 : 財務省

先日こちらの記事にもした、「30万円未満の少額減価償却資産特例」についても予定通り2年間の延長となった。
とはいえ、給与所得控除の制限など実務的に影響が大きな改正は他にもいろいろあるわけだが。
そのへんの解説はともかくとして、気になっていた方もいると思うので取り急ぎ。