2012年11月11日日曜日

ScanSnap S1100で両面同時スキャンする方法



もはや上の画像が全てを物語っているが・・・。

私が愛してやまないスキャナー、ScanSnap S1100。
こちらの記事でもその魅力を語っているところであるが。

そんなS1100も、さすがに両面同時スキャンの機能はない。
が、それを実現する方法を思いついた。



そうだ、2台使えばいいんじゃね?!



1台は普通に設置する。
もう1台は裏返して設置する。
この2台のスキャナーを連続して通すことで両面同時スキャンを実現しよう、と。


やってみたら、思った以上にうまくいった。


最初の1枚目こそ2台ともスタートボタンを押す必要があるが。
自動読込装置があるので2枚目以降は紙をテンポよく挿すだけでOK。
2台目で読み込む時に少しだけ流れが止まるが、まぁスキャンに支障はない。

裏返した方は蓋がパカパカするのでテープで留めたりなんかして。
設置する2台のスキャナーの「間隔」が微妙にポイントだったりする。


ただ、ひとつだけ、たったひとつだけ問題が。(← ひとつだけか?)



どうやら1台のPCに2台のScanSnapは接続できないようだ。

つまり、ScanSnapも2台、PCも2台必要ということ。
もしかしたら、仮想OSでUSBの接続を別々に設定出来れば1台のPCでも可能かも。
残念ながらそこまでは検証していないが。

まぁ、もっとも、そもそもスキャナーを2台用意してまで両面を同時にスキャンするメリットがあるのかと聞かれれば。


・・・・・ない。



そう、もちろんそんなメリットはない。

が、万が一やってみたとして。
スキャナーの設定でファイル形式をPDFとした場合、当然ながら奇数ページのPDFと偶数ページのPDFが出来る。

これは後で「PDF Split and Merge」などのソフトを使ってひとつのファイルにすれば良いだろう。


ま、そもそもやらないと思うけど。


P.S
S1100のホワイトモデル、欲しいなぁ~・・・。




2012年11月8日木曜日

手書きなんてヤッテランネェ。年末調整書類はフォーム付きPDFで。



※ 2017/10/28 追記
平成29年分年末調整の書類はこちらから → 『Blog the Minor: 手書きなんてイヤだねっていう人のために、年末調整書類PDFに入力フォームつけておきました』


====

基本的に、書類は手書きで作成しない、そう決めている。

PDFでダウンロードできる書類はそのまま注釈機能等を利用して入力。
紙で受領した書類もスキャンしてPDFファイルにし、注釈を入れる。


ちょうど今頃は保険会社や年金機構などから控除証明書が送られてくる時期。
ということは、会社から下記の年末調整の書類も配布される頃だが。

[手続名]給与所得者の扶養控除等の(異動)申告|国税庁
[手続名]給与所得者の保険料控除及び配偶者特別控除の申告|国税庁

普通はワケも分からぬまま何度も住所や名前を書き、途中で計算までさせられ。
今年は税制改正で計算が今まで以上にメンドクサイことになってるし。
記入の枠も小さいし、とてもじゃないが手書きで作成する気にならない。


上の通り、これらの用紙は上記のサイトからPDFでダウンロードできる。
パスワード保護されたPDFなので、素直に入力は出来ないが。
ちょっと工夫すれば注釈機能を利用して作成することも可能だ。

が、これだけ細かい書類だと文字の位置を合わせるのもタイヘン。
計算項目もあるが、これくらい自動で計算してくれよ、と。

今年は改正があったものの、基本的には毎年同じようなことを記入する。
名前や住所、家族構成はもとより、保険だって毎年そう変わるものでもない。
だが、手書きだと毎年同じことを記入しなければならない。
しかも、昨年どう書いたかも忘れてしまう。
データで残っていれば使いまわせる可能性もある。

そこで、いっそのことPDFのフォーム機能を使ってみることに。
この書類をExcelで作成している例もあるようだが。
PDFだと無償のAdobe Readerがあれば入力できるし汎用性も高いだろう、と。
後述するが、スマートフォンやタブレットでも入力が可能だし。


ということで、せっかく作ったので一応以下に置いてみる。
バグがある可能性もあり、もし利用される場合は自己責任で。

H25年分給与所得者の扶養控除等申告書 R1.pdf
H24年分給与所得者の扶養控除等申告書 R1.pdf
H24年分給与所得者の保険料控除申告書等(自動計算あり) R1.pdf
H24年分給与所得者の保険料控除申告書等(自動計算あり) R2.pdf
H24年分給与所得者の保険料控除申告書等(自動計算なし) R1.pdf

※<2012/12/13 追記>
当初公開の「H24年分給与所得者の保険料控除申告書等(自動計算あり) R1.pdf」について、一般や個人年金の保険料の入力があって介護医療保険料がない場合、「生命保険料控除額計」の欄が正しく計算されず最高額の12万円を表示してしまう不具合がありましたので、「H24年分給与所得者の保険料控除申告書等(自動計算あり) R2.pdf」に差し替えました。申し訳ございません。


※<2013/11/11 追記>
平成25年の年末調整で使用するファイルはこちらにあります。
「今年もモチロン手書きはしねぇ。年末調整書類はフォーム付PDFで。」

※<2014/11/11 追記>
平成26年の年末調整で使用するファイルはこちらにあります。
「まだ手書きで消耗してるの?年末調整用書類はフォーム付PDFで。」

====

注意点としては、基本的に、Adobe純正のReaderを使用すること。

まずMacの場合。
Preview.appで開くと自動計算が機能しないばかりか、そのままファイルが壊れてしまうこともある。
Macの場合は必ずAdobe Reader.appで開いて頂きたい。


次にスマホやタブレットだが。

まずAndroidについてもAdobe純正のAdobe Readerアプリを使用する。
AcrobatⅪの発売を機にこのアプリもアップデートされ、待望のフォームでの計算機能がサポートされた。
が、が、が・・・単純な足し算などは機能するのだが、条件分岐などが含まれる複雑な計算にはまだ対応していないようだ・・・残念。

なお、AndroidにはqPDF Notes - PDF Reader & Formという有料アプリがある。
こちらはフォームでの計算機能をサポートしているようなのだが、私の環境では全く動作せず、すぐに強制終了してしまう。
しかも、こちらで開いたファイルをPCで開くとちょっと微妙な感じになってので、現時点ではちょっと使えないかな、と。

ということで、上記で「(自動計算なし)」というファイルがあるのはそのため。
「(自動計算あり)」をAdobe Readerアプリで開くと、自動計算が設定されたフォームに入力ができなくなってしまう。
手書きよりはマシだろってことで一応「(自動計算なし)」も置いてみた次第。


次にiOS、つまりiPhone・iPadだが。
こちらも基本的にはAdobe Readerアプリを使う。
もちろん「(自動計算なし)」の方になってしまうが。

ただ・・・悔しいかな・・・iOSの場合には別の素晴らしいアプリが。
それがこちら、PDF Expert (professional PDF documents reader)
アプリとしては比較的高額な(私なら3日は悩んでしまう)850円という設定。
でもその価値ありで、フォームに仕込まれた複雑な算式もしっかり対応する。
なので、このアプリを使う場合に限り「(自動計算あり)」でも問題ない。

Androidでも早くこれに匹敵するようなアプリの登場が望まれる。
というか、無料アプリAdobe Readerが対応してくれれば最高なのだが。


で、最後にメインのWindows。
こちらも基本的には純正のAdobe Readerだが、PDF-XChange Viewerは別。
このソフトなら問題なく使用できるばかりか、Adobe Readerにはない機能が。
それが「フォームデータのインポート・エクスポート」だ。
これで今年入力したデータをエクスポートしておいて、翌年にそのデータをインポートし、変わった部分だけ修正すれば手間が省ける。

ま、様式の改正がなければ、だけど・・・。



PDFには、フォームを配布して、各人が入力したデータを集計する機能がある。
やる気になればそのデータを加工して給与計算ソフトに取り込むのも可能だろう。

多分従業員の多いところはそのような処理をしているのだろう。
何百人分の年調データを給与計算ソフトに入力すると思うとゾッとする。
ズポッと取り込めたらさぞかし気持ちいいだろうなとも思うが。

ただ、それって、従業員が入力したデータが正しいという前提の話。
税制がややこしいこともあり、元データが間違ってることが多いのが年末調整。
給与計算ソフトへの入力以上に、正しいデータの収集が難しいところ。
そうそう簡単にはいかないか・・・。

自分の場合、従業員がそれほど多い顧問先がないのでまぁいいんだけど。


何かファイルに不都合な点があればコメント欄やTwitterで教えて頂けると非常に有難いな、と・・・。


2012年10月18日木曜日

第三世代税理士用電子証明書(ICカード)への更新


夏頃にきた税理士用電子証明書(ICカード)の更新の案内。

早々に申し込みをして新しいICカードは入手していたのだが。
「受領書」の送信をうっかり忘れてて、催促の電話を頂いてようやく手続き。
(この受領書の送信も結構ややこしかったのだか・・・)

ちなみにカードの色も第2世代のピンクから第3世代はオレンジに変わった。

そんなことはどうでもいいのだが。

で、ボチボチ・・・と思いe-Taxソフトで使ってみたところ、以下のエラーが。



ウソだろ!・・・と。
「受領書」返送の際にちゃんと設定したやん!・・・と。
その時ICカードも認識してたやん!・・・と。


で、しばらく悩んでようやく解決した。


電子署名をする際に「ICカード発行元の認証局サービス名」の選択画面が出る。
今までは上の画像の1番「日本税理士会連合会電子認証局」を選択していた。
新しいICカードでは、ここを2番の「日税連 税理士用電子証明書」にしなければならないようだ。


ふ~ん・・・・

ま、マニュアルを読まない自分が悪いんだけどさ・・・・。


ちなみに、これで電子署名は出来るようになるが。

もうひとつ忘れちゃいけない大事なことが。

それは、新しい電子証明書をe-Taxに登録し直さなければならない、ということ。
これをせずに送信(電子申告)するとエラーとなる。


e-Taxソフトの場合は「利用者情報登録」→「電子証明書登録・更新」で。
ベンダーソフトでも同様のメニューがあると思うので忘れずに。


ま、申告期限ギリギリじゃなくてヨカッタ・・・。




2012年10月5日金曜日

進化したスタンディングオフィス



立ってますかーっ!!!



自分のオフィスをスタンディングオフィスに改造してから早1年・・・。

改めて我がスタンディングオフィス誕生の瞬間を、自分のツイートで振り返ってみる。

スタンディングオフィスへ向けて始動。やるよ。やっちゃうよ。ホントにいいの?



スタンディングオフィス間もなく完成! というところで疲れて座りたくなっちゃってるところ。



スタンディングオフィス、間もなく、もう間もなく完成!! というところで足がつってしまいこの先が思いやられているところ。



スタンディングオフィス、ひとまず完成ってことでいいかな。で、完成してみて初めて気がついたことが。まさかこんなこと想定してなかったんだけど。聞いたらビックリするよ。あのね、スタンディングオフィスってね、・・・足が超疲れる・・・・・。

ふっ・・・若かったな・・・オレも・・・・・。


今では立ちっぱなしにもすっかり慣れた
足の疲れや痛みもすっかり感じなくなったような・・・・・・・・気がする。
腰痛や肩こり・頭痛なども感じなくなったような・・・・・・・・気がする。
体重も減少し、ウエストも細くなっているような・・・・・・・・気がする。


で、本題。
順調に1年を経過した我がスタンディングオフィスだが。
ここでもう一段、進化してみようじゃないか、と。

なかなか頑固な腹肉(いわゆる「ラブハンドル」)をなんとかしたい。
よし、ここはひとつ、「ひねり」を加えてみようじゃないか、と。

そこで、コレ。


え、ワカラナイ? いわゆるツイストボードですよ、ツイストボード。


そう、コレに乗っかって、ひねる!ひねる!ひねる!

メールとかを読みながら、ひねる!ひねる!ひねる!

会計データ確認しながら、ひねる!ひねる!ひねる!

Twitter のTL眺めながら、ひねる!ひねる!ひねる!


まさにスタンディングオフィスならではの組み合わせ。
このウエストがねじ切れそうになる感じが実にイイ。
さらに、ボードに仕込まれたイボイボが足裏を刺激。
うん、気に入った!

ちなみに、在庫処分で安かったのでついコレにしちゃったけど。
使ってみたら回転する時にこのトレーニング用チューブが結構邪魔・・・。
普段はチューブのハンドルをズボンのポケットに入れてしまってる。
まぁ、たまにチューブを使って軽くトレーニングすることもあるけど。
ひねり重視ならチューブなしのシンプルなやつがいいかも。



ということで、これからは、
スタンディング&ツイスティング オフィス!!


最後にひとつ大事なコトを。
スタンディングオフィスは高さ調節が重要。
ツイストボードの高さ(厚み)も要チェック!



2012年9月7日金曜日

Acrobat等を使ってPDF上で想定整形地を描く方法




◆不整形地?想定整形地??


相続贈与その他の案件で土地の評価をする、ということがある。

相続税等のシミュレーションとかだと、路線価を調べて、登記上の地積を乗じて土地評価額を算出するという、簡易的な方法で済ますこともある。
比較的キレイな形の土地であれば、まぁそれでも良いのだが、実際にはそのような土地ばかりではない。

もう少し評価の精度を上げようと思うと、地積測量図などを入手して、いびつな土地は「不整形地」として補正して評価(評価減)することになる。
その不整形地の評価の際に登場するのが「想定整形地」だ。













不整形地の場合、上記サイトにあるように、仮の図形(想定整形地)を描いてその面積を計算し、実際の地積との比較で補正率を求めることになる。




◆想定整形地を描くためのツール


想定整形地等を描くのに、土地の評価を多く扱っているようなところは、CAD等図面作成のための専門のソフトを使うことが多いかと。
あるいは、不整形地等の評価用に専門の有料ソフトもいくつかあるようだ。

ただ、これらのソフトは高価であったり、使いこなすまでに苦労しそうなイメージがある。
もっと手軽に、地積測量図がPDFで手元にあるのだから、PDF上で出来ないか、と考えた。

要は、想定整形地であれば、評価対象土地を囲むように、ある一定の矩形を描ければ良いのだ。
Acrobat等のPDF編集ソフトで矩形を描く注釈機能はあるので、これを使えばと思うのだが、ひとつ問題が。

地積測量図上の評価対象土地は、必ずしも正面となる路線が真下にある、などの規則性がない。
つまり、矩形の角度が変えられないと意味が無いのだが、Acrobatその他のソフトでは矩形を回転させて任意の角度に描くという機能がなく、垂直にしか描けない。
AndroidのPDFアプリでそのような機能を持つものはあったのだが、PCで使用するソフトではちょっと見つけられなかった。

多角形の注釈ツールで任意の角度に四角形を描くことも可能ではあるが、角度が必ず直角になるとは限らないので正確性に欠けるし、逆に直角にしようと思うと垂直か45度(Shiftキーを押しながら)の角度しか描けない。


そこで「Acrobat(Std/Pro)」にある「ものさしツール(距離ツール)」
PDF上に描いた直線の距離を測定する機能である。


ちなみに、「Acrobat Reader」は無料だが、上記の「Acrobat(Std/Pro)」は有料のソフトで、決して安くはない。
無料のソフトだと「PDF-XChange Viewer」に同じ機能があるのでオススメ。




◆具体的な描き方


次の地積測量図はある地域の「地番504-19」のものであるが。
「504-19」はキレイな形の土地で面白くないので、「504-17」を評価対象土地と仮定する。

まず、大事なのは、測量図の縮尺を確認し、測定比率を設定すること!



今回の測量図は縮尺が「1/250」となっている。
距離ツールを選択したら画面の適当な箇所で右クリックすると「測定比率を変更」というメニューが出てくるので、今回は「1mm = 0.25m」に設定。



距離ツールで、正面路線に面した間口(次図のAB間)のAを基準とし、その延線を適当な箇所で止める。



いま引いた線の両端から垂線が出て、かつ、平行線上に矢印線とその線の長さが表示されるので、その平行線が次図のDに重なるまで引っ張る。



次に、最初に適当な箇所で止めていた部分を、線がCに重なるようにABの延線上でスライドさせる。



これで自由な角度に矩形(=想定整形地AEFG)が作成できる。


この作業だけで想定整形地を描くとともに、想定整形地の間口距離も測定できていることになる。


あとは距離ツールを使って、想定整形地の奥行距離を測る。



また、今回は、対象土地である「504-17」の地積は測量されておらず不明だ。
そこで、PDFの「面積ツール」を使って地積を求めることも出来る。
もちろん不整形地(対象土地)の間口距離(AB)も「距離ツール」で測る。



ABCDの4点を「面積ツール」で囲むと自動的に面積が計算される。
あくまでも概算だし、そもそも登記簿謄本に地積は記載されてるが。
登記上の地積は必ずしも正確ではなく、測量図上で地積を求めてみると登記上の地積と明らかに違うというケースもあるので一応測っておく。




◆地積測量図(PDF)の入手


地積測量図(紙)は、登記所に備え付けられているので、料金を払って手続きすれば入手することが出来る。(必ずしも全ての土地に測量図が備え付けられている訳ではないが)

で、イマドキは、測量図もオンラインで入手することが可能だ。

ひとつは、登記・供託オンライン申請システムというサイトを利用して、オンラインで測量図を申請(料金はネットバンク決済)し、紙の測量図を郵送してもらう方法。

もうひとつは、登記情報提供サービスというサイトを利用して、測量図をPDFファイルでダウンロード(料金はカード決済等)する方法だ。
登記情報提供サービスは、こちらの記事にも書いた通りかなり使いやすくなっているし、こちらの方がラクかと。

紙の測量図だと、スキャナーで取り込んでPDFファイルにするのだが、A3サイズの用紙なので、ScanSnap等であれば半分に折って両面スキャンという感じで、ややメンドクサイ。(しかも、ズレないように正確にやる必要があるし)


直接PDFファイルをダウンロードして使用する場合、ひとつ問題がある。
登記情報提供サービスのサイトを利用して入手した地積測量図等のPDFファイルは、パスワード保護されており、機能的に一部制限されている、ということ。
つまり、PDFファイル上で注釈などが追加できないようになっている。

よって、まずは編集が可能なPDFファイルを作成する必要がある。

印刷は可能なので、仮想PDFプリンタで「画像(イメージ)として印刷」する欄にチェックをすることにより、少しだけ不鮮明にはなるが、パスワード保護されていない(利用制限のない)PDFファイルを作成することが出来る。



仮想PDFプリンタは、なんでも良いのだが、例えばPrimoPDFとか、Bullzip PDF Printerとか、CubePDFあたりで良いかと。




CAD系のソフトや専用ソフトを使ったことがないのであまり比較も出来ないが。
今回の方法だと、専用ソフトでは自動化されている部分も手作業になったり、精度の点でやや甘かったり、ということはあるかも知れない。
が、いつもの使い慣れたソフト・ファイル形式でサクッと出来るという点では、まぁ、お手軽かな、と。

あ、ちなみに、今回の話はWindowsが前提で、Macは一切考慮していない。
Mac版のAcrobatに同じ機能があるのかどうか不明だし、代替のフリーツールも見つけられなかったので。




2012年8月17日金曜日

預金通帳をバラバラにしてみる、という発想


預金通帳をバラバラにする。

はぁ?・・・・・って感じだが・・・・・。

まぁ、ちょっと思い付きレベルの話。


本題に入る前にとりあえず。

法人でも個人でも、事業上の取引の多くは銀行の預金口座を通して行われる。
当然その取引履歴は会計ソフト等への入力によって会計帳簿に記録されることになる。

古くは、預金通帳を見ながら、預金出納帳などを作成したり振替伝票を起こしたりし、それらを元に会計帳簿へ転記していた。
その後、PC・会計ソフトの普及により、通帳から直接会計ソフトへ入力するように。
で、イマドキは、ネットバンクを利用していれば、最初からCSVデータで取得できるので、少し加工して会計ソフトに取り込む、という感じだろうか。

何らかの理由でネットバンクが利用できない場合、預金通帳をデータ化するか、通帳を元に会計ソフトへ直接入力必要がある。
預金口座の内容がデータ形式(CSV等)になっていると、直接会計ソフトへ入力するのに比べ、Excel上で加工できるので非常に効率的。

例えば、通帳に記載された摘要欄の内容毎にソート(データの並び替え)をかけて、同じ内容の取引を一気に処理してしまうとか。
あるいは、通帳に記載された摘要欄の内容をキーとして、登録された勘定科目を自動的に割り当てる、なんてことも。
また、会計帳簿の摘要欄に入力する内容も、Excelの一括置換機能を使ったり、やはり登録された摘要文を自動で割り当てたりとか。

だから、ネットバンク契約がなくても、なんとかこの預金通帳の内容をデータ化したい、と思うわけである。
一度ネットバンクのデータを加工して取り込むという作業を体験してしまったら、紙の通帳から直接会計ソフトへ入力(仕訳)するという作業は二度とやりたくなくなる。
そのために通帳のOCRによるデータ化などにもチャレンジしたりしてる。



で、本題。

今回は、「預金通帳の会計処理」ではなく「預金通帳のデータ化」を外注する、と仮定した場合の話。

「できれば自分で会計処理したい。でも自分で全部入力するのメンドクサイ。でも外注すると中身を見られるのでハズカシイ。でも自分でOCRもなんかメンドクサイ。あ〜、データにさえ、データにさえなっていれば・・・」ってケースを考えてみる。

そんな時に、通帳をバラバラにするのはどうだろうか・・・・と。

もちろん、通帳そのものをシュレッダーやハサミで切るということではない。
通帳をスキャンして、そのPDFファイルをバラバラにする、という意味だ。
下記ABCDはそれぞれ別のPDFファイルとなる。


このように、通帳を4つのファイルに分割し、たとえばそれを別々の外注先へデータを依頼する、とか。

この方法だと次のようなメリットが。
  1. 通帳の中身(個別の取引金額や残高、これらの時期など)を把握されずにデータ化できる。
  2. 外注先に残るデータが万が一流出してもダメージが少なく済む。
  3. 通帳を元に会計ソフトに入力するのに比べ、外注先に簿記会計の知識・教育が不要。
  4. 外注先に会計ソフトなどを用意する必要がない。
  5. データ化の処理も、日付なら日付、残高なら残高だけをひたすら処理すればテンキーだけでOK。
  6. ページ毎の通帳よりも、属性が限られた一列のみの通帳の方が、OCRの精度が上がるかも知れない。

逆に以下のような問題もあるか。
  1. 分割データを用意するのにちょっと手間。
  2. バラバラに外注してデータ化されたものを結合するのにちょっと手間。
  3. 外注先でデータが正しく入力できたかの検証がしづらい。
  4. バラバラに分割されたファイルのファイル名にひと工夫必要。

もちろん、ある特定の外注先に4つのファイルを同時にまとめて外注したら意味がない、というのは言うまでもないが。



先ほど「自分でやりたいけど中身見られるのがハズカシイ」というケースを想定したが。
会計事務所などが顧問先から依頼を受けた記帳業務の一部再委託などに利用できないか、というのが本来の目的。

もちろん、万が一流出しても取引内容が分からないから、というだけですぐに再委託がOKになるものでもない。
が、取引内容が分からず、万が一流出してもダメージの少ないこのような方法なら、顧問先の理解・承諾は格段に得やすくなるのではないだろうか。

以前、顧問先に無断で再委託、しかも中国にある会計センターへ丸投げし、問題となっているケースをネット上で見かけたが。
会計事務所の立場とすれば、事前の承諾を得るか、そもそもその再委託先と顧問先の直接契約としてもらうか、などの対応をすべきだろう。


まだまだ思い付きレベルで、難しい部分もありそうだが。
とりあえず、ファイルをバラバラにするという作業は簡単に出来る。
その方法や注意点などの解説をまた後日にでも。


P.S
通帳のスキャンならScanSnap S1100がオススメ




2012年8月16日木曜日

預金通帳のOCR読取後のExcelデータ加工

こちらの記事を始め、その後も数回にわたって解説している、預金通帳のOCR読み取り。
最終的にはその読み取ったデータを会計ソフトにインポートするのであるが。
そのままインポートできるわけではなく、ある程度Excel上で加工が必要だ。


OCRソフトで読み取ったデータをそのままExcel上に取り込むと、上記図の通り、ひとつの列に数値(金額)と文字列(摘要)が混在することになる。
預金通帳は、その限られたスペースを有効に使うため、引出欄または預入欄にその金額が印字されるだけでなく、空いたスペースに取引の内容を示す摘要が印字されるからだ。
このままでは扱いが難しいので、これを数値と文字列に分ける必要がある。

また、OCRで読み取ったデータは100%合ってるとは限らない。
基本的には数値(金額)重視でOCRをかけているのだが、それでも誤認識は避けられない。
数値が違ったまま会計ソフトにインポートするというのは致命的であり、Excel上でしっかりと合わせておかなければならない。
そのための検証・修正作業も必要になってくる。

もちろん数値以外の日付や摘要も確認・修正が必要なのだが、そちらについては今回はとりあえず説明を省略する。


◆数値と文字列を分ける

これを分けるためには、Excelの「T関数」というものを使う。

詳しい解説は上記リンク先にあるが、要は「参照セルが、文字列だったらそのまま、文字列以外(数値等)なら空白」となる関数のようだ。
文字列か否かを判定してくれるので、後は「IF関数」を組み合わせて、これらのデータをしっかりと分ける。


先ほどのT関数とIF関数を使い「参照セル(C2)が文字列以外ならその数値、そうでないならゼロ」という算式を入れ、後はその式を下にドラッグコピーすれば良い。

もちろん預入欄も同様である。

そして、摘要欄も同じような感じで抽出する。


ちなみに、「残高2」の欄は次の検証のために設けた列である。



◆読み取った数値の検証

検証作業といっても大したことをする訳ではない。
「通帳の残高欄をOCR読み取りした数値」と「引出欄・預入欄の数値から計算される残高」、これが合っているかどうかを確認するだけだ。

元の通帳がこちら。


こちらがOCR結果をExcelに貼付け加工・検証したもの。

①は、通帳の「,(カンマ)」を「9」と認識してしまった結果、「1,000円」「1,100円」がそれぞれ「19,000円」「19,100円」となってしまったケース

②は、通帳の正しい残高が「29,328円」のところ、「293,281円」と末尾に余計な「1」がついてしまったケース

③は、①と同様に「,」を「9」と認識してしまったため、「4,702円」が「49,702円」となったケース

④は、「0(ゼロ)」を「9」と認識してしまい、「20,000円」が「29,000円」となったケース

⑤は、通帳残高が「89,502円」のところ、頭の「8」が認識されず、「9,502円」となったケース


このように、残高欄の数値がOCRで誤認識されていたり、引出欄・預入欄の数値が誤認識されていれば、検証欄がゼロにならない。
これを元に、該当箇所を原資料と突合して必要な修正をし、検証欄が全てゼロとなるようにする。

上記の例では、かなり古い通帳(20年以上前の三井銀行)であり、OCRソフトの辞書もまっさらなものを使っているため認識精度がイマイチだが、ちゃんと設定すれば修正が必要な箇所はそれほど多くはならないはず。



慣れてきたら、いちいち算式を入力してコピーしなくても、マクロを使って少しは楽に出来るかも。

ただ、金融機関によって通帳のレイアウトは異なる。
残高欄が毎行記載されず、同日の取引の最終行のみ記載されるものや、通帳に「摘要欄」などがさらに別途設けられているものなど。
そのような場合には上記で紹介した算式も少し工夫が必要である。

ま、とにかく、これでようやく扱いやすいデータとなる。




2012年7月27日金曜日

中華タブレット+USBミニ扇風機


本当のところはどうなのか知らないが。
電力不足だ、計画停電だ、って話がある以上、出来る範囲で節電してみようかと。
てな訳でこの夏は基本的に事務所のエアコンはつけず、扇風機でしのぐ予定。
あくまでも予定だが。


ということで、少し前に卓上のUSB扇風機を購入して使っている。



・・・・これが意外といい感じ。

音も思ったよりも静か。
もちろん扇風機だけだとツライので、アイスノンや半裸(上半身裸)を併用してではあるが、「この夏、乗りきれるんじゃね?」と思い始めている。

ただ、買ったあとに気付いたのだが、首振り機能はない。
こっちにしておけばよかったような気もしている。





で、ここからが本題だが。

書籍をPDF化して中華タブレットで読む、というのが今の私の読書スタイル。
その場所は主にトイレの中が多い。
で、そのトイレの中が死ぬほど暑い。
堪りかねてある日卓上の扇風機をトイレに持ち込んでみた。
USB式なので中華タブレットに挿して使うことが出来る。

・・・・これがまたいい感じ。

ただ、いくら卓上タイプでさほど大きくないとはいえ、毎度持ち運ぶのはやや不便というかメンドクサイ。
クリップ式で挟めるのだがトイレ内に適当な箇所がなく、といってタブレット端末につけると重すぎるし邪魔。
また、屋内ならまだしも、さすがに外に持ち歩くのはちょっと無理。


ならばもっと小さいやつを、ということでこちらを買ってみた。



・・・・エエやん。

さすがに「あ~、超涼しい~」とまではいかないが。
羽はやわらか素材でできてるので稼働中に触っても問題なし。
風量は卓上タイプに比べればあれだが、まぁなんとか。
音は、多少「ブィィィ~ン」という音がするがこれも我慢できる範囲。
ちなみに、Amazonレビューで「プロペラを外してモーターの軸にクレ556的な潤滑油を注すとほとんど音がしなくなる」と書いてあったので試そうと思ったが、羽の外し方が分からず・・・。
とりあえず軸の見えてる部分にクレ556を注してみたが、全く効果はなかった。

サイズ的にはちょうどいい感じだし、外に持ち歩くのも一応アリかな、と。
収納ケースもついてることだし。


そんな訳で、ビバ!モバイル扇風機!!


P.S
そういえば子どもが乾電池で動く手のひらサイズの扇風機持ってたのを思い出した。
わざわざ買わなくてもそれで良かったんじゃ・・・・・。
という気がしないでもないが、忘れることにする。

P.S
そういえば、トイレの次に多いのが移動中の電車内での読書。
でも、電車の中って涼しいし、場合によってはむしろ寒いくらい。
わざわざ扇風機を持ち歩く必要があるんだろうか・・・・・。
という気がしないでもないが、忘れることにする。


2012年7月24日火曜日

タックスアンサーが更新されてた・・・。

以前こちらの記事にもした「30万円未満の少額減価償却資産特例」の解説ページをを含む、国税庁タックスアンサーのページが更新されている。

昨年暮れの税制改正大綱公表から年明けの改正法案提出、そのタイミングでタックスアンサーのページを書き換えることはもちろんあり得ないが。
3月末の改正法案成立後もしばらく当該サイトは古い情報のままとなっていた。
上記のいずれかのタイミングで「延長の可能性がある」など何らかのアナウンスがあると親切かなとは思うが、現実的にはなかなか厳しいのだろう。

が、6月(7月)になり、ようやくタックスアンサーの各ページも「平成24年4月1日現在法令等」をベースとした内容に更新された模様だ。

(法人)


(個人)

もちろん上記以外のページも更新されている。(はず)

ちなみに、上記の画像で表示されている「07/18/2012」や「06/29/2012」という日付は、サイトが更新された日時を表している。
そのような機能を持つブックマークレットを利用して表示させているだけなので、本当に正確な更新日時なのかは何とも言えないが・・・。


なにはともあれ、これで一安心、と・・・・・。

2012年7月20日金曜日

預金通帳のOCR読取精度を上げるコツ(濁点半濁点)



預金通帳をOCRで読み取ってデータ化するにあたり、濁点や半濁点は認識結果が悪くなる原因のひとつ。
冒頭画像でもあるように、濁点半濁点は元の文字とはやや離れ気味に印字される。
ちなみに上記は三菱東京UFJ銀行の通帳だが、他の金融機関の通帳でも同じような傾向かと。


上記のような通帳をOCRソフト(辞書登録がない状態)にかけると、「シ」と「’」や、「ホ」と「●」など別々の文字等として認識されることが多い。
それでは困るので別々に認識されたものをひとつに結合したうえで「ジ」とか「ポ」として辞書登録する、という作業に当初は励んでいた。


が、それでも相変わらず別のキャラクターとして認識されたりすることも多く。
「ポ(Po)」と「ボ(Bo)」が登録されているとただの「ホ(Ho)」の認識の時でも「ポ(Po)」や「ボ(Bo)」となることも多くなる。


結局、2文字と認識されたものを1文字としてどんなに頑張って辞書に登録しても、やはり無理があるっぽい。
ならば、濁点半濁点は分けて辞書登録してしまおう、と。
つまり、「シ」と「゛」、「ホ」と「゜」という感じで「゛」と「゜」を単独の文字として辞書登録する。
当然認識結果は「シ゛」「ホ゜」となり「ジ」「ポ」とはならない。
でも、これでいったんOKとする。
とは言うものの、そのままだと当然扱いにくい。
なので、後はExcelに任せることにする。


そもそも濁点半濁点がつく文字というのは限られている。
が ぎ ぐ げ ご ざ じ ず ぜ ぞ だ ぢ づ で ど ば び ぶ べ ぼ ガ ギ グ ゲ ゴ ザ ジ ズ ゼ ゾ ダ ヂ ヅ デ ド バ ビ ブ ベ ボ ぱ ぴ ぷ ぺ ぽ パ ピ プ ペ ポ ヴ
これらをExcelの置換機能で「か゛」→「が」のように置換してしまえばよい。
通常の置換だと1パターンずつしか出来ないので、そこはマクロで一気に。
みるみる文字が置き換わっていくのは実に快感。


2012年6月15日金曜日

Google検索の期間を自由にカスタマイズした検索エンジンを登録して幸せになる

毎日たいへんお世話になっているGoogle先生。
皆様におかれましても同様かと。

ご承知の通りGoogle検索では検索期間の絞り込みが可能。
検索し終わった後に左側に出るやつ。
(出てなければ「もっとツールを見る」を押すと出てくる)
検索する前に「検索オプション」でも設定できるが。
いちいち面倒なので普通に検索し終わった後に絞り込むことが多いのでは。

で、期間指定の選択肢は
  • 期間指定なし
  • 1時間以内
  • 24時間以内
  • 1週間以内
  • 1か月以内
  • 1年以内
  • 期間を指定
となっている。

世界中で日々刻々と膨大な情報が更新される。
できれば古い情報に惑わされたくない。
ってことで、検索期間を「1年以内」とするケースも少なくないのでは。
むしろ「もうデフォルトを1年以内にして欲しい」なんて人もいるのでは。
こんなChrome拡張機能(ato-ichinen)もあるようだし。


で、今回私が言いたいのは・・・・

「本当にそれで満足ですか?」
「1年でいいんですか?」
「2年じゃダメなんですか?」
「もっと自由に生きたいと思いませんか?」
「いまアナタは幸せですか?」
 
ってことで。


つ、つまり、もっと検索期間の設定を自由にカスタマイズしたいなって・・・。
いや、もちろん「期間を指定」というオプションで「開始日」と「終了日」を入力すれば自由に出来るんだけど。
それだと毎回設定するのがメンドクサイ。
例えば、「2年以内」とか「3年以内」あるいは「6ヶ月以内」とかでサクッと検索したい、というシーンは結構ある。
少なくとも自分の場合は。

そこで、またGoogle先生のお世話になることに。
すると、こちらのサイトに辿り着いた。
BingとGoogleの検索時に期間の絞込みをするクエリーストリング - kanonjiの日記

ハイ、ハイ、ハイ。
ここね、ここをイジればいいのね!


例えば適当に検索して「1年以内」とすると、アドレスはこのようになる。



この「~&tbs=qdr:y~」という部分を「~&tbs=qdr:y2~」とすると検索結果が2年以内のものとなる。



「~&tbs=qdr:y3~」とすれば3年以内だし。
「~&tbs=qdr:m6~」とすれば6ヶ月以内っと。


ただ、これもちょっとメンドクサイ。
「期間を指定」オプションよりはラクだが毎回変更しなきゃいけいないし。
アドレスから該当部分を探すのも面倒。
決められた期間以外の期間を使うことが多い、あるいはデフォルトにしたければ、そのエンジンをブラウザに登録してしまおう。

おなじみGoogleのトップページ。



ま、ここから検索をすることが個人的にはほとんどないんだけど。
Chromeでこのページを開いて検索ボックスを右クリックすると「検索エンジンとして追加」というのができる。





この画面で検索エンジンのURLを確認すると以下の通り。
https://www.google.co.jp/search?hl=ja&newwindow=1&safe=off&output=search&sclient=psy-ab&q=%s&btnG=&oq=&aq=&aqi=&aql=&gs_l=&pbx=1
このアドレスの中に先ほどの「&tbs=qdr:y2」などを挿入した検索エンジンを登録すれば良い。
アドレスのどこに挿入したらいいのかいまいち良く分からないが、適当に
「~&newwindow=1」と「&safe=off&output=search~」の間
あたりに入れてみた。
https://www.google.co.jp/search?hl=ja&newwindow=1&tbs=qdr:y2&safe=off&output=search&sclient=psy-ab&q=%s&btnG=&oq=&aq=&aqi=&aql=&gs_l=&pbx=1


この検索エンジンをブラウザに登録してデフォルトエンジンとしても良いが。


できればいくつか作っておいて検索の時に選ぶような形が個人的には望ましいので、またChromeの拡張機能(Context Menu Search)を使う。

で、登録後はこんな感じになる。




うん、幸せ・・・・。


2012年6月10日日曜日

フレーズ検索で税務通達・質疑応答事例等カスタム検索がさらに便利に!

本題に入る前に、まず「フレーズ検索」とは何か?という確認から。
その他の検索のヘルプ - ウェブ検索 ヘルプ
フレーズ検索("")
語句を二重引用符("")で囲むと、その語句をまったく変更せずに、そのままの語順で完全に一致する語句が検索されます。既に Google では語順や、複数の単語がまとまって強力なキーワードになることを考慮しており、特に理由がない限りこの検索基準を外れることはありません。したがって、通常は引用符を使用する必要はありません。フレーズ検索では、適切な検索結果が表示されない場合もあります。たとえば、 「"アレクサンダー ベル"」 (引用符付き)で検索すると、「アレクサンダー G. ベル」に関するページは検索結果に表示されません。
何と言うか「Googleクン、余計な気は遣わんでいいから私の言った通りに調べてくれ!」って感じの検索。
まぁ通常の検索においてもしばしば使われる定番の検索テクニックかと。


で、ここからが本題。

以前、税務通達や質疑応答事例などの検索について税目毎に検索できる「カスタム検索」を紹介する記事を書いた。
Blog the Minor: Googleカスタム検索を利用して国税庁サイトの通達や質疑応答などを税目毎に検索

Blog the Minor: 税務通達・質疑応答事例等カスタム検索の便利な使い方

Blog the Minor: 税務通達・質疑応答事例等カスタム検索の便利な使い方(Firefox編)

で、二番目の記事の中で次のように書いた部分がある。
なお、通達番号で検索すると基本的には一番上にズバリのページがヒットする感じだけど、番号が全角だとムリっぽい。
その場合は再度半角で入力し直すか、ダブルクオーテーション(「””」)でくくるとOKだがちょいメンドクサイ。
なので、メール等のやり取りでは普段から通達番号は半角で入力して欲しいとつくづく思う。 ただのワガママだけど・・・。

これをもう少し解説すると以下の通り。



このように、キーワードではなく通達番号などで検索する場合、その数字が「全角」で入力されると検索結果がイマイチになる。
結局、上記の例で言うと「1」と「2」と「3」という数字が入ってればその順番が違っていても検索結果として表示されてしまう感じ。


そこで、数字やハイフンを「半角」にすると、検索結果がかなり絞りこまれ、お目当ての通達がズバリ載っているページが検索結果の上位に表示されるようになる。



仮に数字等が全角であっても、それをダブルクオーテーション(「””」)でくくる(=フレーズ検索)と、半角の場合と同様の検索結果となる。





上記の通り、通達番号などで検索する場合は効果は歴然だし、キーワード検索でも利用シーンを考えればフレーズ検索をデフォルトとした方が良いような気もする。

ということで、その方法を考えてみた。

結論としては、Chromeの拡張機能であるContext Menu Searchであればそれが出来るように。

Context Menu Searchのオプション画面で設定が一括インポートできる。



この部分をいったんすべて削除し、以下をコピペするとこの拡張を使ったカスタム検索はすべてフレーズ検索がデフォルトとなる。
[["-1","法人税関係通達検索 ","http://www.google.com/cse?cx=000841340855942113389%3Aznyvzfkxq3i&ie=UTF-8&q=\"%s\"&sa=%E6%A4%9C%E7%B4%A2&siteurl=www.google.com%2Fcse%2Fhome%3Fcx%3D000841340855942113389%3Aznyvzfkxq3i&ref=www.google.com",true],["-1","法人税質疑応答事例等検索 ","http://www.google.com/cse?cx=000841340855942113389%3Ahx9uox_0xlo&ie=UTF-8&q=\"%s\"&sa=%E6%A4%9C%E7%B4%A2&siteurl=www.google.com%2Fcse%2Fhome%3Fcx%3D000841340855942113389%3Ahx9uox_0xlo&ref=www.google.com",true],["-1","消費税関係通達検索 ","http://www.google.com/cse?cx=000841340855942113389%3Axuolgxuex7u&ie=UTF-8&q=\"%s\"&sa=%E6%A4%9C%E7%B4%A2&siteurl=www.google.com%2Fcse%2Fhome%3Fcx%3D000841340855942113389%3Axuolgxuex7u&ref=www.google.com",true],["-1","消費税質疑応答事例等検索","http://www.google.com/cse?cx=000841340855942113389%3Acfzpthdrixe&ie=UTF-8&q=\"%s\"&sa=%E6%A4%9C%E7%B4%A2&siteurl=www.google.com%2Fcse%2Fhome%3Fcx%3D000841340855942113389%3Acfzpthdrixe&ref=www.google.com",true],["-1","所得税関係通達検索 ","http://www.google.com/cse?cx=000841340855942113389%3Airgdysiaqek&ie=UTF-8&q=\"%s\"&sa=%E6%A4%9C%E7%B4%A2&siteurl=www.google.com%2Fcse%2Fhome%3Fcx%3D000841340855942113389%3Airgdysiaqek&ref=www.google.com",true],["-1","所得税質疑応答事例等検索 ","http://www.google.com/cse?cx=000841340855942113389%3Acpfuk5qyxrm&ie=UTF-8&q=\"%s\"&sa=%E6%A4%9C%E7%B4%A2&siteurl=www.google.com%2Fcse%2Fhome%3Fcx%3D000841340855942113389%3Acpfuk5qyxrm&ref=www.google.com",true],["-1","相続税関係通達検索 ","http://www.google.com/cse?cx=000841340855942113389%3Ajhmjo4n866m&ie=UTF-8&q=\"%s\"&sa=%E6%A4%9C%E7%B4%A2&siteurl=www.google.com%2Fcse%2Fhome%3Fcx%3D000841340855942113389%3Ajhmjo4n866m&ref=www.google.com",true],["-1","相続税財産評価関係通達検索 ","http://www.google.com/cse?cx=000841340855942113389%3Ahbi4qxkpkgo&ie=UTF-8&q=\"%s\"&sa=%E6%A4%9C%E7%B4%A2&siteurl=www.google.com%2Fcse%2Fhome%3Fcx%3D000841340855942113389%3Ahbi4qxkpkgo&ref=www.google.com",true],["-1","相続税質疑応答事例等検索 ","http://www.google.com/cse?cx=000841340855942113389%3A9zfcctogltg&ie=UTF-8&q=\"%s\"&sa=%E6%A4%9C%E7%B4%A2&siteurl=www.google.com%2Fcse%2Fhome%3Fcx%3D000841340855942113389%3A9zfcctogltg&ref=www.google.com",true],["-1","耐用年数取扱通達","http://www.google.com/cse?cx=000841340855942113389%3Akxcip-f1bxq&ie=UTF-8&q=\"%s\"&sa=%E6%A4%9C%E7%B4%A2&siteurl=www.google.com%2Fcse%2Fhome%3Fcx%3D000841340855942113389%3Akxcip-f1bxq&ref=www.google.com",true]]
ま、要は「~&q=%s&~」の部分を「"(\")」で囲んで「&q=\"%s\"&」としただけなんだけど。

これでデフォルトがフレーズ検索になるわけだが。
検索結果によっては通常検索も確認したい時もある。
その場合、前か後ろ、どちらかの「”」を削るだけで通常検索となる。
(残りの「”」は無視される。)
つまり、通常検索からフレーズ検索にする時は「”」を2個(前と後ろ)に足さなきゃいけないけど、フレーズ検索から通常検索にする時は1個だけ削ればいいので、ほんの少しだけラク・・・ま、いいか、それは。


とりあえず今回は以上。
このやり方は何か別のシーンでも応用が効きそうなので、何か思いついたらまた。


2012年6月6日水曜日

税務通達・質疑応答事例等カスタム検索の便利な使い方(Firefox編)

以前こちらの記事(Blog the Minor: 税務通達・質疑応答事例等カスタム検索の便利な使い方)でChromeの拡張機能を使った方法を解説したが、今回はFirefox編。

使うのはこの2つのアドオン。
Add to Search Bar :: Add-ons for Firefox
Context Search X :: Add-ons for Firefox

こちらのページを開いて、カスタム検索エンジンを登録していく。

Firefoxに「Add to Search Bar」というアドオンを入れると、好きな検索エンジンが右クリックから簡単に登録できる。





登録の際に検索エンジンの名前がブログのページタイトルになってしまうので、適宜変更する。



最初に「法人税質疑応答事例等検索」などの文字をコピーしておいて貼り付ければよいかも。



登録し終わったら後は使うだけ。
「Context Search X」が入っていると選択ワードを右クリックして好きなエンジンが選択できる。



ちなみに、私の顔のアイコンが並んでキモチワルイという方はもちろん変更してくれて構わ・・・ない・・・。



上の画像で、並んだ検索エンジンの一番下にある「Manage Engines(M)」をクリックすると、検索エンジンの管理画面が開く。



ここで並び替えをしたり、最初から入っている余計なエンジンを削除すればよい。


以上。

ちなみに、Firefoxはすっかり使わなくなってしまった。
バージョンによってアドオンが対応してたりしてなかったりというあたりは全然確認していないのであしからず・・・。


あ、IE(Internet Explorer)?・・・・・・シラネ。