マークシートのOCRとは?光学的に文字を読み取る紙のこと

管理人の紙コンサルこと、べぎやすです。

今回は、マークシートのOCRについて。

管理人が学生のときは大学入試は
共通一次試験というやつでした。

当時マークシート試験が導入されて
これでいいのかという議論がありました。

しかし、現実には膨大な受験生に
評価をつけてさばく方法としては

とても便利で効率的な方法には
違いないんですよね。

だからこの方法自体は今後も
変わらず採用されるんでしょう。

そんな共通一次試験、
今はセンター試験になってますね。

受験は社会の反映なので
その時代で色んな形式で試験されますが

結局できる人が受かって
そうでない人が落ちる。

運の善し悪しはある程度ありますが
大雑把にはそんなもんだと思います。

管理人は以前働いていた会社で
色々な取引先の人とお愛しましたが、

いい大学出てる人はハズレが少ない
というのは痛切に感じました。

性格がどうこうというのはあったとしても
それなりに仕事をこなすという点では、

残念ながら明確に優劣があって
一流企業が一流大学の人を

採用するのは当然だなと
思ったものです。

ただこれはサラリーマンとしてのことで
独立して自営業やってる人はまた違いますが。

それでそんなマークシートごときに
評価されてたまるかと思うんですが、

そこにその人の要領の良さとか運とか
社会への適応力とかがやっぱり出る。

本当に受験は大変だと思います。

そんな受験に使われるOCR用紙とは
どんなものなのでしょうか?

ということで。

この記事では、マークシートのOCR用紙の
紙の品質や読み取りの仕組みについて

管理人なりに調べたことを
お伝えしたいと思います。

スポンサーリンク

マークシートのOCR用紙の仕組み

マークシートのOCR用紙なんですが。

OCRはOptical Character Readerの略。

光学的文字読み取り装置という意味になります。

読み取り方式はいくつかあるようで
管理人が調べた感じでは

紙のマークをそのまま読むものと
一旦スキャンしてそのデータを
解析するものがあるようです。

管理人がイメージしていたのは
紙のマークをそのまま読む方。

大量の解答用紙をさばくには
こちらが有利なんだそうです。

スキャンしてから解析となると
その時間がかかりますからね。

それで、OCRは光学的ということなので
光で読み取ることになるんですが、

使われている光は近赤外線で
鉛筆の炭素(黒鉛)を読むんだそうです。

具体的には近赤外線(波長940nm)の光を
紙に当ててそこを吸収するかどうかを読む。

黒鉛の場合は940nmの光を吸収する。

他の部分は940nmの光を反射する。

イメージで言うと黒鉛部分は
光を吸収するから黒くなり、

その他の部分は光を反射するから
白くなるという感じ。

このコントラストを機械で読み取って
正誤判定をするわけです。

光として近赤外の波長940nmを使うのは
試験では通常鉛筆が使われるから。

可視光線の波長を使うことも出来ますが
それだと読み取らなくても良い印刷部分まで

読んでしまうかもしれないのでわざと人間の
目には見えない近赤外を使うようです。

だから通常はボールペンはだめ。

正確に読み取るには黒鉛(炭素)が
必要ということですね。

なお可視光の波長660nm(赤色)にすれば
ボールペンでも読み取ることが出来るんだとか。

ただし、教育現場と考えたら書いたり消したりする
鉛筆がほとんどですから鉛筆用なんだそうです。

これなら印刷部分を誤読ということもないですね。

あと、読み取り方も単純に、
有るか無いか、「0」か「1」ではなく、

誤読を避けるために濃淡を16段階に
分けて読み取るそうです。

手で擦れて汚れた程度なのか
はっきり線を書いたのか

そういう違いが濃淡で判別できる
というわけですね。

マークシートのOCR用の紙について

ここまでお話してきたように
マークシートの読み取り装置は

相当高度なレベルなんですが、
紙もかなり要求が厳しいです。

まずはゴミや異物はNG。

いくら近赤外線で濃淡まで
読み取るといっても

紙にゴミがあったり異物や
汚れがあったらダメですよね。

結構小さな黒点でもダメで
欠陥検出も厳しいです。

実はこういう欠陥はパルプの段階から
キレイでないとダメなんですよね。

管理人の感覚としては
大きめの異物はパルプを流送する工程の

スクリーンやクリーナーである程度とれても
小さな異物を除くのは難しいと思っています。

だからパルプの段階から厳選して
ゴミやチリが少ないものを使う。

大量生産には向かない紙なんですね。

管理人は元製紙会社社員ですが
その会社ではちょっと無理な紙でした。

それから、紙の品質的には
搬送性が重要です。

大量の紙をあっという間に読むわけで
そこで紙が詰まったらシャレにならない。

重送で2枚重なるのもダメ。

だからカールしないとか、伸びないとか
そういう寸法安定性が重要だし

重送しないために、米坪、紙厚、剛度、平滑性、
摩擦抵抗なども管理されているんですね。

当然ながら高速化されるほど
こういう管理がシビアになるということです。

スポンサーリンク

管理人のまとめ

今回は、マークシートの
OCRについてのお話でした。

OCRはOptical Character Readerの略。

光学的文字読み取り装置ですね。

光学的なんですが使う光は黒鉛が反応する
近赤外(波長940nm)が多いそうです。

それから紙に対する品質要求も厳しい。

ゴミや異物はダメだし、
搬送トラブルにならないように

紙の米坪、紙厚、剛度、平滑、摩擦抵抗
なども管理しないといけない。

とはいえ、この紙はもしかすると
一生を左右するかもしれませんから

そのくらい品質的に厳しくて
良いんだと思います。

この記事でマークシートのOCRの
仕組みが理解できればうれしいです。

入学試験がんばって下さいね!

スポンサーリンク
スポンサーリンク

シェアする

  • このエントリーをはてなブックマークに追加

フォローする