Image
Recognition

画像認識技術






DSOC OCR

DSOC OCRは、DSOCが独自に開発した名刺の取り込みに特化したOCR(光学文字認識)エンジンです。2020年11月の発表時点で「Eメールアドレス」と「氏名」に対応し、Eメールアドレスに関しては99.7%の精度でデータ化します。これまでに培ってきたデータ化のノウハウを最新の文字列検出・文字認識技術に適応し、名刺に特化した学習を行うことで、汎用OCRでは達しなかった精度を実現しました。また、0.3秒の即時デジタル化にも対応し、高速処理も可能にしています。
DSOCでは、現在においてもデータ化に人が関わることで高精度なデータ化を可能にしていますが、さらなる改善を行うことで人の能力を超えた精度を目指して、DSOC OCRの自社開発を進めています。

ホワイトニング

人間は、照明条件が変化しても背景情報などを頼りにして正しく色を認識することができます。しかし、背景から切り出された名刺画像のみが画面に表示されると、正しく色を認識できなくなり、結果的に視認性の低下を引き起こします。
色が塗られている名刺や写真が入っている名刺などを対象にしたホワイトニングは、通常の画像処理技術が苦手とする領域です。一方で、DSOCが開発したホワイトニング技術は、深層学習による画像変換技術を応用して、データ化の精度や工程などに影響が出ない工夫を施し、名刺画像に含まれる影や照明色の除去・文字の強調を行うことで、サービスのユーザーおよびデータ化に携わるオペレーターが確認する名刺画像の視認性を向上させています。

スマートキャプチャー

クラウド名刺管理サービス「Sansan」や名刺アプリ「Eight」で撮影された名刺画像は、読み取りの精度を高く保つために、人と機械によってデータ化されています。それに対して、スマートキャプチャーの技術は機械のみでデータ化をすることによって、撮影されてから数秒でその結果をユーザーに届けることを可能にする技術です。この技術によって、ユーザーは撮影後すぐにデータを参照することができます。また、名刺交換をした相手がEightのユーザーであった場合には、即座にEight上でつながることなども可能になります。なお、撮影された名刺画像は、その後に本来のデータ化フローを通ることで人と機械によって改めてデータ化され、より正確な情報としてユーザーに納品されます。また、差分が発生していた場合には、情報がアップデートされます。

項目セグメンテーション

名刺画像から姓名、会社名、住所、電話番号、メールアドレスなどの項目が記載された領域を推定する技術です。文字を読み取ってから項目を推定するのではなく、文字を読み取らずに名刺のデザインから項目を直接見分けます。そのため、言語によらない項目判定が可能です。この技術では、深層学習を用いたセグメンテーションのアルゴリズムを用いています。

言語判定

名刺に書かれた主要項目(姓名、会社名、住所など)について言語を推定する技術です。名刺のデータ化工程における初期の段階で推定を行い、後工程である言語ごとに異なる入力フローの最適な選択に役立てています。ここでは、OCRで文字を読み取ることをせずに、名刺画像全体から深層学習によって大まかに言語を判定します。そのため、OCRよりも数十倍速い処理が可能となり、読みにくい文字があったとしても判定することが可能です。名刺の情報については、複数言語で併記されている場合もあるため、マルチラベル問題として扱っています。

ミステイクディテクター

名刺のデータ化において発生した誤りの傾向を学習し、ミスが発生している可能性のある名刺をあらかじめ予見します。この技術により、オペレーターは効率的に最終チェックを行うことが可能になります。

SCROLL