Image
Recognition

画像認識技術






スマートキャプチャー

クラウド名刺管理サービス「Sansan」や名刺アプリ「Eight」で撮影された名刺画像は、読み取りの精度を高く保つために、人と機械によってデータ化されています。それに対して、スマートキャプチャーの技術は機械のみでデータ化をすることによって、撮影されてから数秒でその結果をユーザーに届けることを可能にする技術です。この技術によって、ユーザーは撮影後すぐにデータを参照することができます。また、名刺交換をした相手がEightのユーザーであった場合には、即座にEight上でつながることなども可能になります。なお、撮影された名刺画像は、その後に本来のデータ化フローを通ることで人と機械によって改めてデータ化され、より正確な情報としてユーザーに納品されます。また、差分が発生していた場合には、情報がアップデートされます。

項目セグメンテーション

名刺画像から姓名、会社名、住所、電話番号、メールアドレスなどの項目が記載された領域を推定する技術です。文字を読み取ってから項目を推定するのではなく、文字を読み取らずに名刺のデザインから項目を直接見分けます。そのため、言語によらない項目判定が可能です。この技術では、深層学習を用いたセグメンテーションのアルゴリズムを用いています。

言語処理判定

名刺に書かれた主要項目(姓名、会社名、住所など)について言語を推定する技術です。名刺のデータ化工程における初期の段階で推定を行い、後工程である言語ごとに異なる入力フローの最適な選択に役立てています。ここでは、OCRで文字を読み取ることをせずに、名刺画像全体から深層学習によって大まかに言語を判定します。そのため、OCRよりも数十倍速い処理が可能となり、読みにくい文字があったとしても判定することが可能です。名刺の情報については、複数言語で併記されている場合もあるため、マルチラベル問題として扱っています。

ミステイクディテクター

名刺のデータ化において発生した誤りの傾向を学習し、ミスが発生している可能性のある名刺をあらかじめ予見します。この技術により、オペレーターは効率的に最終チェックを行うことが可能になります。

JOIN 
US

SHARE THIS PAGE

Data Strategy &
Operation Center

〒107-0061 東京都港区北青山3-5-29
One表参道 6F

加盟団体

© Sansan, Inc.

SCROLL