Sansanは、経済産業省と国立研究開発法人新エネルギー・産業技術総合開発機構(以下、NEDO)が実施する、国内における生成AIの開発力強化を目的としたプロジェクト「GENIAC(Generative AI Accelerator Challenge)」(※)の第3期公募において、提案を行った事業「視覚接地した文書特化型視覚言語基盤モデルの構築」が助成対象として採択されたことを発表した。
※GENIAC(Generative AI Accelerator Challenge):主に生成AIのコア技術である基盤モデルの開発に対する計算資源の提供や、データやAIの利活用に向けた実証調査の支援等を実施するプロジェクト。 計算資源の提供としては2024年2月から第1期が、2024年10月から第2期の開発支援が行われている

採択の背景
Sansanは、提供するDXサービスにおける名刺や請求書、契約書のデータ化を行うOCRシステムや生成AIをすべて自社開発し、各プロダクトに実装している。データ化する文書は、ビジネスシーンで活用するという特性上、限りなく100%に近い精度でデータ化する必要があり、創業以来社内の体制を強化し研究開発を続けてきた。
現在は文書画像からの情報抽出に特化した社内基盤モデル「Viola」を実装しているが、新たに開発に取り組んでいる視覚接地機能を備えたモデル「Cello」では、さまざまな文書からテキスト情報とその位置情報を同時に抽出することが可能になる。
これにより、既存のOCRシステムやデータ入力プロセスとのスムーズな統合が実現し、データ処理速度と信頼性の向上を見込んでいる。
今回のGENIACへの提案では、Celloの構築とプロダクトへの実装が、同社の事業へのインパクトのみならず、日本全体の生成AIの社会実装およびDX化を進めて行く契機と成り得るという点で評価された。
Sansanでは、2025年の年間テーマとして「AIファースト」を掲げており、非連続な事業成長を目的としたAI活用を全社で推進している。今回の採択により、事前学習やファインチューニングモデル(※)の作成にかかるサーバー費用の助成を受け、Celloの開発を加速させ、早期にプロダクトに実装することを目指す。また、開発におけるノウハウの共有や論文発表などを通じ、国内の生成AI開発力の強化にも貢献していく。
※すでに学習済みのモデルの一部または全部を再学習し、特定のタスクやデータセットに合わせて調整する手法
採択の概要
公募事業名:ポスト5G情報通信システム基盤強化研究開発事業/競争力ある生成AI基盤モデルの開発(GENIAC)
提案名:視覚接地した文書特化型視覚言語基盤モデルの開発
提案概要:Sansanでは、内製した生成AI Violaを活用した文書情報抽出において実績を有しているが、抽出結果に空間的情報が含まれないため、補正処理においては従来どおりOCRやレイアウト分析などを併用する必要があった。そこで本事業では、Violaに空間的情報(バウンディングボックスなど)を出力する機能を付加したCelloの開発に取り組む。これにより、テキストの位置情報が明示され、既存システムとの連携が容易となるとともに、データ化工程の効率化、処理速度およびスケーラビリティの向上が期待される。