秘密計算.jp#6 レポート

Created
2022/3/14 10:07
Tags
 
秘密計算プレイヤーが国内でも増えている。 NECは2022年1月、秘密計算ソリューションの提供開始を発表。データをサーバに分散して計算する「秘密分散方式(MPC方式)」と、インテルSGXを活用したハードウェアのセキュリティ技術を使用た「ハードウェア方式(TEE方式)」の2つの計算方式に対応していくという。 これを受け今回は、NECにて同サービス提供に尽力されているデジタルプラットフォーム事業部のシニアマネージャ横田治樹氏にご登壇いただいた。

スピーカー

日本電気株式会社(NEC) デジタルプラットフォーム事業部 シニアマネージャ 横田治樹 氏 ITの世界に入って以来、先進的な技術の企業システムへの現実的な適用や、エンタープライズアーキテクチャの考え方に基づくシステムの最適化に取り組んできた。近年は秘密計算やブロックチェーンといった技術を活用し、データの安全安心な活用を手伝うサービスの開発を行っている。
EAGLYS株式会社 代表取締役CEO 今林 広樹 氏 早稲田大学大学院在籍中、米国でデータサイエンティストとして活動したことを契機に「AI・データ利活用時代」におけるデータセキュリティの社会的重要性を実感する。帰国後、科学技術支援機構の戦略的創造研究促進事業(CREST)研究助手を務めながらプライバシー保護ビッグデータ解析の研究に没頭。2016年大学院在籍中にEAGLYS株式会社を創業。 企業理念である「あらゆるデータを安全に活用できる社会の実現」に向けてAI解析とデータセキュリティ事業を展開し、日夜エンタープライズ企業を中心とした顧客支援と社会実装に奔走している。
株式会社Acompany 代表取締役CTO 近藤岳晴 氏 名古屋工業大学在学中、IT系ベンチャーにて長期インターンを経験。複数のハッカソン入賞やビジネスコンテストに出場する中で、Acompany代表の高橋と出会う。 「テクノロジーと仕組み化で社会を良くしていきたい」という高橋の想いに共感し、第二創業期にCTOとして参画した。その後、秘密計算システム開発や、秘密鍵管理ソフトウェア、独自開発の秘密計算エンジン「QuickMPC」の開発を担当している。
 

NEC講演:「秘密計算の現在地とNECの取り組み」

NECの手がける「秘密計算」は今どこにいるのか

昨今、データを活用するシーンにおいて、データのプライバシー問題が非常に大きな問題となっています。例えば、企業が収集した個人情報を他企業に提供する問題があり、大規模な訴訟・制裁金に繋がるケースも発生しています。「データ(主権)は誰のもの?」という社会問題が提起されている状況です。 そういった中で数年前から、GDPR(一般データ保護規則)が企業にとって取り組まなければいけない課題になっています。GDPRはCookieを個人情報と定義しているので、一般的なブラウザで活用しづらくなり、マーケティング的な活用が難しくなっている状況です。個人情報を扱うデータ事業者にとっては早急な対応が迫られる状況でしょう。 また、お客様の生データに触れずに分析結果が得られるようなサービスを提供したいというニーズもあります。データ流通(企業をまたがったデータ活用)においては、「生の自社データをそのまま他社に提供するのは避けたい」「他社データと自社データの組み合わせで新たな知見を得たいが、自社の生データは出したくない」という課題が挙げられています。
このような中で、企業が持つ機密情報を活用し、新たなインサイトを得ようとする動き、そして強力にサポートする技術として、弊社としても秘密計算の期待が高まっています。
 

秘密計算とは

秘密計算について軽く紹介させていただきます。
 
データを安全に扱う中で、通信路やデータベースを暗号化して管理することは一般的に行われていることだと思います。ただし、データを計算・分析する際にはデータを復号しなければなりませんでした。しかし、秘密計算はデータの計算処理過程でも、常時暗号化した状態で処理することができます。秘密計算でできることとしては、先ほど紹介した課題を解決するような形になってきます。
 

秘密計算の種類

秘密計算技術には様々な方式があります。ここでは3つ、①秘密分散方式(MPC方式)、②準同型暗号方式、③TEE方式を紹介します。
秘密分散方式はMulti-Party Computationという名称で、データを3台以上のサーバに分散保存し、サーバ間で協調して暗号化したまま計算を実行できる技術となっています。これはCPU内の計算処理がサーバをまたがって行われるので、計算処理によりますが、処理スピードがそれなりに低下してしまう可能性があります。ただ、運用管理者を複数置くことが担保されていれば、アルゴリズム上は安全安心に計算処理できる方式です。 2つ目は準同型暗号方式です。これは秘密計算が可能な専用の暗号アルゴリズムを用いてデータを暗号化し、暗号化したまま計算ができる方式です。ピュアな意味では、最も秘密計算らしい方式だといえます。ただ、一般的な準同型暗号と同じように処理スピードが遅く、他の方式よりも遥かに処理スピードが遅いと認識しています。しかし、生体認証のように、ある程度のトランザクション量が見えていて、性能低下が実用レベルに収まるユースケースでの活用を、NECは検討しています。 そして3つ目のTEE方式です。これはTrusted Execution Environmentの略称で、ハードウェアを活用した秘密計算の総称として捉えています。CPUの出荷時にCPUに鍵を埋め込み、CPUの中でセキュアな空間を生成する技術です。そのため、管理者ですらデータ閲覧が不可能なセキュリティとなっています。また、処理スピードの低下も少なく、大規模なデータを高速で処理することができる技術です。その一方で、CPUベンダに依存した方式なので、「狭義な意味での秘密計算とは違うのではないか?」という指摘がされている状況です。実用レベルとしては安全性が高いと認識しており、機械学習に比較的対応しやすい方式だと考えています。
 

秘密計算が盛り上がる背景

このような秘密計算技術は海外では2、3年前から注目されてきましたが、最近はCookie規制の背景もあり、日本経済新聞を中心に日本のメディアでも取り上げられるようになりました。 また、IT系の調査会社のGartner(本社:アメリカ・コネチカット州)は、プライバシー技術としての秘密計算の3つの方式及び連合学習を、過度な期待から黎明期にあると評価しており、5〜10年以内に普及すると分析しています。 ただ、実際に秘密計算事業をやっている者としては「もう使えるよ!」と思っているのですが、この分析はあくまでも多くの企業に普及するという意味だと解釈しています。 プライバシー技術の概観で言うと、日本総合研究所の「プライバシー強化技術の概説と動向」が非常に良いレポートなので、プライバシー技術を概観するのであればオススメです。
 

秘密計算の市場はどうなっている?

秘密計算技術の市場規模についてですが、Everest Groupの調査によれば、秘密計算のグローバル市場規模は2024年に160〜180億ドル、2026年に520〜540億ドルになると推定されています。 現時点では北米が最大のマーケットとなる見通しですが、中国を除くAPACも成長市場になると認識しております。業種としては金融が最大で次にヘルスケア、公共、流通、製造に関しては成長領域となっていますが、これはNECが実際にクライアントと話の中でも一致しているので、良い線をいっているのではないかなと思います。 日本国内においては、NRIが日本におけるプライバシーテック市場規模予測を発表しています。プライバシーTechは秘密計算だけに限った話ではありませんが、2022年度に345億円、2027年度には1073億円と、年平均(CAGR)25%以上の高成長が見込まれています。

秘密計算はどのようなケースで利用が考えられるのか

NECとしては、5つのユースケースを想定しています。
1つ目のユースケースはデータ統合マーケティング、サプライチェーンの最適化、地方銀行における不正取引リスク分析AIの構築、新薬開発におけるデータ統合分析、そしてプラント装置のログ分析です。
データ統合マーケティングに関しては、企業を横断して顧客のデータを統合分析し、個人に対して最適なレコメンドを提供したり、顧客セグメントの分析をすることが可能となります。このようなマーケティングにおいて秘密計算の技術が発揮されるのですが、現在の個人情報保護法では秘密計算を利用していても第三者提供として扱われる状況ですので、秘密計算だからといって解決できるわけではありません。
 
また古い事例にはなりますが弊社では過去、大阪大学様とゲノム分析システムで秘密計算を活用する実証実験をさせていただきました。複数の医療機関からゲノム情報や診療情報を持ち寄って、それを統合して分析するシーンにおいて、秘密計算を用いても実用化できることを実証しました。中々クリティカルな事例ですので外に出せる事例が少ないのですが、また近いうちに何かしらの発表があるかと思います。
3月11日、NECは「連合学習技術と秘密計算技術を用いた創薬における予測モデル構築に関する実証実験を実施」とのリリースを出した。
 

NEC、データを暗号化したまま計算できる秘密計算ソリューションを提供開始」について

2022年1月、NEC秘密計算ソリューションを発表させていただきました。 MPC方式とTEE方式を弊社では採用しました。MPCの開発に関しては、ここ10年ぐらい研究開発を進めており、実用化に耐えうるレベルまで成長してきました。現在はソリューションの品質向上、様々なアルゴリズムに対する高速化を進めている状況です。MPCのプログラミングは難解でしたが、NECではPythonライクでプログラミングをすることを可能としました。 TEE方式に関しては、Intel社・Fortanix社(本社:アメリカ・カリフォルニア州)と連携して開発しております。Pythonで制作したアプリケーションを読解コンテナとして準備しておき、それがIntel SGXで動くような機能を提供しています。
ここで一つ、連合学習について触れておきたいと思います。例えば、複数の企業がデータを持ち寄って分析するシーンにおいて、暗号化してるからとはいえデータを明け渡すのは心理的なハードルが高いですよね。 連合学習は生データを出すのではなく、各企業の中で学習したAIモデルを持ち寄って、より高い精度のAIモデルを構築する技術です。例えばGoogleがスマホからの個人情報を見ることなくデータの学習をする際に、連合学習を活用していると聞いております。データそのものを出す必要がないため、個人情報や機密情報を活用しやすいメリットがあります。 一方で秘密計算に連合学習を組み合わせれば全て解決するかというとそうでもないんですね。データを出したくないとなれば、AIモデルそのものも出したくないとなります。そこでNECとしては「高秘匿連合学習」の開発に取り組んでいます。
これによりAIの生のモデルを出す必要がなくなりますので、他社にAIモデルが流出するという事件を防ぐことができるというわけです。

NECの今後の方向性

開発者側の目線としては、技術的には現在でも利用シーン次第で実用可能なレベルに到達していると認識しています。そういった中、今後拡大させていく中で、データ分析者・開発者向けの使いやすさの改善が課題として挙げられます。 そして一番大きな部分で言うと、技術的には”安全”でも、一般の生活者が”安心”と感じるとは限らないという部分が課題だと考えています。実際にクライアントと会話していく中で、こちらがどれだけ技術的に安全だと伝えても、それは誰も保証してくれないわけです。AIやカメラ映像分析に対する漠然とした不安と同様なものが秘密計算にあると考えられます。そのため、社会的受容性を高めるための認知度向上の活動は続ける必要があります。 現在はデータ社会推進協議会でワークショップが開催されていますし、弊社も参加させていただいている秘密計算研究会もあります。もちろん、今回開催されている秘密計算コンソーシアムも取り組みの1つだと認識しています。また「誰が責任を取るのか」という課題については、法制度や認証制度への働きかけが必要になるのかなと思います。
 

トークセッション

冒頭でいくつかの技術のご紹介がありましたが、各ユースケースごとに適しているという認識の手法はどれになるのでしょうか?

性能面で見るならハードウェアを利用した方式(TEE方式)の性能劣化が一番小さいので、高速処理を求めるなら唯一の選択になります。また、MPC方式に関しては、複数の運用者が必要になるのが実装上の課題ですが、技術的にはほとんど安全な方式だといえます。複数の企業が集まってデータ分析をする利用シーンにおいては、有力な選択肢でしょう。準同型暗号方式に関しては性能面の課題があるので、特殊なユースケースでの利用になると個人的には考えています。

AcompanyやEAGLYSはどれか1つの方式を深めている状況ですが、これに対して何か意見はありますか?

両社はおそらく、どちらの方式においても拡張されてるかと思います。NECの場合は試行錯誤しながら、探っている状態ですね。その辺の話はぜひお二方に伺いたいです。
 
 
Acompanyとしては、基本的にMPC方式にマッチしたユースケースでの利用が前提だと考えています。例えばディープラーニングの処理は時間かかってしまうので、MPCでも準同型暗号でも厳しいと思います。 しかし、そもそもどれだけの会社がディープラーニングを使っているのかという話ですね。よくよく現場のお話を聞いていると、通常の分析手法のようなライトな感じでビジネスをやっている方もいらっしゃるので、そういった方々がメインターゲットなのかなと思います。
準同型暗号方式に関しては、スピードにおける課題が一番大きい手法だと感じます。 この課題を解決するためにも、研究成果で1,000倍以上の高速化を進めることがすでにできて、リアルアプリケーションを想定した高速化も可能になってきました。競プロじゃないですけど、準同型暗号方式でどこまで処理速度を早くできるのかチャレンジしています。 また、連合学習についてもユースケースで適用しておりまして、医療・銀行などのモデル連携で使っていたりします。一番研究を進めているのは準同型暗号方式ですが、ユースケースに合わせて探りながら、ビジネス目的での研究も進めています。
 

「標準化」や「オープンソース」の可能性についてはどのように考えていますか?

MPC方式や準同型暗号方式に関してはアルゴリズムそのものが命なので、標準化するのは中々ハードルが高いかなと思います。 TEE方式の場合、Intel SGXを活用しやすくするライブラリが出てきている状況です。ただ現時点ではそこまで使いやすいものになっていないので、NECが改良を加えることでソリューションを提供しています。 やはりTEE方式は海外でも標準化が取り組まれているので、どんどん簡単なものになっていくのかなと思います。
おそらくコアな部分についてはどの企業も公開しないのかなと思います。どちらかと言うと、そういったものを「使う」部分についてがオープンソース化されたり、APIが標準化されるのではないかと考えています。 私たちとしてもコアのエンジンの部分はもちろんありますし、クライアントライブラリも提供していたりしていて、これについては一部公開していくという議論が社内ではされている状況です。
準同型暗号方式について補足すると、やはり重要なコアな部分はオープンにはできていない状況です。 ただ準同型暗号方式に関してはオープンソース化が進んでいる状況で、国のプロジェクトで予算が出ている場合が多く、こう言った場合にオープンになっている傾向があります。 例えばIBM、Microsoft、Googleがライブラリを出していて、世の中に10個ぐらいのライブラリが出てきています。そしてそれぞれのライブラリが特徴的で、使いやすさを重視したライブラリや、機能拡張に重きを置いたライブラリもあります。こんな感じで少しずつオープンソース化が進んでいる状況です。
プレゼンの最後の課題としても、データ分析者の使いやすさを挙げさせていただきました。 データ分析者というのは世の中のオープンソースのツールを試してみて、それが良かったら導入するというスタイルです。そのため、「簡単に試せないとハードルが高くなっちゃうよね」という声をよく聞きます。やはり敷居を下げていかないと、使いやすいというところに繋がらないのかなと、課題として認識しているところです。 なのでコアの部分を提供するのは難しいですが、APIなどを活用して使いやすさを追求していく取り組みが重要なのかなと思います。
 

なぜ秘密計算に注目されたのでしょうか?

創業の背景でもあるんですが、アメリカでデータサイエンティストとして勤務していた時に、社内でデータ活用の提案をしたことがありました。そしたらデータを出すために半年はかかると言われ、挙句の果てにはデータを持っている会社に転職してくれと言われました。そこで「なんでデータじゃなくて人が動かないといけないんだ!」と思いまして…。それで「AIの時代がくると言われているけどその前にプライバシーやセキュリティの担保が大前提にならなければいけない」「Googleがオープンデータにアクセスできるようにしたように、プライベートなデータに簡単にアクセスできるようになるべき」と強く感じました。そこで色々と探っていく中で、準同型暗号方式の初期の論文に出会って、そこから秘密計算にのめり込んだという感じですね。
Acompanyの創業初期はブロックチェーン事業に取り組んでいました。今はWeb3.0やNFT(非代替性トークン)が盛り上がっていますがこれはパブリックなブロックチェーンで、Acompanyが取り組んでいたのはプライベートなブロックチェーンでした。 その中でクライアントと話をしていても、「データ連携をしたいのはわかるけどブロックチェーンに生データを提供するわけにはいかない」という声を多く頂きました。そういった中で色々と探るうちに、秘密計算について好感触を受けまして、その中で「ブロックチェーン×秘密計算」ではなくて、秘密計算にコミットしていくべきなのではないかと感じました。それからは秘密計算を軸にプライバシーテックを中心にリソースを注いでいる状況になりました。
DXにおいて一番重要になるのが「データの活用」になると思います。その中で、データを持ち寄って分析したいのに、プライバシーの影響で誰もデータを出したがらないという状況です。やはり、データを出せないという課題をなんとか突破しないと、データを活用することができないのです。その中で秘密計算に注目するようになりました。
 

先ほどのプレゼンにもあった通り、秘密計算はやはり一般の方々には腑に落ちない技術のように思えます。一般のお客様に秘密計算を理解できるために、何か努力していることはありますか。

やはり「誰が保証してくれるのか」という話になってしまいます。何かしらの第三者認証機関が必要だったり、秘密技術研究会の方では何かしらのガイドラインが出せないかなと考えています。 それに対してNECがガイドラインに準拠する姿勢を開示して、なんとか安心感を高められないかなと。ただ、ガイドライン自体が難しい内容なので、これを一般の方々に理解してもらうのは無理だろうなと思います。まさに秘密計算コンソーシアムの頑張りどころなんじゃないかなと思います(笑)。
ちょっと補足すると、一般の消費者全員が秘密計算を理解する必要はないと思っています。 例えばスマートフォンとかは広く普及しているからOKっていう感じでしょう。でもその後ろにある凄い技術を理解している人はほとんどいないと思います。そう考えると、ある程度の実益と、実態としてのセキュアさのバランスが取れていれば、社会に受け入れられるのではないかなと考えています。そしてAcompanyがやっていることは会社やプロジェクトの後ろ側で動くシステム開発なので、一般の消費者に理解してもらう必要はなく、逆に事業者の方々にはガイドラインなどをしっかり説明する必要があります。なので大体は横田さんと同じ考えですね。
秘密計算を普及させていくという観点で見ると、AIの発展の歴史を振り返った時に、品質・保証・性能などをベンダーは完全に約束していませんでした。使い方やシステム要件によって全然違ってくるからです。それでセキュリティの担保の仕方も同じように、他の技術でカバーできることもあるし、考え方次第で色々と設計できるわけです。結果的にバリューが提供できるのであれば、積極的にチャレンジしていくべきというのも1つの考え方なのかなと思います。それに対して法整備やガイドラインの整備も追い付いてくるのではないでしょうか。過度な技術への恐れよりも、まずはどのようなバリューが生み出せるのかをしっかり考え、フレキシブルに対応するべきでだと思います。 補足的に説明すると、AIもロジックベースでは数百倍計算速度が遅くなってるんです。ディープラーニングも従来の手法よりも計算速度が遅くなっています。ちょっと楽観的ですけど、秘密計算の何百倍何千倍という話も、リッチコンピューティングができるようになる頃には大した話にしかならないんじゃないかなと思います。
一般の消費者からしたら、利便性が上回ればあんまり気にしないのでしょうね。実際、スマホから情報が取られているわけですけど、気にしない人の方が多いですし(笑)。
 

プレゼンで紹介されたユースケース以外で、今後想定されるユースケースはどのようなものがあるのでしょうか。

特定の業界・使い方で、ある程度市場のパイが大きく、かつ広がりもありそうで、Acompanyにマッチしている。かなり難しいんですけど、このような条件が見つかりさえすれば、それに合わせたソリューションを提供していく形になるかなと思います。ユースケースとしてはある程度広く見ているという感じです。
海外の事例を見ていると、金融の銀行間のデータ連携、ヘルスケアにおけるデータ統合分析が多い印象です。 あとは、物性における化合物評価データ、実験評価データです。こういったものは製薬に限らず、マテリアルズ・インフォマティクス領域において活用されるでしょう。例えば各社が非競争の状況で同じような実験をしている場合に、データを活用したいニーズが生まれそうです。 その他、相対取引が発生している領域については、秘密計算が活きるのではないかなと思います。あとはパーソナルデータの領域も、Cookieの次に秘密計算が来るのではないかなと考えています。それ以外にも様々な領域で可能性があるでしょうね。
スマートシティーとか、ドメインをまたがったデータの連携は議論されていますね。それと「お客様のデータを預かって分析して何かしらの価値を提供したい」というのは、様々な業界から多くお問い合わせいただいています。会計事務所のように「データの中身を見ないまま分析したい」というシーンもあり、これはデータ統合のシーンに比べても、1社でできるので敷居が低くなっているのではないかなと思います。
 

さいごに皆さんから一言お願いします!

Acompanyは基本的にプライバシーテック領域で事業を進めています。ということで、個人情報を保護しつつもデータ活用社会をどんどん前に進めるようにコミットしていきます。そしてこれは日本に限った話ではなく、グローバルにおけるプライバシーテック企業のNo.1になることにコミットしているので、これからも僕たちの活躍に乞うご期待ということで!
秘密計算技術を武器にしつつも、やりたいことはデータ連携・活用の世界にベットしています。例えば医療においては、データ連携の遅さが故に命を落としてしまう事例もあります。そういった中で、データがしっかり連携できるようになれば命を守ることができますし、新薬開発に活かせることも多いはずです。そしてやはり、データ連携が上手くいかない理由はプライバシー問題にあり、これが命を落とすことに繋がってしまうわけです。もちろん命に関わるヘルスケアに限らず、様々な業界でデータを集めれば色々なことができるでしょう。 これは、「ケータイで十分じゃん」というところからスマホが普及していったように、データ連携も不可逆な未来だと思うんです。そういった世界を作るためにデータ連携にベットしていますし、その中で秘密計算関連の技術が重要になってくると思います。その世界ができるだけ早く実現できるように、社会実装を進めていきたいですし、技術に固執することなくソリューションを提供できればと思います。
NECとしてはトラストにフォーカスしています。プライバシー領域に限らず、IoTから発せられるデータも含めて、企業の機密情報を安全に活用できるようにしたいです。引き続き、トラストデータ基盤と言う形で秘密計算を1つの技術として活用していきたいなと思っています。
 

秘密計算コンソーシアムへの参加申し込みはこちら


表示されない場合はこちら

運営会社


主催:株式会社Acompany(acompany.tech
協賛共同運営:EAGLYS株式会社(eaglys.co.jp